亚洲欧美精品中文三区|亚洲精品美女AV在线|性生潮久久久不久久久久|免费 无码 国产在现看|亚洲欧美国产精品专区久久|少妇的丰满3中文字幕免费|欧美成人怡红院在线观看视频|亚洲国产中文精品看片在线观看

AI B端如何落地?中金:AI Answer是最優(yōu)先模式 資訊

本文定義AI Answer 為結(jié)合LLM和IR技術(shù)的智能信息互動(dòng)應(yīng)用,信息源可為閉源知識(shí)庫(kù)、行業(yè)圖譜、或是互聯(lián)網(wǎng)開(kāi)放信息。以C端檢索范式演進(jìn)為鑒,我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地,AI賦能內(nèi)部知識(shí)庫(kù)重建、構(gòu)建流量入口,有望帶來(lái)諸多價(jià)值增量。

摘要

以C端搜索引擎范式演進(jìn)為鑒,我們認(rèn)為B端AI Answer能夠帶來(lái)多元價(jià)值增量:


(資料圖)

1)數(shù)據(jù)價(jià)值挖掘:企業(yè)端自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測(cè)分析;用戶(hù)端自動(dòng)分配數(shù)據(jù)訪問(wèn)權(quán)限,并推薦個(gè)性化的檢索路徑與知識(shí)生成。

2)知識(shí)資產(chǎn)沉淀:自動(dòng)生成信息分類(lèi)標(biāo)簽,降低人工歸檔成本。同時(shí)用戶(hù)行為可作為人類(lèi)反饋,訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對(duì)齊應(yīng)用領(lǐng)域的需求和偏好。

3)搜索效率提升:自動(dòng)剔除重復(fù)或冗余的信息,整合高質(zhì)量知識(shí)資產(chǎn)。主動(dòng)提供建議和關(guān)聯(lián)資料,促進(jìn)信息獲取的及時(shí)性。

供給端技術(shù)平權(quán)疊加需求端實(shí)現(xiàn)內(nèi)外雙向賦能,我們認(rèn)為AI Answer有望成為B端應(yīng)用中先行落地場(chǎng)景。

數(shù)據(jù)層面,AI Answer在搜索過(guò)程中融入垂域要素,更好的理解用戶(hù)意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果;模型層面,技術(shù)平權(quán)背景下可以通過(guò)使用開(kāi)源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。同時(shí)在企業(yè)需求端,AI Answer助力企業(yè)知識(shí)圖譜重構(gòu),實(shí)現(xiàn)后端流程運(yùn)維及前端業(yè)務(wù)交互的內(nèi)外雙向賦能。

AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫(kù)。LangChain框架通過(guò)各種模塊化組件提供了全方位全流程的通用開(kāi)發(fā)服務(wù),可被用于整合和管理大模型的輸出。智譜ChatGLM等大模型帶來(lái)大模型普惠,助力B端部署AI Answer。向量數(shù)據(jù)庫(kù)幫助拓展LLM的時(shí)空邊界,賦能企業(yè)打造基于專(zhuān)屬知識(shí)庫(kù)的AI Answer應(yīng)用。

企業(yè)內(nèi)部知識(shí)庫(kù)有望重構(gòu),管理軟件領(lǐng)域OA有望先行落地AI Answer。我們觀察到第四范式、星環(huán)科技、云知聲等公司已推出企業(yè)知識(shí)管理平臺(tái)產(chǎn)品,幫助客戶(hù)重構(gòu)企業(yè)知識(shí)庫(kù);釘釘、WPS、印象筆記等產(chǎn)品助力個(gè)人和中小組織實(shí)現(xiàn)知識(shí)梳理。在管理軟件領(lǐng)域,我們認(rèn)為泛微、致遠(yuǎn)等OA廠商有望先行實(shí)現(xiàn)AI Answer和管理流程結(jié)合,落地智能協(xié)同應(yīng)用。

正文

什么是AI Answer?

我們認(rèn)為, AI Answer 為結(jié)合大語(yǔ)言模型(LLM)和信息檢索(IR,Information retrieval)技術(shù)的智能信息互動(dòng)應(yīng)用。在這個(gè)應(yīng)用中,LLM 負(fù)責(zé)理解語(yǔ)境并構(gòu)建查詢(xún),而 IR 技術(shù)則依據(jù)這些查詢(xún)獲取相關(guān)數(shù)據(jù)或文檔。檢索到的結(jié)果最終由LLM 生成回應(yīng),從而形成一個(gè)以模型外部信息為支撐的動(dòng)態(tài)對(duì)話(huà)過(guò)程。

AI Answer檢索的信息可以是企業(yè)閉源知識(shí)庫(kù)、行業(yè)知識(shí)圖譜、或是互聯(lián)網(wǎng)開(kāi)放信息。相較于傳統(tǒng)知識(shí)檢索應(yīng)用,AI Answer在交互模式、泛化能力及精確度上均有能力躍遷,我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地,價(jià)值增量包括:

??數(shù)據(jù)價(jià)值挖掘:企業(yè)端根據(jù)企業(yè)內(nèi)部數(shù)據(jù)與已有知識(shí),自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測(cè)分析,提高企業(yè)運(yùn)維效率與知識(shí)創(chuàng)新動(dòng)能。同時(shí)用戶(hù)端AI Answer通過(guò)分析用戶(hù)的角色、需求、歷史查詢(xún)記錄,自動(dòng)分配合適的數(shù)據(jù)訪問(wèn)權(quán)限,推薦個(gè)性化檢索路徑與知識(shí)生成。

??知識(shí)資產(chǎn)沉淀:自動(dòng)為線上知識(shí)文檔生成分類(lèi)標(biāo)簽,降低人工信息整理成本。根據(jù)用戶(hù)使用應(yīng)用的情況跟蹤企業(yè)知識(shí)庫(kù)變化,自動(dòng)更新生成內(nèi)容,確保信息準(zhǔn)確性與實(shí)時(shí)。同時(shí)用戶(hù)使用AI Answer產(chǎn)生的行為可作為人類(lèi)反饋,訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對(duì)齊應(yīng)用領(lǐng)域的需求和偏好。

??搜索效率提升:通過(guò)精準(zhǔn)分析用戶(hù)需求,自動(dòng)剔除重復(fù)或冗余的信息,整合高質(zhì)量知識(shí)資產(chǎn)。同時(shí)AI Answer應(yīng)用可作為虛擬助手,在平臺(tái)上同步協(xié)助員工解決問(wèn)題、主動(dòng)提供建議和關(guān)聯(lián)資料,促進(jìn)信息獲取的及時(shí)性。

以C端檢索范式演進(jìn)為鑒,我們認(rèn)為B端 AI賦能內(nèi)部知識(shí)庫(kù)重建有望帶來(lái)諸多價(jià)值增量,滿(mǎn)足企業(yè)端提效需求。微軟2月8日發(fā)布基于OpenAI大模型的搜索引擎新版Bing(中文名“必應(yīng)”)[1],首次推出嵌入搜索引擎的“問(wèn)答式搜索”功能,搜索界面的問(wèn)答機(jī)器人可以與用戶(hù)聊天、協(xié)助撰寫(xiě)文本、匯總?cè)W(wǎng)絡(luò)信息并以對(duì)話(huà)方式響應(yīng)查詢(xún)。

StatCounter數(shù)據(jù)顯示谷歌的搜索引擎幾乎占據(jù)了90%的市場(chǎng)份額,我們認(rèn)為Bing憑借智能化檢索有望不斷突破市場(chǎng)份額。據(jù) Data.AI 的圖示區(qū)間數(shù)據(jù),在嵌入了OpenAI大模型能力后,Bing的APP日均下載量在全球范圍內(nèi)增長(zhǎng)了823%,同期對(duì)比谷歌搜索應(yīng)用的下載量?jī)H增長(zhǎng)3%。

圖表:New Bing推出后APP下載量較Google逐步收斂

資料來(lái)源:Data.ai,中金公司研究部

以Glean為例,大模型賦能的AI Answer重構(gòu)企業(yè)管理軟件。AI技術(shù)在企業(yè)端的應(yīng)用場(chǎng)景廣闊,其中知識(shí)內(nèi)容檢索場(chǎng)景知識(shí)密度要求較高,需求明確且技術(shù)路徑相對(duì)成熟。Glean通過(guò)打通跨應(yīng)用數(shù)據(jù)打造駕于SaaS層之上的“聚合層”,成為企業(yè)應(yīng)用場(chǎng)景的入口級(jí)產(chǎn)品。Glean可以結(jié)合企業(yè)內(nèi)部知識(shí)圖譜、以及上百家第三方SaaS應(yīng)用中進(jìn)行信息檢索,為每位用戶(hù)的自然語(yǔ)言查詢(xún)生成定制化的結(jié)果,覆蓋信息查找、復(fù)雜功能執(zhí)行等場(chǎng)景。

目前,Glean只面向企業(yè)客戶(hù)提供服務(wù),公司推出兩種定價(jià)方案,1)按席位收費(fèi),每月不超過(guò)100美元;2)根據(jù)企業(yè)的需求定制價(jià)格,目前商業(yè)模式以第二種為主。此外,在服務(wù)模式上,Glean 還提供高水平的安全性和靈活性,可以選擇在本地或云端部署,并且對(duì)用戶(hù)數(shù)據(jù)進(jìn)行加密和權(quán)限層級(jí)管理。

圖表:知識(shí)內(nèi)容檢索場(chǎng)景信息密度要求較高而靈活性要求較低,當(dāng)前模型已能夠滿(mǎn)足

資料來(lái)源:中金公司研究部

圖表:Glean結(jié)合企業(yè)文檔及第三方應(yīng)用進(jìn)行檢索

資料來(lái)源:Glean官網(wǎng),中金公司研究部

AI Answer有望成為B端最快落地的模式

供給端,模型層技術(shù)趨于平權(quán),企業(yè)具備閉源數(shù)據(jù)卡位,商業(yè)落地可得性較高。數(shù)據(jù)層面,與其他B端AI應(yīng)用相比集成了垂直行業(yè)知識(shí)的AI Answer應(yīng)用更易實(shí)施落地。

通用人工智能積累了強(qiáng)大的通識(shí)能力,但由于其廣泛而非專(zhuān)精的數(shù)據(jù)結(jié)構(gòu),其在專(zhuān)業(yè)領(lǐng)域的檢索實(shí)效性及性?xún)r(jià)比尚有欠缺。通過(guò)擬合垂直領(lǐng)域的數(shù)據(jù),AI Answer能理解行業(yè)內(nèi)的專(zhuān)業(yè)詞匯、概念和信息,從而在搜索過(guò)程中融入垂域要素,更好的理解用戶(hù)意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果。

模型層面,B端企業(yè)AI Answer場(chǎng)景對(duì)于算法模型在知識(shí)涌現(xiàn)、數(shù)理分析等高階能力需求較弱,對(duì)檢索能力和文本生成能力需求較強(qiáng),技術(shù)平權(quán)背景下可以通過(guò)使用LLAMA、Bloom、ChatGLM等開(kāi)源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。

例如,企業(yè)可以使用LangChain將數(shù)據(jù)庫(kù)文檔加載并索引到本地知識(shí)庫(kù)中,通過(guò)嵌入模型對(duì)文本進(jìn)行矢量化,助力快速檢索相關(guān)段落,再通過(guò)ChatGLM協(xié)助用戶(hù)基于檢索到的信息和用戶(hù)會(huì)話(huà)歷史生成精準(zhǔn)的答案。

圖表:垂域模型調(diào)優(yōu)處在監(jiān)督式微調(diào)階段,增量算力需求較少

資料來(lái)源:2023 年微軟Build大會(huì),中金公司研究部

需求端,AI Answer助力企業(yè)知識(shí)圖譜重構(gòu),實(shí)現(xiàn)內(nèi)外雙向賦能。

1)企業(yè)需要快速準(zhǔn)確地獲取和利用特定領(lǐng)域的知識(shí)和信息,以提高決策效率和質(zhì)量。傳統(tǒng)的搜索引擎往往不能滿(mǎn)足企業(yè)的個(gè)性化需求,而需要一個(gè)能夠理解企業(yè)商業(yè)模式下特定語(yǔ)境和邏輯的智能問(wèn)答系統(tǒng)。

2)企業(yè)需要對(duì)自己擁有或者能夠獲取的數(shù)據(jù)和知識(shí)進(jìn)行有效地組織和管理,以提高數(shù)據(jù)質(zhì)量和可用性。傳統(tǒng)的知識(shí)庫(kù)構(gòu)建和維護(hù)往往需要大量的人力和時(shí)間成本,AI Answer能夠助力企業(yè)自動(dòng)化地從各種數(shù)據(jù)源中抽取、整合、更新和驗(yàn)證知識(shí)。

3)企業(yè)需要與客戶(hù)、合作伙伴、員工等各方有效地溝通和協(xié)作,傳統(tǒng)的人工客服或者機(jī)器人往往不能滿(mǎn)足用戶(hù)的多樣化和復(fù)雜化的問(wèn)題,AI Answer經(jīng)過(guò)細(xì)化調(diào)優(yōu),能夠靈活地適應(yīng)不同場(chǎng)景和需求。

圖表:AI Answer助力企業(yè)決策從被動(dòng)響應(yīng)轉(zhuǎn)向主動(dòng)服務(wù)

資料來(lái)源:中國(guó)信通院《企業(yè)數(shù)字化轉(zhuǎn)型技術(shù)發(fā)展趨勢(shì)研究報(bào)告(2023)》,中金公司研究部

技術(shù)基礎(chǔ):AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫(kù)

LangChain:針對(duì)大模型提供通用開(kāi)發(fā)框架

LangChain是一個(gè)封裝了各種大語(yǔ)言模型應(yīng)用開(kāi)發(fā)工具的開(kāi)源Python框架,提供了一套開(kāi)發(fā)大模型的工具、組件和接口。LangChain幫助開(kāi)發(fā)者將大模型和其他知識(shí)源/數(shù)據(jù)庫(kù)結(jié)合起來(lái),以創(chuàng)建功能更強(qiáng)大的應(yīng)用程序,包括基于知識(shí)庫(kù)問(wèn)答、聊天機(jī)器人、智能代理等。該開(kāi)源Python可被用于整合和管理大模型(如ChatGLM)的輸出,提供了標(biāo)準(zhǔn)的模塊化組件、集成了不同的大語(yǔ)言模型并將其進(jìn)行整合,并將它們連接到各種外部數(shù)據(jù)源和API。

通過(guò)各種模塊化組件,LangChain框架提供了全方位全流程的優(yōu)化服務(wù)。傳統(tǒng)的大模型無(wú)法聯(lián)網(wǎng)、無(wú)法調(diào)用其他API、無(wú)法訪問(wèn)本地文件、對(duì)Prompt要求高、生成能力強(qiáng)但內(nèi)容準(zhǔn)確度無(wú)法保證,而LangChain則提供了相應(yīng)模塊,旨在解決這一系列問(wèn)題。

? Prompt:使用LLM需要用戶(hù)輸入需求,LangChain將用戶(hù)的輸入傳遞給Prompt Template。一個(gè)Prompt通常由Instructions、Context、Input Data和Output Indicator組成,但一般用戶(hù)并不會(huì)完整地輸入每個(gè)部分,使用LangChain的Prompt Template可以很好地根據(jù)用戶(hù)輸入定義各個(gè)部分,同時(shí)將Input Data留作動(dòng)態(tài)輸入項(xiàng)。

? Chain:利用該模塊,LangChain可以不單單利用本身的LLM和Prompt Template,而是將原模型鏈接到其他信息源或API,將模塊組合成完整的工作流,拓展LLM應(yīng)用邊界。

圖表:Prompt Template對(duì)輸入改寫(xiě)

資料來(lái)源:海外獨(dú)角獸,中金公司研究部

圖表:連接多個(gè)Prompt Template及搜索、數(shù)據(jù)庫(kù)

資料來(lái)源:海外獨(dú)角獸,中金公司研究部

? Agent:如果LLM僅利用Chain模塊,那么模型將按照預(yù)設(shè)的接口和順序執(zhí)行工作,而Agent模組可以利用LLM分析應(yīng)該使用哪個(gè)API或者搜索引擎、數(shù)據(jù)源等工具鏈,并自行決定調(diào)用和實(shí)現(xiàn)的順序。比如,ChatGPT有很強(qiáng)的生成回答能力,但不夠準(zhǔn)確;Wolfram Alpha有很準(zhǔn)確的知識(shí)儲(chǔ)備,但語(yǔ)義理解能力較差,Agent可以針對(duì)ChatGPT的問(wèn)題,自行判斷是否需要調(diào)用Wolfram Alpha,并生成回答。

? Memory:默認(rèn)情況下,Chain和Agent是無(wú)狀態(tài)(stateless)的[2],這意味著它們獨(dú)立地處理每個(gè)傳入的Query(就像底層的LLM和聊天模型),不具備上文記憶的能力。為了記住先前的交互,LangChain通過(guò)每次Prompt加入上文內(nèi)容和記錄的tricks,在不同的Query間傳遞上文,在前ChatGPT時(shí)代就實(shí)現(xiàn)了記憶的功能。

圖表:Agent判斷使用工具流程

資料來(lái)源:海外獨(dú)角獸,中金公司研究部

圖表:Entity Memory提供長(zhǎng)期上下文記憶能力

資料來(lái)源:海外獨(dú)角獸,中金公司研究部

案例:YouTube博主Data Independent通過(guò)LangChain構(gòu)建了一個(gè)PDF問(wèn)答機(jī)器人。

LangChain憑借PDF Loader的幫助加載上傳的PDF,并使用Splitter分割語(yǔ)句向量,同時(shí)盡可能保留原始語(yǔ)義,調(diào)用OpenAI的Embedding引擎進(jìn)行長(zhǎng)向量變換并存儲(chǔ)在本地或者Pinecone云向量數(shù)據(jù)庫(kù),最后用戶(hù)只需調(diào)用LangChain的QA Chain就可以針對(duì)上傳的PDF進(jìn)行問(wèn)答。整個(gè)過(guò)程中,LangChain相當(dāng)于對(duì)每個(gè)環(huán)節(jié)集成,并對(duì)整體的交互進(jìn)行封裝。

LangChain受到廣泛關(guān)注和使用,獲得種子輪融資,但商業(yè)化任重道遠(yuǎn)。2023年4月6日,LangChain宣布獲得由Benchmark領(lǐng)投的1,000萬(wàn)美元種子輪融資。

截至2023年4月19日,LangChain在Github上已有2.8萬(wàn)Stars、478位貢獻(xiàn)者,被2,400多名用戶(hù)使用。但究其本質(zhì),LangChain是“整合其他開(kāi)源庫(kù)的開(kāi)源庫(kù)”,提供開(kāi)發(fā)LLM的框架,以此節(jié)省開(kāi)發(fā)人員編寫(xiě)代碼的時(shí)間。而由于開(kāi)源加之經(jīng)濟(jì)成本不穩(wěn)定、對(duì)輸出沒(méi)有評(píng)估步驟,客戶(hù)目前更偏好直接的模型交付,LangChain商業(yè)化仍有待探索。

LangFlow為L(zhǎng)angChain開(kāi)源且無(wú)代碼的可視化開(kāi)發(fā)界面,用戶(hù)可以通過(guò)拖拽模塊和自然語(yǔ)言交互的模式構(gòu)建應(yīng)用原型。

Langchain將制作AI應(yīng)用的工具能力模板化和標(biāo)準(zhǔn)化,而LangFlow 提供了一系列可供選擇的LangChain組件,包括 LLMs、提示模板、代理和鏈等等,用戶(hù)可以通過(guò)鏈接節(jié)點(diǎn)的方式輕松構(gòu)建和測(cè)試產(chǎn)品原型,例如聊天機(jī)器人和文本解析助手。LangFlow基于Python開(kāi)發(fā),同類(lèi)產(chǎn)品還有基于JavaScript開(kāi)發(fā)的Flowise。

圖表:LangFlow支持模塊拖放和聊天框構(gòu)建應(yīng)用原型

資料來(lái)源:LangFlow官網(wǎng),中金公司研究部

圖表:LangFlow通過(guò)簡(jiǎn)單鏈接四個(gè)模塊即可構(gòu)建具備記憶且可自定義模板的聊天機(jī)器人

資料來(lái)源:LangFlow官網(wǎng),中金公司研究部

大模型:開(kāi)源模型百花齊放,助力B端高效部署

ChatGLM等開(kāi)源模型帶來(lái)大模型普惠,助力B端部署AI Answer。

企業(yè)可以通過(guò)Langchain平臺(tái)調(diào)用部分開(kāi)源的自然語(yǔ)言處理模型,例如ChatGLM、Bloom與LLAMA模型等,這些開(kāi)源模型為企業(yè)級(jí)AI應(yīng)用的推廣奠定了基礎(chǔ)。其中,ChatGLM是可被集成到LangChain的一款重要開(kāi)源模型,能夠通過(guò)提供自然語(yǔ)言處理能力為企業(yè)打造高效的AI Answer應(yīng)用。

其研發(fā)企業(yè)智譜AI成立于2019年,源自清華大學(xué)計(jì)算機(jī)系知識(shí)工程實(shí)驗(yàn)室。2022年,公司合作研發(fā)了支持中英雙語(yǔ)的千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,并搭建了高精度通用知識(shí)圖譜。

圖表:智譜AI產(chǎn)品矩陣

資料來(lái)源:智譜AI官網(wǎng),中金公司研究部

GLM-130B在多個(gè)公開(kāi)評(píng)測(cè)榜單上超越了GPT-3的性能,支持單張消費(fèi)級(jí)推理并且具備跨平臺(tái)跨芯片的快速推理能力。基于GLM-130B模型,公司又開(kāi)發(fā)了6B參數(shù)規(guī)模的雙語(yǔ)對(duì)話(huà)模型ChatGLM,可以處理多種自然語(yǔ)言任務(wù)(如對(duì)話(huà)聊天和智能問(wèn)答),并且支持在單張消費(fèi)級(jí)顯卡上推理使用。目前,GLM-130B和ChatGLM均開(kāi)源,為企業(yè)端客戶(hù)提供了更低門(mén)檻和更高安全性的應(yīng)用方案。

圖表:ChatGLM-130B及ChatGLM-6B于中文大模型匿名對(duì)戰(zhàn)平臺(tái)SuperCLUE-瑯琊榜排名均位于前五

注:統(tǒng)計(jì)截至2023年5月29日
資料來(lái)源:SuperCLUE-瑯琊榜官網(wǎng),中金公司研究部

圖表:Leaderboard非英文問(wèn)題測(cè)試中,ChatGLM排名第7,以較小參數(shù)達(dá)到高性能

注:統(tǒng)計(jì)截至2023年5月25日
資料來(lái)源:lmsys arena Leaderboard,中金公司研究部

向量數(shù)據(jù)庫(kù):構(gòu)建企業(yè)知識(shí)庫(kù)的必備存儲(chǔ)“大腦”

向量是多模數(shù)據(jù)的壓縮,是AI學(xué)習(xí)的通用數(shù)據(jù)形式。非結(jié)構(gòu)化數(shù)據(jù)通常需要向量化之后才能被AI模型所理解,向量嵌入(vector embedding)是自然語(yǔ)言處理和深度學(xué)習(xí)中常用的數(shù)據(jù)預(yù)處理技術(shù),即將非數(shù)值如文本、圖片、視頻等源數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量。

圖表:通過(guò)嵌入模型將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量

資料來(lái)源:Pinecone,中金公司研究部

向量搜索是一種模糊匹配,區(qū)別于傳統(tǒng)的關(guān)鍵詞索引精準(zhǔn)查詢(xún)。向量搜索一般采用K近鄰法或近似臨近算法,計(jì)算目標(biāo)對(duì)象與數(shù)據(jù)庫(kù)中向量嵌入的距離以表示兩者的相似度,排序后返回最為相似的結(jié)果。區(qū)別于傳統(tǒng)數(shù)據(jù)庫(kù)的精確索引,向量搜索是一種模糊匹配,輸出的是概率上的最近似答案。

圖表:向量搜索以向量嵌入的距離表征相似度,是一種模糊匹配

資料來(lái)源:Google Developers,中金公司研究部

向量數(shù)據(jù)庫(kù)是專(zhuān)門(mén)用來(lái)存儲(chǔ)和查詢(xún)向量的數(shù)據(jù)庫(kù)。向量數(shù)據(jù)庫(kù)即原生面向向量設(shè)計(jì)的、專(zhuān)門(mén)用于存儲(chǔ)、管理、查詢(xún)、檢索向量的數(shù)據(jù)庫(kù)。向量化技術(shù)已較為成熟,也出現(xiàn)了不少開(kāi)源的向量搜索算法庫(kù)(如Facebook的FAISS),但向量數(shù)據(jù)庫(kù)提供一種開(kāi)箱即用的解決方案,在數(shù)據(jù)持久化、實(shí)時(shí)增刪改、分布式計(jì)算、容災(zāi)備份等方面提供更完整的支持,更適合企業(yè)級(jí)應(yīng)用。

向量數(shù)據(jù)庫(kù)幫助拓展LLM時(shí)空邊界,是企業(yè)知識(shí)庫(kù)的必備存儲(chǔ)“大腦”。目前向量數(shù)據(jù)庫(kù)的核心應(yīng)用場(chǎng)景之一便是拓展LLM的時(shí)空邊界,賦能企業(yè)打造基于專(zhuān)屬知識(shí)庫(kù)的AI Answer應(yīng)用。

時(shí)間維度上,初始的LLM是基于歷史的通用語(yǔ)料庫(kù)訓(xùn)練的,而實(shí)際企業(yè)應(yīng)用場(chǎng)景中需要補(bǔ)充實(shí)時(shí)的、專(zhuān)業(yè)性的知識(shí);空間維度上,LLM的輸入token存在長(zhǎng)度限制,因此無(wú)法直接將企業(yè)知識(shí)庫(kù)的全量信息作為prompt一次性輸入,僅需最相關(guān)的部分。

向量數(shù)據(jù)庫(kù)和LLM的具體交互過(guò)程為:用戶(hù)首先將企業(yè)知識(shí)庫(kù)的全量信息通過(guò)嵌入模型轉(zhuǎn)化為向量后儲(chǔ)存在向量數(shù)據(jù)庫(kù)中,用戶(hù)輸入prompt時(shí),先將其同樣向量化,并在向量數(shù)據(jù)庫(kù)中檢索最為相關(guān)的內(nèi)容,再將檢索到的相關(guān)信息和初始prompt一起輸入給LLM模型,以得到最終返回結(jié)果。

圖表:向量數(shù)據(jù)庫(kù)和LLM的具體交互過(guò)程

資料來(lái)源:Pinecone官網(wǎng),星環(huán)科技微信公眾號(hào),中金公司研究部

案例:星環(huán)科技Hippo向量數(shù)據(jù)庫(kù)具備多種企業(yè)級(jí)特性。目前向量數(shù)據(jù)庫(kù)市場(chǎng)參與者以海外初創(chuàng)型公司的開(kāi)源產(chǎn)品為主,近期一級(jí)市場(chǎng)投融資熱度較高。

國(guó)內(nèi)大數(shù)據(jù)基礎(chǔ)軟件領(lǐng)軍企業(yè)星環(huán)科技在向量數(shù)據(jù)庫(kù)上已有數(shù)年技術(shù)積累,之前主要內(nèi)部自用,今年5月底正式產(chǎn)品化對(duì)外發(fā)布為Hippo向量數(shù)據(jù)庫(kù)產(chǎn)品,在高可用、高性能、易拓展等方面具備優(yōu)勢(shì),支持多種向量搜索索引,支持?jǐn)?shù)據(jù)分區(qū)分片、數(shù)據(jù)持久化、增量數(shù)據(jù)攝取、向量標(biāo)量字段過(guò)濾混合查詢(xún)等功能,能夠很好地滿(mǎn)足企業(yè)針對(duì)海量向量數(shù)據(jù)的高實(shí)時(shí)性查詢(xún)、檢索、召回等場(chǎng)景。

圖表:星環(huán)科技Hippo向量數(shù)據(jù)庫(kù)具備多種企業(yè)級(jí)特性

資料來(lái)源:星環(huán)科技向星力數(shù)據(jù)技術(shù)峰會(huì),中金公司研究部

應(yīng)用場(chǎng)景和未來(lái)展望:企業(yè)內(nèi)部知識(shí)庫(kù)有望重構(gòu)

知識(shí)管理平臺(tái):幫助B端客戶(hù)實(shí)現(xiàn)內(nèi)部知識(shí)庫(kù)重構(gòu)

知識(shí)管理平臺(tái)重新整合內(nèi)部知識(shí),助力B端客戶(hù)打造AI Answer應(yīng)用。我們認(rèn)為企業(yè)知識(shí)庫(kù)有望成為AI Answer在B端的先行落地形式,目前我們觀察到第四范式、星環(huán)科技、云知聲、創(chuàng)新奇智、中科聞歌、鼎捷軟件等廠商均具備了基于企業(yè)內(nèi)部知識(shí)打造知識(shí)庫(kù)的能力。

圖表:第四范式“式說(shuō)2.0”具備企業(yè)級(jí)知識(shí)庫(kù)結(jié)合Copilot能力,從單一入口實(shí)現(xiàn)多個(gè)功能的集合

資料來(lái)源:智東西,中金公司研究部

圖表:星環(huán)科技Sophon KG提供一站式知識(shí)全生命周期管理平臺(tái),賦能各行業(yè)企業(yè)的問(wèn)答、搜索、推薦環(huán)節(jié)

資料來(lái)源:星環(huán)科技產(chǎn)品白皮書(shū),中金公司研究部

圖表:云知聲結(jié)合私域數(shù)據(jù)和大模型提供企業(yè)定制智能產(chǎn)品,打造大規(guī)模企業(yè)級(jí)“新版Bing”

資料來(lái)源:云知聲2023AIGC戰(zhàn)略發(fā)布會(huì),中金公司研究部

圖表:創(chuàng)新奇智基于內(nèi)部業(yè)務(wù)數(shù)據(jù)知識(shí)打造 “奇智孔明AInnoGC”,讓企業(yè)擁有基于私域數(shù)據(jù)的AI生成能力

資料來(lái)源:創(chuàng)新奇智官方公眾號(hào),中金公司研究部

圖表:中科聞歌“雅意”大模型具備5大核心能力,可快速對(duì)接政府、企業(yè)數(shù)據(jù)并一鍵生成企業(yè)級(jí)專(zhuān)屬應(yīng)用服務(wù)

資料來(lái)源:雅意大模型發(fā)布會(huì),中金公司研究部

圖表:鼎捷軟件推出基于GPT的企業(yè)知識(shí)PaaS平臺(tái)MERITS,其中ChatFile能夠?qū)崿F(xiàn)知識(shí)問(wèn)答能力

資料來(lái)源:鼎新電腦x微軟Azure OpenAI戰(zhàn)略合作發(fā)布會(huì),中金公司研究部

企業(yè)管理軟件:整合企業(yè)知識(shí)和管理流程,OA有望落地先行

OA有望成為企業(yè)管理軟件領(lǐng)域AI Answer先行落地場(chǎng)景。知識(shí)管理是OA的新興模塊,其主要用于企業(yè)內(nèi)部文檔和知識(shí)資料的存儲(chǔ)和管理,目前泛微、致遠(yuǎn)、藍(lán)凌等頭部OA廠商均推出了知識(shí)管理類(lèi)產(chǎn)品(如泛微采知連、致遠(yuǎn)知識(shí)管理解決方案、藍(lán)凌知識(shí)管理平臺(tái)等),而現(xiàn)階段知識(shí)管理模塊主要為知識(shí)存儲(chǔ),并通過(guò)簡(jiǎn)單的搜索功能實(shí)現(xiàn)知識(shí)提取,企業(yè)應(yīng)用效率低下。

我們認(rèn)為AI有望助力知識(shí)管理能夠進(jìn)行全方位升級(jí),通過(guò)第三方大模型賦能實(shí)現(xiàn)AI Answer,真正將企業(yè)知識(shí)靈活運(yùn)用,進(jìn)一步激勵(lì)企業(yè)員工充實(shí)知識(shí)庫(kù)并提高其使用效率。

? 泛微網(wǎng)絡(luò):千里聆&采知連&小E助手實(shí)現(xiàn)知識(shí)的管理和問(wèn)答。泛微千里聆基于RPA(機(jī)器人流程自動(dòng)化)和NLP(自然語(yǔ)言處理)技術(shù),具備信息采集功能;采知連未知識(shí)管理領(lǐng)域?qū)m?xiàng)產(chǎn)品,實(shí)現(xiàn)文檔管理、知識(shí)倉(cāng)庫(kù)、知識(shí)運(yùn)營(yíng);小E智能語(yǔ)音輔助系統(tǒng)能夠?qū)崿F(xiàn)智能助理、知識(shí)問(wèn)答、數(shù)據(jù)查詢(xún)、業(yè)務(wù)處理等功能。我們認(rèn)為未來(lái)公司產(chǎn)品有望與大模型實(shí)現(xiàn)深度融合,期待大模型融合后的企業(yè)協(xié)同管理應(yīng)用推出。

? 致遠(yuǎn)互聯(lián):AICOP助力實(shí)現(xiàn)“智能協(xié)同”。6月12日,致遠(yuǎn)互聯(lián)發(fā)布智能協(xié)同應(yīng)用AICOP的視頻演示,展示了智能協(xié)同助手“小致”在預(yù)訂會(huì)議、準(zhǔn)備會(huì)議資料、生成報(bào)告&文稿&會(huì)議紀(jì)要、填寫(xiě)表單、發(fā)起流程等場(chǎng)景的賦能應(yīng)用。

圖表:致遠(yuǎn)互聯(lián)AICOP打通企業(yè)知識(shí)庫(kù)和流程管理,實(shí)現(xiàn)“智能協(xié)同”

資料來(lái)源:致遠(yuǎn)互聯(lián)微信公眾號(hào),中金公司研究部

ERP 中 AI Answer落地展望:大模型助力下AI Answer 賦能生產(chǎn)流程管理。與OA相比,ERP與業(yè)務(wù)和生產(chǎn)聯(lián)系更緊密且具有更明顯的行業(yè)屬性,在業(yè)務(wù)運(yùn)行過(guò)程ERP沉淀的行業(yè)垂類(lèi)數(shù)據(jù)有望助力大模型的訓(xùn)練。海外微軟的Dynamics 365 Copilot展示了客服、市場(chǎng)、供應(yīng)鏈管理等場(chǎng)景的AI賦能應(yīng)用;國(guó)內(nèi)對(duì)標(biāo)來(lái)看,用友網(wǎng)絡(luò)深耕ERP多年布局二十余個(gè)行業(yè)并積累了各行業(yè)豐富的用戶(hù)授權(quán)數(shù)據(jù),公司計(jì)劃后續(xù)將通過(guò)和通用大模型廠商合作+自研結(jié)合的方式進(jìn)一步訓(xùn)練企業(yè)服務(wù)大模型,期待大模型賦能下AI Answer在財(cái)務(wù)、人力、采購(gòu)、制造、營(yíng)銷(xiāo)等領(lǐng)域場(chǎng)景落地。

文檔整理&搜索引擎:面向個(gè)人和中小組織的知識(shí)檢索應(yīng)用

釘釘有望為中小組織和個(gè)人構(gòu)建“知識(shí)圖譜”。2023年6月,釘釘AI正式邀請(qǐng)測(cè)試,其展示了AI+文檔、AI+群聊、AI+應(yīng)用、AI+問(wèn)答機(jī)器人等功能。其中AI+問(wèn)答機(jī)器人能夠接收用戶(hù)主動(dòng)上傳特定的文檔數(shù)據(jù),生成特定場(chǎng)景的問(wèn)答機(jī)器人,并作為專(zhuān)業(yè)模型實(shí)現(xiàn)更有效、準(zhǔn)確的AI問(wèn)答。我們認(rèn)為這類(lèi)功能為中小型組織和個(gè)人快速構(gòu)建知識(shí)庫(kù),實(shí)現(xiàn)知識(shí)的沉淀和應(yīng)用。

WPS、印象筆記等文檔類(lèi)軟件有望基于用戶(hù)端海量文檔實(shí)現(xiàn)AI Answer。我們認(rèn)為WPS、印象筆記等文檔類(lèi)軟件作為文檔沉淀的平臺(tái),具備天然接入AI大模型的應(yīng)用條件。如印象筆記的“知識(shí)星圖”功能,能夠借助AI語(yǔ)義分析產(chǎn)生知識(shí)圖譜和知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)信息的高效收集和利用。我們認(rèn)為文檔類(lèi)軟件有望在B端和C端幫助用戶(hù)更好地基于平臺(tái)沉淀的文檔實(shí)現(xiàn)AI Answer。

圖表:釘釘能夠基于用戶(hù)上傳的文檔生成問(wèn)答機(jī)器人

資料來(lái)源:量子位公眾號(hào),中金公司研究部

圖表:Perplexity基于OpenAI API 可以與用戶(hù)進(jìn)行交互式的對(duì)話(huà),并提供實(shí)時(shí)的信息及對(duì)應(yīng)出處

資料來(lái)源:Perplexity網(wǎng)頁(yè),中金公司研究部

垂類(lèi)場(chǎng)景:各行業(yè)知識(shí)應(yīng)用有望百花齊放

各個(gè)細(xì)分行業(yè)積累的大量知識(shí)有望在大模型賦能下實(shí)現(xiàn)歸集,賦能千行百業(yè)。如醫(yī)療行業(yè)的衛(wèi)寧健康、保險(xiǎn)行業(yè)的新致軟件、教育行業(yè)的科大訊飛均憑借過(guò)去在垂類(lèi)行業(yè)的深耕,借助大模型實(shí)現(xiàn)知識(shí)的賦能應(yīng)用。展望未來(lái),我們期待更多行業(yè)能夠在大模型賦能下實(shí)現(xiàn)行業(yè)知識(shí)萃取,各行業(yè)知識(shí)應(yīng)用有望百花齊放。

圖表:衛(wèi)寧健康推出醫(yī)療垂類(lèi)模型WiNGPT賦能問(wèn)診、報(bào)告生成等場(chǎng)景,未來(lái)計(jì)劃以Copilot形式融入WiNEX

注:公司預(yù)計(jì)WiNEX Copilot產(chǎn)品將于2023年10月Winning World2023大會(huì)上正式發(fā)布
資料來(lái)源:衛(wèi)寧健康微信公眾號(hào),中金公司研究部

圖表:新致軟件Newtouch AI將企業(yè)數(shù)據(jù)與生成式AI模型連接,幫助企業(yè)快速構(gòu)建機(jī)器人應(yīng)用

資料來(lái)源:新致AI微信公眾號(hào),中金公司研究部

圖表:科大訊飛將硬件產(chǎn)品搭載星火大模型,AI學(xué)習(xí)機(jī)通過(guò)分析用戶(hù)學(xué)情和知識(shí)圖譜提供類(lèi)人引導(dǎo)式輔學(xué)

資料來(lái)源:科大訊飛AI學(xué)習(xí)助手視頻號(hào),中金公司研究部

圖表:AI Answer相關(guān)公司一覽

資料來(lái)源:各公司官網(wǎng),中金公司研究部

本文作者:于鐘海、 魏鸛霏 、王之昊 、韓蕊 、胡安琪、譚哲賢,來(lái)源:中金點(diǎn)睛,原文標(biāo)題:《AI Answer:大模型助力B端落地先行范式》

于鐘海 SAC 執(zhí)證編號(hào):S0080518070011 SFC CE Ref:BOP246

魏鸛霏 SAC 執(zhí)證編號(hào):S0080523060019 SFC CE Ref:BSX734

王之昊 SAC 執(zhí)證編號(hào):S0080522050001 SFC CE Ref:BSS168

韓蕊 SAC 執(zhí)證編號(hào):S0080121080059

胡安琪 SAC 執(zhí)證編號(hào):S0080122070070

譚哲賢 SAC 執(zhí)證編號(hào):S0080122070047

風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。

關(guān)鍵詞:

项城市| 耿马| 建水县| 高邑县| 景谷| 长白| 长沙县| 枣庄市| 乌审旗| 潜江市| 普洱| 曲靖市| 二手房| 修文县| 樟树市| 长宁区| 连江县| 北碚区| 搜索| 富阳市| 定远县| 海口市| 江口县| 远安县| 禹城市| 瑞安市| 灵台县| 安陆市| 崇仁县| 肥城市| 密山市| 婺源县| 兰州市| 建瓯市| 张家口市| 新安县| 简阳市| 铜山县| 广丰县| 贺州市| 方城县|