本文定義AI Answer 為結(jié)合LLM和IR技術(shù)的智能信息互動(dòng)應(yīng)用，信息源可為閉源知識(shí)庫(kù)、行業(yè)圖譜、或是互聯(lián)網(wǎng)開(kāi)放信息。以C端檢索范式演進(jìn)為鑒，我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地，AI賦能內(nèi)部知識(shí)庫(kù)重建、構(gòu)建流量入口，有望帶來(lái)諸多價(jià)值增量。

摘要
以C端搜索引擎范式演進(jìn)為鑒，我們認(rèn)為B端AI Answer能夠帶來(lái)多元價(jià)值增量：

(資料圖)
1）數(shù)據(jù)價(jià)值挖掘：企業(yè)端自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測(cè)分析；用戶(hù)端自動(dòng)分配數(shù)據(jù)訪問(wèn)權(quán)限，并推薦個(gè)性化的檢索路徑與知識(shí)生成。
2）知識(shí)資產(chǎn)沉淀：自動(dòng)生成信息分類(lèi)標(biāo)簽，降低人工歸檔成本。同時(shí)用戶(hù)行為可作為人類(lèi)反饋，訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對(duì)齊應(yīng)用領(lǐng)域的需求和偏好。
3）搜索效率提升：自動(dòng)剔除重復(fù)或冗余的信息，整合高質(zhì)量知識(shí)資產(chǎn)。主動(dòng)提供建議和關(guān)聯(lián)資料，促進(jìn)信息獲取的及時(shí)性。
供給端技術(shù)平權(quán)疊加需求端實(shí)現(xiàn)內(nèi)外雙向賦能，我們認(rèn)為AI Answer有望成為B端應(yīng)用中先行落地場(chǎng)景。
數(shù)據(jù)層面，AI Answer在搜索過(guò)程中融入垂域要素，更好的理解用戶(hù)意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果；模型層面，技術(shù)平權(quán)背景下可以通過(guò)使用開(kāi)源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。同時(shí)在企業(yè)需求端，AI Answer助力企業(yè)知識(shí)圖譜重構(gòu)，實(shí)現(xiàn)后端流程運(yùn)維及前端業(yè)務(wù)交互的內(nèi)外雙向賦能。
AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫(kù)。LangChain框架通過(guò)各種模塊化組件提供了全方位全流程的通用開(kāi)發(fā)服務(wù)，可被用于整合和管理大模型的輸出。智譜ChatGLM等大模型帶來(lái)大模型普惠，助力B端部署AI Answer。向量數(shù)據(jù)庫(kù)幫助拓展LLM的時(shí)空邊界，賦能企業(yè)打造基于專(zhuān)屬知識(shí)庫(kù)的AI Answer應(yīng)用。
企業(yè)內(nèi)部知識(shí)庫(kù)有望重構(gòu)，管理軟件領(lǐng)域OA有望先行落地AI Answer。我們觀察到第四范式、星環(huán)科技、云知聲等公司已推出企業(yè)知識(shí)管理平臺(tái)產(chǎn)品，幫助客戶(hù)重構(gòu)企業(yè)知識(shí)庫(kù)；釘釘、WPS、印象筆記等產(chǎn)品助力個(gè)人和中小組織實(shí)現(xiàn)知識(shí)梳理。在管理軟件領(lǐng)域，我們認(rèn)為泛微、致遠(yuǎn)等OA廠商有望先行實(shí)現(xiàn)AI Answer和管理流程結(jié)合，落地智能協(xié)同應(yīng)用。

正文

什么是AI Answer？

我們認(rèn)為， AI Answer 為結(jié)合大語(yǔ)言模型（LLM）和信息檢索（IR，Information retrieval）技術(shù)的智能信息互動(dòng)應(yīng)用。在這個(gè)應(yīng)用中，LLM 負(fù)責(zé)理解語(yǔ)境并構(gòu)建查詢(xún)，而 IR 技術(shù)則依據(jù)這些查詢(xún)獲取相關(guān)數(shù)據(jù)或文檔。檢索到的結(jié)果最終由LLM 生成回應(yīng)，從而形成一個(gè)以模型外部信息為支撐的動(dòng)態(tài)對(duì)話(huà)過(guò)程。

AI Answer檢索的信息可以是企業(yè)閉源知識(shí)庫(kù)、行業(yè)知識(shí)圖譜、或是互聯(lián)網(wǎng)開(kāi)放信息。相較于傳統(tǒng)知識(shí)檢索應(yīng)用，AI Answer在交互模式、泛化能力及精確度上均有能力躍遷，我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地，價(jià)值增量包括：

??數(shù)據(jù)價(jià)值挖掘：企業(yè)端根據(jù)企業(yè)內(nèi)部數(shù)據(jù)與已有知識(shí)，自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測(cè)分析，提高企業(yè)運(yùn)維效率與知識(shí)創(chuàng)新動(dòng)能。同時(shí)用戶(hù)端AI Answer通過(guò)分析用戶(hù)的角色、需求、歷史查詢(xún)記錄，自動(dòng)分配合適的數(shù)據(jù)訪問(wèn)權(quán)限，推薦個(gè)性化檢索路徑與知識(shí)生成。

??知識(shí)資產(chǎn)沉淀：自動(dòng)為線上知識(shí)文檔生成分類(lèi)標(biāo)簽，降低人工信息整理成本。根據(jù)用戶(hù)使用應(yīng)用的情況跟蹤企業(yè)知識(shí)庫(kù)變化，自動(dòng)更新生成內(nèi)容，確保信息準(zhǔn)確性與實(shí)時(shí)。同時(shí)用戶(hù)使用AI Answer產(chǎn)生的行為可作為人類(lèi)反饋，訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對(duì)齊應(yīng)用領(lǐng)域的需求和偏好。

??搜索效率提升：通過(guò)精準(zhǔn)分析用戶(hù)需求，自動(dòng)剔除重復(fù)或冗余的信息，整合高質(zhì)量知識(shí)資產(chǎn)。同時(shí)AI Answer應(yīng)用可作為虛擬助手，在平臺(tái)上同步協(xié)助員工解決問(wèn)題、主動(dòng)提供建議和關(guān)聯(lián)資料，促進(jìn)信息獲取的及時(shí)性。

以C端檢索范式演進(jìn)為鑒，我們認(rèn)為B端 AI賦能內(nèi)部知識(shí)庫(kù)重建有望帶來(lái)諸多價(jià)值增量，滿(mǎn)足企業(yè)端提效需求。微軟2月8日發(fā)布基于OpenAI大模型的搜索引擎新版Bing（中文名“必應(yīng)”）[1]，首次推出嵌入搜索引擎的“問(wèn)答式搜索”功能，搜索界面的問(wèn)答機(jī)器人可以與用戶(hù)聊天、協(xié)助撰寫(xiě)文本、匯總?cè)W(wǎng)絡(luò)信息并以對(duì)話(huà)方式響應(yīng)查詢(xún)。

StatCounter數(shù)據(jù)顯示谷歌的搜索引擎幾乎占據(jù)了90%的市場(chǎng)份額，我們認(rèn)為Bing憑借智能化檢索有望不斷突破市場(chǎng)份額。據(jù) Data.AI 的圖示區(qū)間數(shù)據(jù)，在嵌入了OpenAI大模型能力后，Bing的APP日均下載量在全球范圍內(nèi)增長(zhǎng)了823%，同期對(duì)比谷歌搜索應(yīng)用的下載量?jī)H增長(zhǎng)3%。

圖表：New Bing推出后APP下載量較Google逐步收斂

資料來(lái)源：Data.ai，中金公司研究部

以Glean為例，大模型賦能的AI Answer重構(gòu)企業(yè)管理軟件。AI技術(shù)在企業(yè)端的應(yīng)用場(chǎng)景廣闊，其中知識(shí)內(nèi)容檢索場(chǎng)景知識(shí)密度要求較高，需求明確且技術(shù)路徑相對(duì)成熟。Glean通過(guò)打通跨應(yīng)用數(shù)據(jù)打造駕于SaaS層之上的“聚合層”，成為企業(yè)應(yīng)用場(chǎng)景的入口級(jí)產(chǎn)品。Glean可以結(jié)合企業(yè)內(nèi)部知識(shí)圖譜、以及上百家第三方SaaS應(yīng)用中進(jìn)行信息檢索，為每位用戶(hù)的自然語(yǔ)言查詢(xún)生成定制化的結(jié)果，覆蓋信息查找、復(fù)雜功能執(zhí)行等場(chǎng)景。

目前，Glean只面向企業(yè)客戶(hù)提供服務(wù)，公司推出兩種定價(jià)方案，1）按席位收費(fèi)，每月不超過(guò)100美元；2）根據(jù)企業(yè)的需求定制價(jià)格，目前商業(yè)模式以第二種為主。此外，在服務(wù)模式上，Glean 還提供高水平的安全性和靈活性，可以選擇在本地或云端部署，并且對(duì)用戶(hù)數(shù)據(jù)進(jìn)行加密和權(quán)限層級(jí)管理。

圖表：知識(shí)內(nèi)容檢索場(chǎng)景信息密度要求較高而靈活性要求較低，當(dāng)前模型已能夠滿(mǎn)足

資料來(lái)源：中金公司研究部

圖表：Glean結(jié)合企業(yè)文檔及第三方應(yīng)用進(jìn)行檢索

資料來(lái)源：Glean官網(wǎng)，中金公司研究部

AI Answer有望成為B端最快落地的模式

供給端，模型層技術(shù)趨于平權(quán)，企業(yè)具備閉源數(shù)據(jù)卡位，商業(yè)落地可得性較高。數(shù)據(jù)層面，與其他B端AI應(yīng)用相比集成了垂直行業(yè)知識(shí)的AI Answer應(yīng)用更易實(shí)施落地。

通用人工智能積累了強(qiáng)大的通識(shí)能力，但由于其廣泛而非專(zhuān)精的數(shù)據(jù)結(jié)構(gòu)，其在專(zhuān)業(yè)領(lǐng)域的檢索實(shí)效性及性?xún)r(jià)比尚有欠缺。通過(guò)擬合垂直領(lǐng)域的數(shù)據(jù)，AI Answer能理解行業(yè)內(nèi)的專(zhuān)業(yè)詞匯、概念和信息，從而在搜索過(guò)程中融入垂域要素，更好的理解用戶(hù)意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果。

模型層面，B端企業(yè)AI Answer場(chǎng)景對(duì)于算法模型在知識(shí)涌現(xiàn)、數(shù)理分析等高階能力需求較弱，對(duì)檢索能力和文本生成能力需求較強(qiáng)，技術(shù)平權(quán)背景下可以通過(guò)使用LLAMA、Bloom、ChatGLM等開(kāi)源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。

例如，企業(yè)可以使用LangChain將數(shù)據(jù)庫(kù)文檔加載并索引到本地知識(shí)庫(kù)中，通過(guò)嵌入模型對(duì)文本進(jìn)行矢量化，助力快速檢索相關(guān)段落，再通過(guò)ChatGLM協(xié)助用戶(hù)基于檢索到的信息和用戶(hù)會(huì)話(huà)歷史生成精準(zhǔn)的答案。

圖表：垂域模型調(diào)優(yōu)處在監(jiān)督式微調(diào)階段，增量算力需求較少

資料來(lái)源：2023 年微軟Build大會(huì)，中金公司研究部

需求端，AI Answer助力企業(yè)知識(shí)圖譜重構(gòu)，實(shí)現(xiàn)內(nèi)外雙向賦能。

1）企業(yè)需要快速準(zhǔn)確地獲取和利用特定領(lǐng)域的知識(shí)和信息，以提高決策效率和質(zhì)量。傳統(tǒng)的搜索引擎往往不能滿(mǎn)足企業(yè)的個(gè)性化需求，而需要一個(gè)能夠理解企業(yè)商業(yè)模式下特定語(yǔ)境和邏輯的智能問(wèn)答系統(tǒng)。

2）企業(yè)需要對(duì)自己擁有或者能夠獲取的數(shù)據(jù)和知識(shí)進(jìn)行有效地組織和管理，以提高數(shù)據(jù)質(zhì)量和可用性。傳統(tǒng)的知識(shí)庫(kù)構(gòu)建和維護(hù)往往需要大量的人力和時(shí)間成本，AI Answer能夠助力企業(yè)自動(dòng)化地從各種數(shù)據(jù)源中抽取、整合、更新和驗(yàn)證知識(shí)。

3）企業(yè)需要與客戶(hù)、合作伙伴、員工等各方有效地溝通和協(xié)作，傳統(tǒng)的人工客服或者機(jī)器人往往不能滿(mǎn)足用戶(hù)的多樣化和復(fù)雜化的問(wèn)題，AI Answer經(jīng)過(guò)細(xì)化調(diào)優(yōu)，能夠靈活地適應(yīng)不同場(chǎng)景和需求。

圖表：AI Answer助力企業(yè)決策從被動(dòng)響應(yīng)轉(zhuǎn)向主動(dòng)服務(wù)

資料來(lái)源：中國(guó)信通院《企業(yè)數(shù)字化轉(zhuǎn)型技術(shù)發(fā)展趨勢(shì)研究報(bào)告（2023）》，中金公司研究部

技術(shù)基礎(chǔ)：AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫(kù)

LangChain：針對(duì)大模型提供通用開(kāi)發(fā)框架

LangChain是一個(gè)封裝了各種大語(yǔ)言模型應(yīng)用開(kāi)發(fā)工具的開(kāi)源Python框架，提供了一套開(kāi)發(fā)大模型的工具、組件和接口。LangChain幫助開(kāi)發(fā)者將大模型和其他知識(shí)源/數(shù)據(jù)庫(kù)結(jié)合起來(lái)，以創(chuàng)建功能更強(qiáng)大的應(yīng)用程序，包括基于知識(shí)庫(kù)問(wèn)答、聊天機(jī)器人、智能代理等。該開(kāi)源Python可被用于整合和管理大模型（如ChatGLM）的輸出，提供了標(biāo)準(zhǔn)的模塊化組件、集成了不同的大語(yǔ)言模型并將其進(jìn)行整合，并將它們連接到各種外部數(shù)據(jù)源和API。

通過(guò)各種模塊化組件，LangChain框架提供了全方位全流程的優(yōu)化服務(wù)。傳統(tǒng)的大模型無(wú)法聯(lián)網(wǎng)、無(wú)法調(diào)用其他API、無(wú)法訪問(wèn)本地文件、對(duì)Prompt要求高、生成能力強(qiáng)但內(nèi)容準(zhǔn)確度無(wú)法保證，而LangChain則提供了相應(yīng)模塊，旨在解決這一系列問(wèn)題。

? Prompt：使用LLM需要用戶(hù)輸入需求，LangChain將用戶(hù)的輸入傳遞給Prompt Template。一個(gè)Prompt通常由Instructions、Context、Input Data和Output Indicator組成，但一般用戶(hù)并不會(huì)完整地輸入每個(gè)部分，使用LangChain的Prompt Template可以很好地根據(jù)用戶(hù)輸入定義各個(gè)部分，同時(shí)將Input Data留作動(dòng)態(tài)輸入項(xiàng)。

? Chain：利用該模塊，LangChain可以不單單利用本身的LLM和Prompt Template，而是將原模型鏈接到其他信息源或API，將模塊組合成完整的工作流，拓展LLM應(yīng)用邊界。

圖表：Prompt Template對(duì)輸入改寫(xiě)

資料來(lái)源：海外獨(dú)角獸，中金公司研究部

圖表：連接多個(gè)Prompt Template及搜索、數(shù)據(jù)庫(kù)

資料來(lái)源：海外獨(dú)角獸，中金公司研究部

? Agent：如果LLM僅利用Chain模塊，那么模型將按照預(yù)設(shè)的接口和順序執(zhí)行工作，而Agent模組可以利用LLM分析應(yīng)該使用哪個(gè)API或者搜索引擎、數(shù)據(jù)源等工具鏈，并自行決定調(diào)用和實(shí)現(xiàn)的順序。比如，ChatGPT有很強(qiáng)的生成回答能力，但不夠準(zhǔn)確；Wolfram Alpha有很準(zhǔn)確的知識(shí)儲(chǔ)備，但語(yǔ)義理解能力較差，Agent可以針對(duì)ChatGPT的問(wèn)題，自行判斷是否需要調(diào)用Wolfram Alpha，并生成回答。

? Memory：默認(rèn)情況下，Chain和Agent是無(wú)狀態(tài)（stateless）的[2]，這意味著它們獨(dú)立地處理每個(gè)傳入的Query（就像底層的LLM和聊天模型），不具備上文記憶的能力。為了記住先前的交互，LangChain通過(guò)每次Prompt加入上文內(nèi)容和記錄的tricks，在不同的Query間傳遞上文，在前ChatGPT時(shí)代就實(shí)現(xiàn)了記憶的功能。

圖表：Agent判斷使用工具流程

資料來(lái)源：海外獨(dú)角獸，中金公司研究部

圖表：Entity Memory提供長(zhǎng)期上下文記憶能力

資料來(lái)源：海外獨(dú)角獸，中金公司研究部

案例：YouTube博主Data Independent通過(guò)LangChain構(gòu)建了一個(gè)PDF問(wèn)答機(jī)器人。

LangChain憑借PDF Loader的幫助加載上傳的PDF，并使用Splitter分割語(yǔ)句向量，同時(shí)盡可能保留原始語(yǔ)義，調(diào)用OpenAI的Embedding引擎進(jìn)行長(zhǎng)向量變換并存儲(chǔ)在本地或者Pinecone云向量數(shù)據(jù)庫(kù)，最后用戶(hù)只需調(diào)用LangChain的QA Chain就可以針對(duì)上傳的PDF進(jìn)行問(wèn)答。整個(gè)過(guò)程中，LangChain相當(dāng)于對(duì)每個(gè)環(huán)節(jié)集成，并對(duì)整體的交互進(jìn)行封裝。

LangChain受到廣泛關(guān)注和使用，獲得種子輪融資，但商業(yè)化任重道遠(yuǎn)。2023年4月6日，LangChain宣布獲得由Benchmark領(lǐng)投的1,000萬(wàn)美元種子輪融資。

截至2023年4月19日，LangChain在Github上已有2.8萬(wàn)Stars、478位貢獻(xiàn)者，被2,400多名用戶(hù)使用。但究其本質(zhì)，LangChain是“整合其他開(kāi)源庫(kù)的開(kāi)源庫(kù)”，提供開(kāi)發(fā)LLM的框架，以此節(jié)省開(kāi)發(fā)人員編寫(xiě)代碼的時(shí)間。而由于開(kāi)源加之經(jīng)濟(jì)成本不穩(wěn)定、對(duì)輸出沒(méi)有評(píng)估步驟，客戶(hù)目前更偏好直接的模型交付，LangChain商業(yè)化仍有待探索。

LangFlow為L(zhǎng)angChain開(kāi)源且無(wú)代碼的可視化開(kāi)發(fā)界面，用戶(hù)可以通過(guò)拖拽模塊和自然語(yǔ)言交互的模式構(gòu)建應(yīng)用原型。

Langchain將制作AI應(yīng)用的工具能力模板化和標(biāo)準(zhǔn)化，而LangFlow 提供了一系列可供選擇的LangChain組件，包括 LLMs、提示模板、代理和鏈等等，用戶(hù)可以通過(guò)鏈接節(jié)點(diǎn)的方式輕松構(gòu)建和測(cè)試產(chǎn)品原型，例如聊天機(jī)器人和文本解析助手。LangFlow基于Python開(kāi)發(fā)，同類(lèi)產(chǎn)品還有基于JavaScript開(kāi)發(fā)的Flowise。

圖表：LangFlow支持模塊拖放和聊天框構(gòu)建應(yīng)用原型

資料來(lái)源：LangFlow官網(wǎng)，中金公司研究部

圖表：LangFlow通過(guò)簡(jiǎn)單鏈接四個(gè)模塊即可構(gòu)建具備記憶且可自定義模板的聊天機(jī)器人

資料來(lái)源：LangFlow官網(wǎng)，中金公司研究部

大模型：開(kāi)源模型百花齊放，助力B端高效部署

ChatGLM等開(kāi)源模型帶來(lái)大模型普惠，助力B端部署AI Answer。

企業(yè)可以通過(guò)Langchain平臺(tái)調(diào)用部分開(kāi)源的自然語(yǔ)言處理模型，例如ChatGLM、Bloom與LLAMA模型等，這些開(kāi)源模型為企業(yè)級(jí)AI應(yīng)用的推廣奠定了基礎(chǔ)。其中，ChatGLM是可被集成到LangChain的一款重要開(kāi)源模型，能夠通過(guò)提供自然語(yǔ)言處理能力為企業(yè)打造高效的AI Answer應(yīng)用。

其研發(fā)企業(yè)智譜AI成立于2019年，源自清華大學(xué)計(jì)算機(jī)系知識(shí)工程實(shí)驗(yàn)室。2022年，公司合作研發(fā)了支持中英雙語(yǔ)的千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B，并搭建了高精度通用知識(shí)圖譜。

圖表：智譜AI產(chǎn)品矩陣

資料來(lái)源：智譜AI官網(wǎng)，中金公司研究部

GLM-130B在多個(gè)公開(kāi)評(píng)測(cè)榜單上超越了GPT-3的性能，支持單張消費(fèi)級(jí)推理并且具備跨平臺(tái)跨芯片的快速推理能力。基于GLM-130B模型，公司又開(kāi)發(fā)了6B參數(shù)規(guī)模的雙語(yǔ)對(duì)話(huà)模型ChatGLM，可以處理多種自然語(yǔ)言任務(wù)（如對(duì)話(huà)聊天和智能問(wèn)答），并且支持在單張消費(fèi)級(jí)顯卡上推理使用。目前，GLM-130B和ChatGLM均開(kāi)源，為企業(yè)端客戶(hù)提供了更低門(mén)檻和更高安全性的應(yīng)用方案。

圖表：ChatGLM-130B及ChatGLM-6B于中文大模型匿名對(duì)戰(zhàn)平臺(tái)SuperCLUE-瑯琊榜排名均位于前五

注：統(tǒng)計(jì)截至2023年5月29日
資料來(lái)源：SuperCLUE-瑯琊榜官網(wǎng)，中金公司研究部

圖表：Leaderboard非英文問(wèn)題測(cè)試中，ChatGLM排名第7，以較小參數(shù)達(dá)到高性能

注：統(tǒng)計(jì)截至2023年5月25日
資料來(lái)源：lmsys arena Leaderboard，中金公司研究部

向量數(shù)據(jù)庫(kù)：構(gòu)建企業(yè)知識(shí)庫(kù)的必備存儲(chǔ)“大腦”

向量是多模數(shù)據(jù)的壓縮，是AI學(xué)習(xí)的通用數(shù)據(jù)形式。非結(jié)構(gòu)化數(shù)據(jù)通常需要向量化之后才能被AI模型所理解，向量嵌入（vector embedding）是自然語(yǔ)言處理和深度學(xué)習(xí)中常用的數(shù)據(jù)預(yù)處理技術(shù)，即將非數(shù)值如文本、圖片、視頻等源數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量。

圖表：通過(guò)嵌入模型將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量

資料來(lái)源：Pinecone，中金公司研究部

向量搜索是一種模糊匹配，區(qū)別于傳統(tǒng)的關(guān)鍵詞索引精準(zhǔn)查詢(xún)。向量搜索一般采用K近鄰法或近似臨近算法，計(jì)算目標(biāo)對(duì)象與數(shù)據(jù)庫(kù)中向量嵌入的距離以表示兩者的相似度，排序后返回最為相似的結(jié)果。區(qū)別于傳統(tǒng)數(shù)據(jù)庫(kù)的精確索引，向量搜索是一種模糊匹配，輸出的是概率上的最近似答案。

圖表：向量搜索以向量嵌入的距離表征相似度，是一種模糊匹配

資料來(lái)源：Google Developers，中金公司研究部

向量數(shù)據(jù)庫(kù)是專(zhuān)門(mén)用來(lái)存儲(chǔ)和查詢(xún)向量的數(shù)據(jù)庫(kù)。向量數(shù)據(jù)庫(kù)即原生面向向量設(shè)計(jì)的、專(zhuān)門(mén)用于存儲(chǔ)、管理、查詢(xún)、檢索向量的數(shù)據(jù)庫(kù)。向量化技術(shù)已較為成熟，也出現(xiàn)了不少開(kāi)源的向量搜索算法庫(kù)（如Facebook的FAISS），但向量數(shù)據(jù)庫(kù)提供一種開(kāi)箱即用的解決方案，在數(shù)據(jù)持久化、實(shí)時(shí)增刪改、分布式計(jì)算、容災(zāi)備份等方面提供更完整的支持，更適合企業(yè)級(jí)應(yīng)用。

向量數(shù)據(jù)庫(kù)幫助拓展LLM時(shí)空邊界，是企業(yè)知識(shí)庫(kù)的必備存儲(chǔ)“大腦”。目前向量數(shù)據(jù)庫(kù)的核心應(yīng)用場(chǎng)景之一便是拓展LLM的時(shí)空邊界，賦能企業(yè)打造基于專(zhuān)屬知識(shí)庫(kù)的AI Answer應(yīng)用。

時(shí)間維度上，初始的LLM是基于歷史的通用語(yǔ)料庫(kù)訓(xùn)練的，而實(shí)際企業(yè)應(yīng)用場(chǎng)景中需要補(bǔ)充實(shí)時(shí)的、專(zhuān)業(yè)性的知識(shí)；空間維度上，LLM的輸入token存在長(zhǎng)度限制，因此無(wú)法直接將企業(yè)知識(shí)庫(kù)的全量信息作為prompt一次性輸入，僅需最相關(guān)的部分。

向量數(shù)據(jù)庫(kù)和LLM的具體交互過(guò)程為：用戶(hù)首先將企業(yè)知識(shí)庫(kù)的全量信息通過(guò)嵌入模型轉(zhuǎn)化為向量后儲(chǔ)存在向量數(shù)據(jù)庫(kù)中，用戶(hù)輸入prompt時(shí)，先將其同樣向量化，并在向量數(shù)據(jù)庫(kù)中檢索最為相關(guān)的內(nèi)容，再將檢索到的相關(guān)信息和初始prompt一起輸入給LLM模型，以得到最終返回結(jié)果。

圖表：向量數(shù)據(jù)庫(kù)和LLM的具體交互過(guò)程

資料來(lái)源：Pinecone官網(wǎng)，星環(huán)科技微信公眾號(hào)，中金公司研究部

案例：星環(huán)科技Hippo向量數(shù)據(jù)庫(kù)具備多種企業(yè)級(jí)特性。目前向量數(shù)據(jù)庫(kù)市場(chǎng)參與者以海外初創(chuàng)型公司的開(kāi)源產(chǎn)品為主，近期一級(jí)市場(chǎng)投融資熱度較高。

國(guó)內(nèi)大數(shù)據(jù)基礎(chǔ)軟件領(lǐng)軍企業(yè)星環(huán)科技在向量數(shù)據(jù)庫(kù)上已有數(shù)年技術(shù)積累，之前主要內(nèi)部自用，今年5月底正式產(chǎn)品化對(duì)外發(fā)布為Hippo向量數(shù)據(jù)庫(kù)產(chǎn)品，在高可用、高性能、易拓展等方面具備優(yōu)勢(shì)，支持多種向量搜索索引，支持?jǐn)?shù)據(jù)分區(qū)分片、數(shù)據(jù)持久化、增量數(shù)據(jù)攝取、向量標(biāo)量字段過(guò)濾混合查詢(xún)等功能，能夠很好地滿(mǎn)足企業(yè)針對(duì)海量向量數(shù)據(jù)的高實(shí)時(shí)性查詢(xún)、檢索、召回等場(chǎng)景。

圖表：星環(huán)科技Hippo向量數(shù)據(jù)庫(kù)具備多種企業(yè)級(jí)特性

資料來(lái)源：星環(huán)科技向星力數(shù)據(jù)技術(shù)峰會(huì)，中金公司研究部

應(yīng)用場(chǎng)景和未來(lái)展望：企業(yè)內(nèi)部知識(shí)庫(kù)有望重構(gòu)

知識(shí)管理平臺(tái)：幫助B端客戶(hù)實(shí)現(xiàn)內(nèi)部知識(shí)庫(kù)重構(gòu)

知識(shí)管理平臺(tái)重新整合內(nèi)部知識(shí)，助力B端客戶(hù)打造AI Answer應(yīng)用。我們認(rèn)為企業(yè)知識(shí)庫(kù)有望成為AI Answer在B端的先行落地形式，目前我們觀察到第四范式、星環(huán)科技、云知聲、創(chuàng)新奇智、中科聞歌、鼎捷軟件等廠商均具備了基于企業(yè)內(nèi)部知識(shí)打造知識(shí)庫(kù)的能力。

圖表：第四范式“式說(shuō)2.0”具備企業(yè)級(jí)知識(shí)庫(kù)結(jié)合Copilot能力，從單一入口實(shí)現(xiàn)多個(gè)功能的集合

資料來(lái)源：智東西，中金公司研究部

圖表：星環(huán)科技Sophon KG提供一站式知識(shí)全生命周期管理平臺(tái)，賦能各行業(yè)企業(yè)的問(wèn)答、搜索、推薦環(huán)節(jié)

資料來(lái)源：星環(huán)科技產(chǎn)品白皮書(shū)，中金公司研究部

圖表：云知聲結(jié)合私域數(shù)據(jù)和大模型提供企業(yè)定制智能產(chǎn)品，打造大規(guī)模企業(yè)級(jí)“新版Bing”

資料來(lái)源：云知聲2023AIGC戰(zhàn)略發(fā)布會(huì)，中金公司研究部

圖表：創(chuàng)新奇智基于內(nèi)部業(yè)務(wù)數(shù)據(jù)知識(shí)打造 “奇智孔明AInnoGC”，讓企業(yè)擁有基于私域數(shù)據(jù)的AI生成能力

資料來(lái)源：創(chuàng)新奇智官方公眾號(hào)，中金公司研究部

圖表：中科聞歌“雅意”大模型具備5大核心能力，可快速對(duì)接政府、企業(yè)數(shù)據(jù)并一鍵生成企業(yè)級(jí)專(zhuān)屬應(yīng)用服務(wù)

資料來(lái)源：雅意大模型發(fā)布會(huì)，中金公司研究部

圖表：鼎捷軟件推出基于GPT的企業(yè)知識(shí)PaaS平臺(tái)MERITS，其中ChatFile能夠?qū)崿F(xiàn)知識(shí)問(wèn)答能力

資料來(lái)源：鼎新電腦x微軟Azure OpenAI戰(zhàn)略合作發(fā)布會(huì)，中金公司研究部

企業(yè)管理軟件：整合企業(yè)知識(shí)和管理流程，OA有望落地先行

OA有望成為企業(yè)管理軟件領(lǐng)域AI Answer先行落地場(chǎng)景。知識(shí)管理是OA的新興模塊，其主要用于企業(yè)內(nèi)部文檔和知識(shí)資料的存儲(chǔ)和管理，目前泛微、致遠(yuǎn)、藍(lán)凌等頭部OA廠商均推出了知識(shí)管理類(lèi)產(chǎn)品（如泛微采知連、致遠(yuǎn)知識(shí)管理解決方案、藍(lán)凌知識(shí)管理平臺(tái)等），而現(xiàn)階段知識(shí)管理模塊主要為知識(shí)存儲(chǔ)，并通過(guò)簡(jiǎn)單的搜索功能實(shí)現(xiàn)知識(shí)提取，企業(yè)應(yīng)用效率低下。

我們認(rèn)為AI有望助力知識(shí)管理能夠進(jìn)行全方位升級(jí)，通過(guò)第三方大模型賦能實(shí)現(xiàn)AI Answer，真正將企業(yè)知識(shí)靈活運(yùn)用，進(jìn)一步激勵(lì)企業(yè)員工充實(shí)知識(shí)庫(kù)并提高其使用效率。

? 泛微網(wǎng)絡(luò)：千里聆&采知連&小E助手實(shí)現(xiàn)知識(shí)的管理和問(wèn)答。泛微千里聆基于RPA（機(jī)器人流程自動(dòng)化）和NLP（自然語(yǔ)言處理）技術(shù)，具備信息采集功能；采知連未知識(shí)管理領(lǐng)域?qū)ｍ?xiàng)產(chǎn)品，實(shí)現(xiàn)文檔管理、知識(shí)倉(cāng)庫(kù)、知識(shí)運(yùn)營(yíng)；小E智能語(yǔ)音輔助系統(tǒng)能夠?qū)崿F(xiàn)智能助理、知識(shí)問(wèn)答、數(shù)據(jù)查詢(xún)、業(yè)務(wù)處理等功能。我們認(rèn)為未來(lái)公司產(chǎn)品有望與大模型實(shí)現(xiàn)深度融合，期待大模型融合后的企業(yè)協(xié)同管理應(yīng)用推出。

? 致遠(yuǎn)互聯(lián)：AICOP助力實(shí)現(xiàn)“智能協(xié)同”。6月12日，致遠(yuǎn)互聯(lián)發(fā)布智能協(xié)同應(yīng)用AICOP的視頻演示，展示了智能協(xié)同助手“小致”在預(yù)訂會(huì)議、準(zhǔn)備會(huì)議資料、生成報(bào)告&文稿&會(huì)議紀(jì)要、填寫(xiě)表單、發(fā)起流程等場(chǎng)景的賦能應(yīng)用。

圖表：致遠(yuǎn)互聯(lián)AICOP打通企業(yè)知識(shí)庫(kù)和流程管理，實(shí)現(xiàn)“智能協(xié)同”

資料來(lái)源：致遠(yuǎn)互聯(lián)微信公眾號(hào)，中金公司研究部

ERP 中 AI Answer落地展望：大模型助力下AI Answer 賦能生產(chǎn)流程管理。與OA相比，ERP與業(yè)務(wù)和生產(chǎn)聯(lián)系更緊密且具有更明顯的行業(yè)屬性，在業(yè)務(wù)運(yùn)行過(guò)程ERP沉淀的行業(yè)垂類(lèi)數(shù)據(jù)有望助力大模型的訓(xùn)練。海外微軟的Dynamics 365 Copilot展示了客服、市場(chǎng)、供應(yīng)鏈管理等場(chǎng)景的AI賦能應(yīng)用；國(guó)內(nèi)對(duì)標(biāo)來(lái)看，用友網(wǎng)絡(luò)深耕ERP多年布局二十余個(gè)行業(yè)并積累了各行業(yè)豐富的用戶(hù)授權(quán)數(shù)據(jù)，公司計(jì)劃后續(xù)將通過(guò)和通用大模型廠商合作+自研結(jié)合的方式進(jìn)一步訓(xùn)練企業(yè)服務(wù)大模型，期待大模型賦能下AI Answer在財(cái)務(wù)、人力、采購(gòu)、制造、營(yíng)銷(xiāo)等領(lǐng)域場(chǎng)景落地。

文檔整理&搜索引擎：面向個(gè)人和中小組織的知識(shí)檢索應(yīng)用

釘釘有望為中小組織和個(gè)人構(gòu)建“知識(shí)圖譜”。2023年6月，釘釘AI正式邀請(qǐng)測(cè)試，其展示了AI+文檔、AI+群聊、AI+應(yīng)用、AI+問(wèn)答機(jī)器人等功能。其中AI+問(wèn)答機(jī)器人能夠接收用戶(hù)主動(dòng)上傳特定的文檔數(shù)據(jù)，生成特定場(chǎng)景的問(wèn)答機(jī)器人，并作為專(zhuān)業(yè)模型實(shí)現(xiàn)更有效、準(zhǔn)確的AI問(wèn)答。我們認(rèn)為這類(lèi)功能為中小型組織和個(gè)人快速構(gòu)建知識(shí)庫(kù)，實(shí)現(xiàn)知識(shí)的沉淀和應(yīng)用。

WPS、印象筆記等文檔類(lèi)軟件有望基于用戶(hù)端海量文檔實(shí)現(xiàn)AI Answer。我們認(rèn)為WPS、印象筆記等文檔類(lèi)軟件作為文檔沉淀的平臺(tái)，具備天然接入AI大模型的應(yīng)用條件。如印象筆記的“知識(shí)星圖”功能，能夠借助AI語(yǔ)義分析產(chǎn)生知識(shí)圖譜和知識(shí)網(wǎng)絡(luò)，實(shí)現(xiàn)信息的高效收集和利用。我們認(rèn)為文檔類(lèi)軟件有望在B端和C端幫助用戶(hù)更好地基于平臺(tái)沉淀的文檔實(shí)現(xiàn)AI Answer。

圖表：釘釘能夠基于用戶(hù)上傳的文檔生成問(wèn)答機(jī)器人

資料來(lái)源：量子位公眾號(hào)，中金公司研究部

圖表：Perplexity基于OpenAI API 可以與用戶(hù)進(jìn)行交互式的對(duì)話(huà)，并提供實(shí)時(shí)的信息及對(duì)應(yīng)出處

資料來(lái)源：Perplexity網(wǎng)頁(yè)，中金公司研究部

垂類(lèi)場(chǎng)景：各行業(yè)知識(shí)應(yīng)用有望百花齊放

各個(gè)細(xì)分行業(yè)積累的大量知識(shí)有望在大模型賦能下實(shí)現(xiàn)歸集，賦能千行百業(yè)。如醫(yī)療行業(yè)的衛(wèi)寧健康、保險(xiǎn)行業(yè)的新致軟件、教育行業(yè)的科大訊飛均憑借過(guò)去在垂類(lèi)行業(yè)的深耕，借助大模型實(shí)現(xiàn)知識(shí)的賦能應(yīng)用。展望未來(lái)，我們期待更多行業(yè)能夠在大模型賦能下實(shí)現(xiàn)行業(yè)知識(shí)萃取，各行業(yè)知識(shí)應(yīng)用有望百花齊放。

圖表：衛(wèi)寧健康推出醫(yī)療垂類(lèi)模型WiNGPT賦能問(wèn)診、報(bào)告生成等場(chǎng)景，未來(lái)計(jì)劃以Copilot形式融入WiNEX

注：公司預(yù)計(jì)WiNEX Copilot產(chǎn)品將于2023年10月Winning World2023大會(huì)上正式發(fā)布
資料來(lái)源：衛(wèi)寧健康微信公眾號(hào)，中金公司研究部

圖表：新致軟件Newtouch AI將企業(yè)數(shù)據(jù)與生成式AI模型連接，幫助企業(yè)快速構(gòu)建機(jī)器人應(yīng)用

資料來(lái)源：新致AI微信公眾號(hào)，中金公司研究部

圖表：科大訊飛將硬件產(chǎn)品搭載星火大模型，AI學(xué)習(xí)機(jī)通過(guò)分析用戶(hù)學(xué)情和知識(shí)圖譜提供類(lèi)人引導(dǎo)式輔學(xué)

資料來(lái)源：科大訊飛AI學(xué)習(xí)助手視頻號(hào)，中金公司研究部

圖表：AI Answer相關(guān)公司一覽

資料來(lái)源：各公司官網(wǎng)，中金公司研究部

本文作者：于鐘海、魏鸛霏、王之昊、韓蕊、胡安琪、譚哲賢，來(lái)源：中金點(diǎn)睛，原文標(biāo)題：《AI Answer：大模型助力B端落地先行范式》

于鐘海 SAC 執(zhí)證編號(hào)：S0080518070011 SFC CE Ref：BOP246

魏鸛霏 SAC 執(zhí)證編號(hào)：S0080523060019 SFC CE Ref：BSX734

王之昊 SAC 執(zhí)證編號(hào)：S0080522050001 SFC CE Ref：BSS168

韓蕊 SAC 執(zhí)證編號(hào)：S0080121080059

胡安琪 SAC 執(zhí)證編號(hào)：S0080122070070

譚哲賢 SAC 執(zhí)證編號(hào)：S0080122070047

風(fēng)險(xiǎn)提示及免責(zé)條款市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：