AI的“安卓時刻”:開源大模型正在追上谷歌和ChatGPT
今年2月,Meta發(fā)布開源大語言模型LLaMA,開啟AI“安卓時刻”。
幾周之內,學術界的一些學者就將這些模型轉化為開源軟件,為ChatGPT和其他專有人工智能軟件的免費替代品提供動力。
據(jù)The Information周一報道,加州大學伯克利分校計算機科學教授Ion Stoica表示,免費的AI模型現(xiàn)在在性能上“相當接近”谷歌和ChatGPT開發(fā)商OpenAI的專有模型,大多數(shù)軟件開發(fā)人員最終將選擇使用免費的模型。據(jù)悉,Stoica利用Meta的技術幫助開發(fā)了一個關鍵的AI開源模型。
(資料圖片)
這讓人想起不久前谷歌的一份泄密文件,谷歌研究員在這份泄密文件中坦言,谷歌沒有護城河,OpenAI也是如此,與開源AI競爭將難以占據(jù)優(yōu)勢。
文件中提到:
“雖然我們的模型在質量上仍有一點優(yōu)勢,但差距正在以令人驚訝的速度迅速縮小。開源模型訓練速度更快,可定制性更強,更私密,而且比同類產品能力更出色。他們正在用100美元和130億的參數(shù)做一些谷歌1000萬美元和540億的參數(shù)難以企及的事情,而且在短短幾周內就能做到,而不是幾個月?!?/p>
這也就是說,如果以上都為真,開源人工智能可能會顛覆谷歌、OpenAI、微軟和其他出售專有模型使用權的公司的商業(yè)模式。
分析稱,開源人工智能可以讓任何人以低廉的成本獲得強大的人工智能工具,Meta也可從中獲得回報。
專注于專有模型可能會落后
Stoica是使用Meta的研究開發(fā)Vicuna的學者之一,Vicuna是一種開源語言理解模型,于今年3月發(fā)布。Vicuna的質量和開源AI的快速發(fā)展促使谷歌高級工程師Luke Sernau在泄密文件中警告同事,他們的公司在追趕OpenAI的過程中專注于專有模型可能會落后。
他說,對于用戶而言,如果有一個沒有使用限制、免費、高質量的替代品,誰還會為谷歌的產品付費呢?他還說,開源AI的開發(fā)正在“掠奪我們”,并補充說“谷歌應該讓自己成為開源社區(qū)的領導者”,并“放棄對我們模型的一些控制權”。
這份泄密文件引起了整個行業(yè)的共鳴,包括一些谷歌員工,盡管該文件的論點可能夸大了開源人工智能的能力,低估了它的成本和其他風險,但大多數(shù)AI從業(yè)者都同意泄密文件的結論之一,即Meta將從發(fā)布其模型中獲益。Meta在內部使用AI模型進行內容推薦和廣告定位,隨著開發(fā)人員改進Meta發(fā)布的模型,Meta將能夠將這些改進整合到其內部AI中。
谷歌并沒有對AI軟件采取完全專有的方法。早在ChatGPT出現(xiàn)之前的2020年,它就發(fā)布了一個開源語言模型T5,使開發(fā)人員能夠構建可以完成翻譯和摘要等任務的軟件。谷歌隨后還發(fā)布了一個更高級的版本,F(xiàn)lan-T5。但據(jù)Stoica和其他從業(yè)人員說,Meta發(fā)布的軟件使谷歌的模型得到了重大改進,這使得工程師們更有可能選擇基于Meta軟件的模型。
報道:OpenAI的開源語言模型也要來
據(jù)一位知情人士透露,不止是Meta,谷歌的主要AI競爭對手OpenAI也正準備向公眾發(fā)布一種新的開源語言模型,該計劃此前從未被報道過。
目前尚不清楚OpenAI即將推出的開源軟件,是否會搶走使用Meta模型開發(fā)的軟件的風頭。但分析稱,它不太可能發(fā)布一款能與它正在銷售的專有模型GPT競爭的模型。OpenAI?270億美元的私人估值取決于未來,盡管GPT的前兩個版本是開源的,但GPT4不是開源的。
像Vicuna這樣的開源模型訓練成本低至幾百美元,讓用戶可以選擇避免向軟件提供商支付昂貴的費用。結果是,最近幾周,開源替代品激增。
除了基于Meta軟件的Vicuna等模型外,工程師還可以從德國非營利組織LAION以及Databricks和Stability AI等初創(chuàng)公司中選擇其他模型。Stoica創(chuàng)建了一個網(wǎng)站,試圖評估那些開源模型與專有模型(如OpenAI的GPT-4)的質量。
Stoica說,與開源軟件相比,谷歌仍然有兩個優(yōu)勢。1、如果谷歌利用其大量的用戶數(shù)據(jù),它的模型可以更好地用于某些特殊目的,例如內容推薦。2、谷歌在管理大型計算機基礎設施方面的專業(yè)知識意味著它將能夠以更低的成本運行AI軟件模型,包括用于其云客戶。
與此同時,OpenAI在從數(shù)百萬人與ChatGPT交互的方式中收集數(shù)據(jù)方面取得了領先,這無疑有助于它改進AI軟件,而且OpenAI與微軟達成了一項私下協(xié)議,可以使用微軟的計算基礎設施。
但開源AI模型將允許更多公司使用專有數(shù)據(jù)自行解決問題。Stoica說,例如,一家航空公司可以使用其數(shù)百萬客戶服務電話的數(shù)據(jù)來創(chuàng)建自動響應。彭博社在3月份宣布,該媒體使用其數(shù)據(jù)來訓練一種更善于理解金融信息的機器學習模型。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據(jù)此投資,責任自負。關鍵詞: