7月6日， OpenAI在官網(wǎng)宣布，將組建一支由Ilya Sutskever（OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家）和Jan Leike領(lǐng)導(dǎo)的人工智能對(duì)齊團(tuán)隊(duì)，用來(lái)引導(dǎo)、控制超級(jí)智能，同時(shí)提升ChatGPT等產(chǎn)品的安全性。

OpenAI表示，4年之內(nèi)將解決這些難題，并將目前20%的算力用于該項(xiàng)目。

超級(jí)智能將是人類(lèi)發(fā)明的最具影響力的技術(shù)之一，可以幫助我們解決世界上許多難題。但超級(jí)智能的巨大力量也可能非常危險(xiǎn)，并導(dǎo)致人類(lèi)失去控制權(quán)，甚至滅絕人類(lèi)。雖然超級(jí)智能還很遙遠(yuǎn)，但OpenAI認(rèn)為，10年之內(nèi)就很有可能實(shí)現(xiàn)。

(相關(guān)資料圖)

目前，OpenAI還沒(méi)有一個(gè)明確的解決方案來(lái)引導(dǎo)或控制超級(jí)人工智能。當(dāng)下可控制的人工智能技術(shù)，例如，根據(jù)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)，依賴于人類(lèi)監(jiān)督的AI能力等。

但人類(lèi)無(wú)法可靠地監(jiān)督，比我們聰明多的AI系統(tǒng)，因此，我們目前的對(duì)齊技術(shù)無(wú)法擴(kuò)展到超級(jí)智能，需要新的科學(xué)技術(shù)突破。

4年內(nèi)解決超級(jí)智能對(duì)齊問(wèn)題

為了控制、引導(dǎo)超級(jí)智能對(duì)齊問(wèn)題，OpenAI組建了一支由Ilya Sutskever（OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家）和Jan Leike領(lǐng)導(dǎo)的人工智能對(duì)齊團(tuán)隊(duì)——Superalignment。

超級(jí)智能對(duì)齊從根本上來(lái)說(shuō)是一個(gè)機(jī)器學(xué)習(xí)問(wèn)題，所以，OpenAI尋求全球優(yōu)秀的機(jī)器學(xué)習(xí)人才加入這個(gè)團(tuán)隊(duì)共同實(shí)現(xiàn)這一偉大目標(biāo)。

同時(shí)該團(tuán)隊(duì)也是對(duì)OpenAI現(xiàn)有工作的補(bǔ)充，可提升ChatGPT等產(chǎn)品的安全性，包括非法濫用、經(jīng)濟(jì)破壞、虛假信息、偏見(jiàn)和歧視、數(shù)據(jù)隱私和其他可能出現(xiàn)的問(wèn)題。

OpenAI的方法

建立一個(gè)大致達(dá)到人類(lèi)水平的自動(dòng)對(duì)齊系統(tǒng)。然后，可以使用大量算力來(lái)擴(kuò)展工作，并調(diào)整超級(jí)智能。

1、開(kāi)發(fā)可擴(kuò)展的訓(xùn)練方法：為了針對(duì)人類(lèi)難以評(píng)估的任務(wù)提供訓(xùn)練方法，可以通過(guò)人工智能系統(tǒng)來(lái)協(xié)助評(píng)估，其他人工智能系統(tǒng)?（可擴(kuò)展的監(jiān)督）。此外，OpenAI希望了解和控制其模型，將監(jiān)督應(yīng)用到無(wú)法監(jiān)督的任務(wù)（泛化）上。

2、驗(yàn)證生成的模型：為了驗(yàn)證系統(tǒng)的一致性，OpenAI將自動(dòng)搜索有問(wèn)題的行為?（穩(wěn)定性）和有問(wèn)題的內(nèi)部結(jié)構(gòu)（自動(dòng)可解釋性）。

3、對(duì)整個(gè)對(duì)齊管道進(jìn)行壓力測(cè)試：可以通過(guò)故意訓(xùn)練未對(duì)準(zhǔn)的模型，來(lái)測(cè)試整個(gè)安全流程，并確認(rèn)技術(shù)檢測(cè)到最差的未對(duì)準(zhǔn)類(lèi)型（對(duì)抗性測(cè)試）。

OpenAI預(yù)計(jì)，隨著對(duì)超級(jí)智能對(duì)齊了解越來(lái)越多，研究重點(diǎn)將會(huì)發(fā)生重大變化，可能會(huì)增加全新的研究領(lǐng)域。未來(lái)，會(huì)分享更多有關(guān)技術(shù)研究路線圖的信息。

關(guān)于AI對(duì)齊

AI對(duì)齊是指，使人工智能系統(tǒng)的目標(biāo)和行為，與人類(lèi)價(jià)值觀和目標(biāo)保持一致。這是AI安全和倫理中的一個(gè)重要環(huán)節(jié)。

AI對(duì)齊問(wèn)題涉及到如何設(shè)計(jì)和實(shí)施人工智能系統(tǒng)，以便它們執(zhí)行的任務(wù)或做出的決策能夠反映出設(shè)計(jì)者或用戶的意圖和價(jià)值觀。這個(gè)問(wèn)題在高級(jí)AI（例如，通用人工智能或超級(jí)人工智能）中更為重要。

因?yàn)檫@些AI可能具有極大的自主性和能力，如果它們的目標(biāo)與人類(lèi)的目標(biāo)不一致，可能會(huì)帶來(lái)嚴(yán)重的后果。

解決AI對(duì)齊問(wèn)題需要在倫理、決策理論、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域進(jìn)行深入的研究。例如，需要研究如何在沒(méi)有明確指示的情況下，讓AI推斷出人類(lèi)的價(jià)值觀，以及如何設(shè)計(jì)可以安全地學(xué)習(xí)和改進(jìn)其行為的AI系統(tǒng)。

本文來(lái)源：AIGC開(kāi)放社區(qū)，原文標(biāo)題：《OpenAI：4年內(nèi)控制超級(jí)智能，提升ChatGPT等安全》

風(fēng)險(xiǎn)提示及免責(zé)條款市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：