全面進(jìn)化!GPT-4來了!
萬眾矚目的ChatGPT-4,真的來了。
北京時(shí)間3月15日凌晨,OpenAI發(fā)布了最新版本的GPT-4,瞬間引發(fā)全球市場的關(guān)注。
從目前官方解讀以及大量機(jī)構(gòu)的評測來看,“超出預(yù)期”依然是這一版GPT給人帶來的最大體驗(yàn),具體而言,多模態(tài)的引入以及推理能力的大幅提升,讓GPT在“智能”層面有明顯躍遷。
目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊(duì)申請內(nèi)測。在應(yīng)用方面,微軟表示,新必應(yīng)搜索引擎正在運(yùn)行GPT-4。OpenAI還在官網(wǎng)展示了給摩根士丹利、多鄰國、By My Eyes等應(yīng)用GPT-4的案例。
多模態(tài)“更上一層樓”
美東時(shí)間3月14日,OpenAI宣布推出大型的多模態(tài)模型GPT-4。“GPT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”,并且“有更廣泛的常識和解決問題的能力,可以更準(zhǔn)確地解決難題”。OpenAI的CEO Sam Altman說:“這是我們迄今為止功能最強(qiáng)大的模型。”
“我們創(chuàng)建了GPT-4,這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。GPT-4是一個(gè)大型多模態(tài)模型(接受圖像和文本輸入,提供文本輸出),雖然在許多現(xiàn)實(shí)世界場景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平?!監(jiān)penAI介紹道。
GPT-4比上一個(gè)版本強(qiáng)在哪?OpenAI稱,雖然這兩個(gè)版本在隨意的談話中看起來很相似,但“當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會出現(xiàn)”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令。
多模態(tài)的引入,讓此次發(fā)布的GPT相較上一代綜合體感明顯“更上一層樓”。
OpenAI稱,GPT-4比以往任何時(shí)候都更具創(chuàng)造性和協(xié)作性。它可以在創(chuàng)意和技術(shù)寫作任務(wù)上與用戶一起生成、編輯和迭代,比如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。
GPT-4可接受圖像作為輸入,并生成字幕、分類和分析。以上圖為例,輸入牛奶、雞蛋、面粉等食材的圖片,GPT-4可以識別圖片元素并輸出食材用途參考。
圖片笑點(diǎn)在哪里?GPT-4可以按順序描述出每一格的內(nèi)容,并總結(jié)出笑點(diǎn)。
此外,在文本內(nèi)容長度上,GPT-4能夠處理超過25000個(gè)單詞的文本,支持長篇內(nèi)容創(chuàng)作、延續(xù)對話以及文檔搜索和分析等應(yīng)用場景。
“篇幅的拓展讓GPT的應(yīng)用場景進(jìn)一步擴(kuò)大。”一位互聯(lián)網(wǎng)行業(yè)人士表示,這意味著GPT在To B端的能力進(jìn)一步加強(qiáng)。
此外,上周,微軟德國公司的首席技術(shù)官安德烈亞斯·布勞恩(Andreas Braun)在GPT-4的預(yù)告中強(qiáng)調(diào)了其多模態(tài)特征,包括視頻方面的可能性。但這一點(diǎn)尚未在已知信息中體現(xiàn)。
強(qiáng)推理實(shí)現(xiàn)能力躍遷
除了引入的多模態(tài)技術(shù)外,另一個(gè)頗引人矚目的升級,便是此次GPT-4所展現(xiàn)出的強(qiáng)大推理能力。
盡管在體感上,GPT-4在與人閑談上感覺與上一代差異不大。
但在其發(fā)布會上,OpenAI將之引入各類考試的測試中,結(jié)果卻頗為令人驚訝。
實(shí)驗(yàn)表明,GPT-4在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng)。
例如,GPT-4通過了模擬律師考試,且分?jǐn)?shù)在應(yīng)試者的前10%左右;相比之下,上一代GPT的得分在倒數(shù)10%左右。
英偉達(dá)AI科學(xué)家Jim Fan點(diǎn)評稱,GPT-4最強(qiáng)的其實(shí)就是推理能力。它在GRE、SAT、法學(xué)院考試上的得分,幾乎和人類考生沒有區(qū)別。也就是說,GPT-4可以全靠自己考進(jìn)斯坦福了。
而這種強(qiáng)大的推理能力最驚艷的亮相,或許就是在生成代碼上。
在此次發(fā)布會上,OpenAI總裁Greg Brockman在現(xiàn)場演示了GPT-4在這方面的能力。他直接在紙上畫了一個(gè)潦草的示意圖,拍照發(fā)給GPT,并要求其按照這個(gè)布局寫網(wǎng)頁代碼。
幾乎只需要數(shù)秒鐘的時(shí)間,相應(yīng)的代碼就完成了生成。
此外,發(fā)布會還展示了一個(gè)GPT-4的使用場景,那就是把程序運(yùn)行出錯(cuò)的信息甚至錯(cuò)誤信息截圖提交給GPT-4,僅憑這部分圖片信息,GPT-4都能自動查出錯(cuò)誤。
“這對于整個(gè)編程行業(yè)來說是具有顛覆性意義的?!鼻笆龌ヂ?lián)網(wǎng)人士表示,未來大量基礎(chǔ)性的編程都將由人工智能接手。據(jù)他透露,目前國內(nèi)許多的互聯(lián)網(wǎng)公司已經(jīng)引入GPT,輔助編寫程序,“以后這種替代的比例會進(jìn)一步提高?!?
也正因如此,此次發(fā)布會上,OpenAI也明確表示,將在ChatGPT Plus上提供GPT-4,并將其作為API提供給開發(fā)人員構(gòu)建應(yīng)用程序和服務(wù)。
安全性再受關(guān)注
人工智能性能的大幅提升,在令人欣喜的同時(shí),也不免引發(fā)大眾的擔(dān)憂。
在一片關(guān)于GPT-4性能的熱議中,也有人擔(dān)心,如此智能要是被用在非法的地方,將會帶來怎樣的后果。
已經(jīng)火遍全球的ChatGPT最顯著的局限性之一就是“一本正經(jīng)地胡說八道”。也就是說,ChatGPT回答語言連貫自然、邏輯通順,但它的回答內(nèi)容不基于事實(shí),而是基于語言模型。這使得人們驚艷于其對話水平的同時(shí),無法信賴其提供的內(nèi)容。
在此次發(fā)布上,OpenAI稱,他們花了6個(gè)月的時(shí)間使用對抗性測試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)對GPT-4進(jìn)行迭代調(diào)整,從而在真實(shí)性、可控性等方面取得了有史以來最好的結(jié)果。
在OpenAI的內(nèi)部評估中,與上一代GPT相比,GPT-4響應(yīng)不允許的內(nèi)容的可能性降低了82%,生成事實(shí)回復(fù)的可能性提高了40%。
并且OpenAI加入了更多人類反饋,包括ChatGPT用戶提交的反饋,以改進(jìn)GPT-4的行為。OpenAI還與包括AI安全和安全性在內(nèi)的50多個(gè)領(lǐng)域的專家合作,進(jìn)行早期反饋。
此外,基礎(chǔ)設(shè)施方面,OpenAI表示GPT-4是在Microsoft Azure AI超級計(jì)算機(jī)上訓(xùn)練的。Azure的AI優(yōu)化基礎(chǔ)設(shè)施也使OpenAI能夠?qū)PT-4交付給全球用戶。
OpenAI也坦承,GPT-4仍然有許多已知的局限性,OpenAI正在努力解決這些問題,例如社會偏見等。
在GPT-4發(fā)布之后,“ChatGPT之父”Sam Altman表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的時(shí)間第一次使用它時(shí),它似乎比實(shí)際情況更令人印象深刻?!?
? Copyright 2013 南京奧特賽人工智能技術(shù)研發(fā)有限公司 版權(quán)所有 備案號:蘇ICP備19032300號-1 蘇公網(wǎng)安備32011602010459 技術(shù)支持:科威鯨網(wǎng)絡(luò)