辰东,盗墓笔记,古风名字

全面進(jìn)化！GPT-4來了！

萬眾矚目的ChatGPT-4，真的來了。

北京時(shí)間3月15日凌晨，OpenAI發(fā)布了最新版本的GPT-4，瞬間引發(fā)全球市場的關(guān)注。

從目前官方解讀以及大量機(jī)構(gòu)的評測來看，“超出預(yù)期”依然是這一版GPT給人帶來的最大體驗(yàn)，具體而言，多模態(tài)的引入以及推理能力的大幅提升，讓GPT在“智能”層面有明顯躍遷。

目前，ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4，其他用戶需要排隊(duì)申請內(nèi)測。在應(yīng)用方面，微軟表示，新必應(yīng)搜索引擎正在運(yùn)行GPT-4。OpenAI還在官網(wǎng)展示了給摩根士丹利、多鄰國、By My Eyes等應(yīng)用GPT-4的案例。

多模態(tài)“更上一層樓”

美東時(shí)間3月14日，OpenAI宣布推出大型的多模態(tài)模型GPT-4。“GPT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”，并且“有更廣泛的常識和解決問題的能力，可以更準(zhǔn)確地解決難題”。OpenAI的CEO Sam Altman說：“這是我們迄今為止功能最強(qiáng)大的模型。”

“我們創(chuàng)建了GPT-4，這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。GPT-4是一個(gè)大型多模態(tài)模型（接受圖像和文本輸入，提供文本輸出），雖然在許多現(xiàn)實(shí)世界場景中的能力不如人類，但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平?！監(jiān)penAI介紹道。

GPT-4比上一個(gè)版本強(qiáng)在哪？OpenAI稱，雖然這兩個(gè)版本在隨意的談話中看起來很相似，但“當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，差異就會出現(xiàn)”，GPT-4更可靠、更有創(chuàng)意，并且能夠處理更細(xì)微的指令。

多模態(tài)的引入，讓此次發(fā)布的GPT相較上一代綜合體感明顯“更上一層樓”。

OpenAI稱，GPT-4比以往任何時(shí)候都更具創(chuàng)造性和協(xié)作性。它可以在創(chuàng)意和技術(shù)寫作任務(wù)上與用戶一起生成、編輯和迭代，比如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。

GPT-4可接受圖像作為輸入，并生成字幕、分類和分析。以上圖為例，輸入牛奶、雞蛋、面粉等食材的圖片，GPT-4可以識別圖片元素并輸出食材用途參考。

圖片笑點(diǎn)在哪里？GPT-4可以按順序描述出每一格的內(nèi)容，并總結(jié)出笑點(diǎn)。

此外，在文本內(nèi)容長度上，GPT-4能夠處理超過25000個(gè)單詞的文本，支持長篇內(nèi)容創(chuàng)作、延續(xù)對話以及文檔搜索和分析等應(yīng)用場景。

“篇幅的拓展讓GPT的應(yīng)用場景進(jìn)一步擴(kuò)大。”一位互聯(lián)網(wǎng)行業(yè)人士表示，這意味著GPT在To B端的能力進(jìn)一步加強(qiáng)。

此外，上周，微軟德國公司的首席技術(shù)官安德烈亞斯·布勞恩（Andreas Braun）在GPT-4的預(yù)告中強(qiáng)調(diào)了其多模態(tài)特征，包括視頻方面的可能性。但這一點(diǎn)尚未在已知信息中體現(xiàn)。

強(qiáng)推理實(shí)現(xiàn)能力躍遷

除了引入的多模態(tài)技術(shù)外，另一個(gè)頗引人矚目的升級，便是此次GPT-4所展現(xiàn)出的強(qiáng)大推理能力。

盡管在體感上，GPT-4在與人閑談上感覺與上一代差異不大。

但在其發(fā)布會上，OpenAI將之引入各類考試的測試中，結(jié)果卻頗為令人驚訝。

實(shí)驗(yàn)表明，GPT-4在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng)。

例如，GPT-4通過了模擬律師考試，且分?jǐn)?shù)在應(yīng)試者的前10%左右；相比之下，上一代GPT的得分在倒數(shù)10%左右。

英偉達(dá)AI科學(xué)家Jim Fan點(diǎn)評稱，GPT-4最強(qiáng)的其實(shí)就是推理能力。它在GRE、SAT、法學(xué)院考試上的得分，幾乎和人類考生沒有區(qū)別。也就是說，GPT-4可以全靠自己考進(jìn)斯坦福了。

而這種強(qiáng)大的推理能力最驚艷的亮相，或許就是在生成代碼上。

在此次發(fā)布會上，OpenAI總裁Greg Brockman在現(xiàn)場演示了GPT-4在這方面的能力。他直接在紙上畫了一個(gè)潦草的示意圖，拍照發(fā)給GPT，并要求其按照這個(gè)布局寫網(wǎng)頁代碼。

幾乎只需要數(shù)秒鐘的時(shí)間，相應(yīng)的代碼就完成了生成。

此外，發(fā)布會還展示了一個(gè)GPT-4的使用場景，那就是把程序運(yùn)行出錯(cuò)的信息甚至錯(cuò)誤信息截圖提交給GPT-4，僅憑這部分圖片信息，GPT-4都能自動查出錯(cuò)誤。

“這對于整個(gè)編程行業(yè)來說是具有顛覆性意義的?！鼻笆龌ヂ?lián)網(wǎng)人士表示，未來大量基礎(chǔ)性的編程都將由人工智能接手。據(jù)他透露，目前國內(nèi)許多的互聯(lián)網(wǎng)公司已經(jīng)引入GPT，輔助編寫程序，“以后這種替代的比例會進(jìn)一步提高?！?

也正因如此，此次發(fā)布會上，OpenAI也明確表示，將在ChatGPT Plus上提供GPT-4，并將其作為API提供給開發(fā)人員構(gòu)建應(yīng)用程序和服務(wù)。

安全性再受關(guān)注

人工智能性能的大幅提升，在令人欣喜的同時(shí)，也不免引發(fā)大眾的擔(dān)憂。

在一片關(guān)于GPT-4性能的熱議中，也有人擔(dān)心，如此智能要是被用在非法的地方，將會帶來怎樣的后果。

已經(jīng)火遍全球的ChatGPT最顯著的局限性之一就是“一本正經(jīng)地胡說八道”。也就是說，ChatGPT回答語言連貫自然、邏輯通順，但它的回答內(nèi)容不基于事實(shí)，而是基于語言模型。這使得人們驚艷于其對話水平的同時(shí)，無法信賴其提供的內(nèi)容。

在此次發(fā)布上，OpenAI稱，他們花了6個(gè)月的時(shí)間使用對抗性測試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)對GPT-4進(jìn)行迭代調(diào)整，從而在真實(shí)性、可控性等方面取得了有史以來最好的結(jié)果。

在OpenAI的內(nèi)部評估中，與上一代GPT相比，GPT-4響應(yīng)不允許的內(nèi)容的可能性降低了82%，生成事實(shí)回復(fù)的可能性提高了40%。

并且OpenAI加入了更多人類反饋，包括ChatGPT用戶提交的反饋，以改進(jìn)GPT-4的行為。OpenAI還與包括AI安全和安全性在內(nèi)的50多個(gè)領(lǐng)域的專家合作，進(jìn)行早期反饋。

此外，基礎(chǔ)設(shè)施方面，OpenAI表示GPT-4是在Microsoft Azure AI超級計(jì)算機(jī)上訓(xùn)練的。Azure的AI優(yōu)化基礎(chǔ)設(shè)施也使OpenAI能夠?qū)PT-4交付給全球用戶。

OpenAI也坦承，GPT-4仍然有許多已知的局限性，OpenAI正在努力解決這些問題，例如社會偏見等。

在GPT-4發(fā)布之后，“ChatGPT之父”Sam Altman表示：“它仍然是有缺陷的，仍然是有限的，在你花了更多的時(shí)間第一次使用它時(shí)，它似乎比實(shí)際情況更令人印象深刻?！?