OpenAI發(fā)布多模態(tài)模型GPT-4:已經(jīng)能在SAT考試中擊敗90%人類!
北京時間3月15日凌晨,ChatGPT開發(fā)商OpenAI 發(fā)布了發(fā)布了全新的多模態(tài)預(yù)訓練大模型 GPT-4,可以更可靠、更具創(chuàng)造力、能處理更細節(jié)的指令,根據(jù)圖片和文字提示都能生成相應(yīng)內(nèi)容。
具體來說來說,GPT-4 相比上一代的模型,實現(xiàn)了飛躍式提升:支持圖像和文本輸入,擁有強大的識圖能力;大幅提升了文字輸入限制,在ChatGPT模式下,GPT-4可以處理超過2.5萬字的文本,可以處理一些更加細節(jié)的指令;回答準確性也得到了顯著提高。
OpenAI表示,它使用的是微軟(MSFT.US)Azure訓練模型,微軟此前已經(jīng)向其投資了數(shù)十億美元。OpenAI沒有公布具體模型大小的細節(jié),也沒有公布用來訓練模型的硬件,理由是“競爭情況”。
根據(jù)此前資料顯示,發(fā)布于 2020 年的 GPT-3 有 1750 億個參數(shù),而GPT-4 的參數(shù)據(jù)猜測可能將達到約 100 萬億個參數(shù)。這也使得GPT-4 在能力、范圍和潛力方面相比GPT-3,將擁有一個質(zhì)的飛躍。
OpenAI 指出,相較前一代的GPT-3.5, GPT-4在許多專業(yè)測試中表現(xiàn)出超過絕大多數(shù)人類的水平。在包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數(shù)學部分和證據(jù)性閱讀與寫作部分的考試,在這些測試中,它的得分均高于88%的應(yīng)試者。在美國法學院畢業(yè)生參加的律師資格考試中,舊模型得分在應(yīng)試者中排名后10%,而新模型得分在應(yīng)試者中排名約前10%,即擊敗了約90%的人類。
OpenAI 總裁Greg Brockman 稱,GPT-4 可拍攝一張簡單網(wǎng)站的手繪模型照片,并以此為基礎(chǔ)創(chuàng)建真正的網(wǎng)站。根據(jù)實際演示,GPT-4 還能計算稅收。
OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務(wù)復(fù)雜到一定程度時,差異就表現(xiàn)出來了,GPT-4模型將更可靠、更有創(chuàng)造力,能夠處理更微妙的指令。不僅能夠產(chǎn)生更少的錯誤答案,更少地偏離話題,更少地談?wù)摻稍掝},甚至在許多標準化測試中比人類表現(xiàn)得更好?!霸谖覀兊膬?nèi)部評估中,它產(chǎn)生正確回應(yīng)的可能性比GPT-3.5高40%。”
不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。它仍然存在“幻覺”或自己編造的主要問題,而且在事實問題上并不可靠。它仍然傾向于在錯誤的時候堅持自己是正確的。
OpenAI CEO Sam Altman 在Twitter 上表示GPT-4 是最有能力和符合人類價值觀和意圖的模型,盡管它仍具有缺陷。GPT-4 回應(yīng)無法生成內(nèi)容請求的可能性比前一代低82%,在部分真實性測試中得分高40%。
據(jù)微軟表示,他們與 OpenAI 共同開發(fā)的 Bing Chat 目前正在基于 GPT-4運行。
在GPT-4 發(fā)布后,OpenAI 也直接升級了 ChatGPT。文字輸入功能將供給ChatGPT Plus 訂閱者(可以在 chat.openai.com 上獲得),但圖像輸入功能仍是預(yù)覽版本。如果要訪問 GPT-4 API(它使用與 gpt-3.5-turbo 相同的 ChatCompletions API),用戶可以注冊等待。OpenAI 會邀請部分開發(fā)者體驗。
至于價格方面,定價為每 1k 個 prompt token 0.03 美元,每 1k 個 completion token 0.06 美元。默認速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。GPT-4 的上下文長度為 8,192 個 token。OpenAI 還提供了 32,768 個 token 上下文(約 50 頁文本)版本的有限訪問,該版本也將隨著時間自動更新(當前版本 gpt-4-32k-0314,也支持到 6 月 14 日)。定價為每 1K prompt token 0.06 美元和每 1k completion token 0.12 美元。
值得一提的是,谷歌于當?shù)貢r間周二宣布推出協(xié)作軟件“魔杖”(magic wand),幾乎可以起草任何文件。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。