色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁 > 博客 > OpenAI發(fā)布多模態(tài)模型GPT-4:已經(jīng)能在SAT考試中擊敗90%人類!

          OpenAI發(fā)布多模態(tài)模型GPT-4:已經(jīng)能在SAT考試中擊敗90%人類!

          發(fā)布人:芯智訊 時間:2023-03-19 來源:工程師 發(fā)布文章

          北京時間3月15日凌晨,ChatGPT開發(fā)商OpenAI 發(fā)布了發(fā)布了全新的多模態(tài)預(yù)訓練大模型 GPT-4,可以更可靠、更具創(chuàng)造力、能處理更細節(jié)的指令,根據(jù)圖片和文字提示都能生成相應(yīng)內(nèi)容。

          具體來說來說,GPT-4 相比上一代的模型,實現(xiàn)了飛躍式提升:支持圖像和文本輸入,擁有強大的識圖能力;大幅提升了文字輸入限制,在ChatGPT模式下,GPT-4可以處理超過2.5萬字的文本,可以處理一些更加細節(jié)的指令;回答準確性也得到了顯著提高。

          圖片

          OpenAI表示,它使用的是微軟(MSFT.US)Azure訓練模型,微軟此前已經(jīng)向其投資了數(shù)十億美元。OpenAI沒有公布具體模型大小的細節(jié),也沒有公布用來訓練模型的硬件,理由是“競爭情況”。

          根據(jù)此前資料顯示,發(fā)布于 2020 年的 GPT-3 有 1750 億個參數(shù),而GPT-4 的參數(shù)據(jù)猜測可能將達到約 100 萬億個參數(shù)。這也使得GPT-4 在能力、范圍和潛力方面相比GPT-3,將擁有一個質(zhì)的飛躍。

          OpenAI 指出,相較前一代的GPT-3.5, GPT-4在許多專業(yè)測試中表現(xiàn)出超過絕大多數(shù)人類的水平。在包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數(shù)學部分和證據(jù)性閱讀與寫作部分的考試,在這些測試中,它的得分均高于88%的應(yīng)試者。在美國法學院畢業(yè)生參加的律師資格考試中,舊模型得分在應(yīng)試者中排名后10%,而新模型得分在應(yīng)試者中排名約前10%,即擊敗了約90%的人類。

          圖片

          OpenAI 總裁Greg Brockman 稱,GPT-4 可拍攝一張簡單網(wǎng)站的手繪模型照片,并以此為基礎(chǔ)創(chuàng)建真正的網(wǎng)站。根據(jù)實際演示,GPT-4 還能計算稅收。

          OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務(wù)復(fù)雜到一定程度時,差異就表現(xiàn)出來了,GPT-4模型將更可靠、更有創(chuàng)造力,能夠處理更微妙的指令。不僅能夠產(chǎn)生更少的錯誤答案,更少地偏離話題,更少地談?wù)摻稍掝},甚至在許多標準化測試中比人類表現(xiàn)得更好?!霸谖覀兊膬?nèi)部評估中,它產(chǎn)生正確回應(yīng)的可能性比GPT-3.5高40%。”

          不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。它仍然存在“幻覺”或自己編造的主要問題,而且在事實問題上并不可靠。它仍然傾向于在錯誤的時候堅持自己是正確的。

          OpenAI CEO Sam Altman 在Twitter 上表示GPT-4 是最有能力和符合人類價值觀和意圖的模型,盡管它仍具有缺陷。GPT-4 回應(yīng)無法生成內(nèi)容請求的可能性比前一代低82%,在部分真實性測試中得分高40%。

          據(jù)微軟表示,他們與 OpenAI 共同開發(fā)的 Bing Chat 目前正在基于 GPT-4運行。

          在GPT-4 發(fā)布后,OpenAI 也直接升級了 ChatGPT。文字輸入功能將供給ChatGPT Plus 訂閱者(可以在 chat.openai.com 上獲得),但圖像輸入功能仍是預(yù)覽版本。如果要訪問 GPT-4 API(它使用與 gpt-3.5-turbo 相同的 ChatCompletions API),用戶可以注冊等待。OpenAI 會邀請部分開發(fā)者體驗。

          至于價格方面,定價為每 1k 個 prompt token 0.03 美元,每 1k 個 completion token 0.06 美元。默認速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。GPT-4 的上下文長度為 8,192 個 token。OpenAI 還提供了 32,768 個 token 上下文(約 50 頁文本)版本的有限訪問,該版本也將隨著時間自動更新(當前版本 gpt-4-32k-0314,也支持到 6 月 14 日)。定價為每 1K prompt token 0.06 美元和每 1k completion token 0.12 美元。

          值得一提的是,谷歌于當?shù)貢r間周二宣布推出協(xié)作軟件“魔杖”(magic wand),幾乎可以起草任何文件。


          *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



          關(guān)鍵詞: AI

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉