開源之爭(zhēng):馬斯克起訴OpenAI后宣布開源Grok
馬斯克宣布將在本周開源xAI的聊天機(jī)器人Grok,并且再度炮轟OpenAI是個(gè)謊言(OpenAI is a lie)。他曾在去年吐槽稱,OpenAI中的“Open”本意是開放源代碼,它是作為非營利性開放源代碼創(chuàng)建的,而現(xiàn)在它卻成了一個(gè)追求最大利潤的封閉源代碼。
本文引用地址:http://cafeforensic.com/article/202403/456249.htm早在去年11月,馬斯克在參與一場(chǎng)播客時(shí)就公開表示,OpenAI的“閉源”行為不可取,xAI的Grok將采取開源路線。
馬斯克旗下的AI
2023年7月,馬斯克成立了人工智能公司xAI。同年11月,xAI團(tuán)隊(duì)正式發(fā)布其首個(gè)AI大模型產(chǎn)品Grok。目前的Grok跟此前OpenAI發(fā)布的GPT-3.5形式差不多,但是測(cè)試結(jié)果顯示,它在數(shù)學(xué)、代碼和多學(xué)科知識(shí)評(píng)測(cè)中比GPT-3.5表現(xiàn)得更好。
Grok背靠馬斯克旗下的老牌社交媒體平臺(tái)X(前身為Twitter),使用了X上的大量數(shù)據(jù)進(jìn)行訓(xùn)練,且可以實(shí)時(shí)訪問X平臺(tái)的所有信息。馬斯克曾表示這是收購?fù)铺氐母郊痈@?,可以用來“喂養(yǎng)”人工智能,接受現(xiàn)實(shí)中人類發(fā)言和對(duì)話信息的訓(xùn)練。另外,他還有來自特斯拉的導(dǎo)航和視頻數(shù)據(jù),可能將使其團(tuán)隊(duì)開發(fā)的聊天機(jī)器人不限于文本生成。
目前并不清楚Grok背后哪些模型會(huì)開源,但通常來說,發(fā)布開源模型有助于社區(qū)展開大規(guī)模的測(cè)試和反饋,意味著模型本身的迭代速度也能加快。
當(dāng)然,馬斯克將xAI的大模型開源,本身也有可能一種運(yùn)營手段。假設(shè)馬斯克“說到做到”,外界將得以見到Grok背后的代碼,同時(shí)將其與Meta的Llama 2、法國的Mistral等開源賽道的主要玩家相互比較。
開源之爭(zhēng)
今年2月29日,馬斯克在舊金山法院起訴了OpenAI及其首席執(zhí)行官山姆·奧特曼,提出了包括違反合同、違反信托義務(wù)和不公平商業(yè)行為在內(nèi)的索賠。馬斯克稱,OpenAI選擇了不公開其研究和技術(shù),實(shí)際上已成為受微軟控制的閉源子公司,違背了其成立時(shí)的初衷,即為人類福祉而非利益開發(fā)人工智能。
除了一系列違約指控外,馬斯克還特意要求法院裁定OpenAI恢復(fù)開源;OpenAI方面也拿出證據(jù)稱,馬斯克在郵件中曾認(rèn)可OpenAI的不開源決定。
2023年3月,OpenAI發(fā)布了AI語言模型GPT-4,并分享了GPT-4的大量測(cè)試結(jié)果以及一些有趣的演示,但基本上沒有提供有關(guān)用于訓(xùn)練系統(tǒng)的數(shù)據(jù)、用于創(chuàng)建該系統(tǒng)的特定硬件或方法的信息。當(dāng)時(shí),馬斯克就開源問題稱OpenAI是作為開源的非營利性公司創(chuàng)立,目的是與谷歌抗衡,而現(xiàn)在卻成為封閉源代碼的公司 —— “如今落入了無情的壟斷企業(yè)之手”。對(duì)此,奧特曼表示自己沒有從這家初創(chuàng)公司大舉獲利,他理解馬斯克的批評(píng)是真實(shí)的擔(dān)憂,但是認(rèn)為他還沒有完全認(rèn)識(shí)到人工智能安全問題的復(fù)雜性。
全球科技巨頭在生成式人工智能的發(fā)展中已經(jīng)分化為開源和閉源兩種。
· 開源模型即開放源代碼,將模型的源代碼和技術(shù)細(xì)節(jié)公開,允許用戶根據(jù)自身需要對(duì)模型進(jìn)行使用和修改,目前,Meta的LLaMA、StabilityAI的Stable Diffusion、國內(nèi)阿里的通義千問都屬于開源模型。
· 閉源模型則與之相反,不開放源代碼和技術(shù)細(xì)節(jié),且不允許用戶對(duì)模型本身進(jìn)行更改。目前,OpenAI的ChatGPT、谷歌的Gemini、國內(nèi)的百度文心一言都屬于閉源模型。
總體而言,閉源模式更有利益保護(hù)知識(shí)產(chǎn)權(quán)和商業(yè)利益,讓模型提供方對(duì)模型的研發(fā)和優(yōu)化擁有更多的控制權(quán),確保模型的質(zhì)量和安全;而開源模式則讓技術(shù)得以共享,繁榮了開發(fā)者生態(tài),能夠吸引眾多人才加入,推動(dòng)大模型加速迭代和創(chuàng)新。
不過也有研究顯示,相較于開源來說,閉源模型相對(duì)更成熟、數(shù)據(jù)質(zhì)量更有保障。業(yè)內(nèi)的一個(gè)普遍共識(shí)是,目前閉源大模型的能力和性能總體領(lǐng)先于開源大模型。
評(píng)論