色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁(yè) > 博客 > 一張估值20億的“笑臉”,正在拆掉OpenAI的圍墻

          一張估值20億的“笑臉”,正在拆掉OpenAI的圍墻

          發(fā)布人:硅星人 時(shí)間:2023-04-14 來源:工程師 發(fā)布文章

          Warning: file_get_contents(): SSL: connection timeout in /var/www/html/www.edw.com.cn/www/rootapp/controllersspace/ArticlesmanageController.php on line 220 Warning: file_get_contents(): Failed to enable crypto in /var/www/html/www.edw.com.cn/www/rootapp/controllersspace/ArticlesmanageController.php on line 220 Warning: file_get_contents(https://mmbiz.qpic.cn/mmbiz_png/cn2WtQ1Q5KQAQL2y4WJLZZF39kwOGoMOtBARSqMdnLQnfXAoPQ10iao9ftpN0iaCyIe4tSJJXVlibAakop8ukpVzw/640?wx_fmt=png&tp=wxpic&wxfrom=5&wx_lazy=1&wx_co=1): failed to open stream: operation failed in /var/www/html/www.edw.com.cn/www/rootapp/controllersspace/ArticlesmanageController.php on line 220

          它正成為人工智能界的Github


          文| Juny  編輯| VickyXiao



          由ChatGPT引發(fā)的人工智能風(fēng)潮還在猛烈地刮著。但從各個(gè)角度來看,目前這都是一個(gè)巨頭爭(zhēng)霸的戰(zhàn)場(chǎng):更大的模型、更強(qiáng)的算力、更多的用戶、更雄厚的資金……這些都似乎成為了想要加入這場(chǎng)角逐的門票。與此同時(shí),核心技術(shù)的研究也逐漸開放走向封閉。

          而在這高墻正在筑起的過程中,也有一些新銳的創(chuàng)業(yè)公司想要高舉旗幟來一場(chǎng)革命。其中,尤其引人注目的是一家名為Hugging Face開源創(chuàng)業(yè)公司。

          目前,Hugging Face已經(jīng)是全球最受歡迎的開源機(jī)器學(xué)習(xí)社區(qū)和平臺(tái),不僅創(chuàng)下了GitHub有史以來增長(zhǎng)最快的AI項(xiàng)目記錄,估值也一路沖破了20億美元。近期,微軟和浙江大學(xué)聯(lián)合發(fā)布的一篇關(guān)于HuggingGPT的論文更是把Hugging Face推到了舞臺(tái)中心,也讓更多人關(guān)注到了當(dāng)前這股與眾不同的人工智能發(fā)展力量。

          |HuggingGPT火了,Hugging是啥?

          本月初,微軟亞洲研究院和浙江大學(xué)聯(lián)合發(fā)布了一項(xiàng)最新的名為HuggingGPT的研究,介紹了一個(gè)全新的協(xié)作系統(tǒng),讓開發(fā)者能夠在ChatGPT的幫助下快速、準(zhǔn)確地去選擇合適的人工智能模型,從而完成包括文字、視頻、語(yǔ)音等多模態(tài)在內(nèi)的復(fù)雜任務(wù)。

          該項(xiàng)目目前已經(jīng)在Github上開源,還有一個(gè)超拉風(fēng)的名字叫JARVIS(沒錯(cuò),就是跟鋼鐵俠的助手一個(gè)名字)。在這個(gè)研究中,主要涉及到了兩個(gè)主體,一個(gè)是眾所周知的ChatGPT,另一個(gè)則是AI社區(qū)Hugging Face。

          圖片圖片來自HuggingGPT研究論文

          那么Hugging Face是做什么的?

          簡(jiǎn)單來說,Hugging Face是一個(gè)針對(duì)人工智能的開源平臺(tái),用戶可以在上邊發(fā)布和共享預(yù)訓(xùn)練模型、數(shù)據(jù)集和演示文件等。目前Hugging Face上已經(jīng)共享了超過10萬(wàn)個(gè)預(yù)訓(xùn)練模型,1萬(wàn)多個(gè)數(shù)據(jù)集,包括微軟、谷歌、Bloomberg、英特爾等各個(gè)行業(yè)超過1萬(wàn)家機(jī)構(gòu)都在使用Hugging Face的產(chǎn)品。

          在HuggingGPT中,ChatGPT通過扮演了“操作大腦”的角色,能夠自動(dòng)解析用戶提出的需求,接著在 Hugging Face 的“AI模型池”里進(jìn)行自動(dòng)模型選擇、執(zhí)行和報(bào)告,為開發(fā)者們開發(fā)更復(fù)雜的人工智能程序提供了極大的便利。

          雖然在模型上ChatGPT跟Hugging Face能夠牽手,但從本質(zhì)上來說,Hugging Face跟OpenAI目前是在做兩個(gè)相反方向的事。其中最大的不同點(diǎn)在于,在開發(fā)者服務(wù)方面,OpenAI現(xiàn)在正在搭建人工智能開發(fā)的圍墻,僅允許滿足條件的機(jī)構(gòu)和個(gè)人進(jìn)入,但Hugging Face則希望每個(gè)人都可以訪問生成式 AI 模型,包括各類企業(yè)和所有普通開發(fā)者。

          今年2月,OpenAI上線了一個(gè)名為Foundry的新開發(fā)者平臺(tái),允戶可以在這個(gè)平臺(tái)上運(yùn)行OpenAI最新的機(jī)器學(xué)習(xí)模型,但在產(chǎn)品的描述中,OpenAI明確表示Foundry是為運(yùn)行較大工作負(fù)載的尖端客戶設(shè)計(jì),而根據(jù)一份價(jià)格表顯示,即使是 GPT-3.5 的輕量級(jí)版本,三個(gè)月費(fèi)用高達(dá)7.8萬(wàn)美元,一年費(fèi)用為 26.4萬(wàn)美元。

          就在Foundry發(fā)布后,Hugging face便立刻宣布了其與 AWS 的最新合作伙伴關(guān)系,并發(fā)出了“讓人工智能走向開放”的呼吁。通過該合作,任何開發(fā)人員都將能夠使用 AWS 的托管服務(wù)并處理 Hugging Face 上可用的任何模型。

          圖片

          圖片來自Hugging face CTO推特

          在現(xiàn)在巨頭林立的人工智能戰(zhàn)場(chǎng)上,Hugging Face就像是一支強(qiáng)有力的民間力量。當(dāng)巨頭們都在努力保持自己生成式 AI 的霸主地位的時(shí)候,Hugging Face 的目標(biāo)則是尋找各種途徑來保持 AI 研究空間的開放。

          而這樣特點(diǎn)也讓Hugging Face目前頗有一些“中立”的色彩。無論微軟、谷歌、亞馬遜、Meta這些大公司打得再激烈,但它們幾乎全都是Hugging Face的支持者。

          那么,Hugging Face究竟是如何發(fā)展起來的,它具體做著什么樣的業(yè)務(wù)?

          |一次歪打正著的創(chuàng)業(yè),造就AI界的頂流“笑臉”

          在普通人的眼中,人工智能一向都屬于“冷感”很強(qiáng)的技術(shù)領(lǐng)域,無論是充斥著大量數(shù)字、模型的算法,還是由各種機(jī)械零件組裝成的機(jī)器人,都不免讓人感到有些距離感。但作為專為人工智能開發(fā)者服務(wù)的Hugging Face卻主打了一個(gè)反差萌,笑臉Emoji再加上一雙攤開的小手,logo甚至有點(diǎn)過份可愛。

          圖片

          之所以有這樣一個(gè)可愛的logo,是因?yàn)橐婚_始Hugging Face做的產(chǎn)品其實(shí)是一款針對(duì)青少年群體的聊天機(jī)器人。

          當(dāng)時(shí)Hugging Face的想法是基于自然語(yǔ)言處理 (NLP) 的人工智能技術(shù),來為年輕人們開發(fā)一個(gè)帶有娛樂性、類似于電子寵物一樣的個(gè)性化聊天機(jī)器人,讓大家可以在無聊的時(shí)候跟它聊八卦、問它問題、讓它生成一些有趣的圖片之類的事情。

          這種新穎的人機(jī)社交模式得到了一些關(guān)注。2017年3月9號(hào),Hugging Face App在iOS App Store正式推出,并拿到了包括SV Angel、NBA球星杜蘭特在內(nèi)的120萬(wàn)美元的天使投資。此后一年多,Hugging Face都一直圍繞著自己的聊天機(jī)器人業(yè)務(wù)在做著自然語(yǔ)言理解的相關(guān)訓(xùn)練并發(fā)布相關(guān)的產(chǎn)品,高峰時(shí)期每天處理的消息數(shù)量達(dá)到了1百萬(wàn)條。在2018年5月,它又獲得了400萬(wàn)美元的種子輪融資。

          圖片Hugging Face聊天軟件界面

          雖然發(fā)展的還算不錯(cuò),但由于當(dāng)時(shí)的人工智能的理解能力和聊天水平遠(yuǎn)不及ChatGPT這樣智能有趣,再加上并非剛需的業(yè)務(wù)場(chǎng)景,Hugging Face的規(guī)模一直都難以擴(kuò)大。

          但為了開發(fā)這個(gè)聊天機(jī)器人,Hugging Face的團(tuán)隊(duì)做了一個(gè)很重要的事,那就是構(gòu)建了一個(gè)底層庫(kù)來容納各種機(jī)器學(xué)習(xí)模型和各種類型的數(shù)據(jù)集。包括幫助訓(xùn)練聊天機(jī)器人檢測(cè)文本消息情緒、生成連貫的響應(yīng)、理解不同對(duì)話主題等,并且在GitHub上始終以開源項(xiàng)目的形式持續(xù)發(fā)布該底層庫(kù)的一些內(nèi)容。

          就這樣不溫不火地發(fā)展了一段時(shí)間后,2018年底,Hugging Face迎來了一個(gè)重要的轉(zhuǎn)折。

          當(dāng)年11月,谷歌宣布推出基于雙向 Transformer 的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型BERT,瞬間成為了自然語(yǔ)言理解領(lǐng)域最受開發(fā)者關(guān)注的模型。但一開始,Google只發(fā)布了BERT的TensorFlow版本,Hugging Face就想為啥沒有Pytorch版本呢?于是Hugging Face創(chuàng)始人之一的Thomas Wolf就用幾天的時(shí)間完成并開源了PyTorch-BERT,但沒想到,就是這么一個(gè)“無心插柳”的項(xiàng)目讓Hugging Face一炮而紅。

          借著BERT的東風(fēng),Hugging Face的Pytorch-pretrained-BERT發(fā)布3個(gè)多月后,快速達(dá)成了在Github上5000+ 星標(biāo)的成就,到了7月份其Star數(shù)量已經(jīng)超過了1萬(wàn),發(fā)展速度遠(yuǎn)超其他同類開源項(xiàng)目,在Github的AI項(xiàng)目領(lǐng)域里一飛沖天。

          在這樣的發(fā)展勢(shì)頭下,Hugging Face的產(chǎn)品戰(zhàn)略開始發(fā)生了調(diào)整。他們將更多精力放到了開源模型的建設(shè)上,將 Pytorch-pretrained-BERT項(xiàng)目正式命名為Transformers,同時(shí)支持Pytorch和Tensorflow 2.0。

          借助 Transformers庫(kù),開發(fā)者可以快速使用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模型,并使用這些模型來完成文本分類、文本總結(jié)、文本生成、信息抽取、自動(dòng)QA等任務(wù),節(jié)省大量時(shí)間和計(jì)算資源,此后Hugging Face在人工智能開源領(lǐng)域的名氣也越來越大。

          圖片Hugging Face在Github上的Star曲線,圖片來自于Lux Capital

          到了2019年12月,Hugging Face拿到了由Lux Capital 領(lǐng)投的A輪融資,融資額也比上一輪上了一個(gè)量級(jí)達(dá)到了1500萬(wàn)美元。值得注意的是,從這一輪開始,Hugging Face的標(biāo)簽開始不再是聊天機(jī)器人,而是把AI開源業(yè)務(wù)放在了首位。這張可愛的笑臉emoji也開始被廣大人工智能開發(fā)者們所熟知。

          |朝著人工智能界的Github前進(jìn)

          在2019年底All in AI開源之后,Hugging Face開始著手構(gòu)建一套完整的開源產(chǎn)品矩陣。用Hugging Face自己的話來講,他們所做的事情,就是要架起人工智能科研和應(yīng)用的橋梁(bridges the gap from research to production)。

          過去這些年,人工智能領(lǐng)域的科研和商業(yè)應(yīng)用是相對(duì)獨(dú)立的兩個(gè)板塊,科研部門的任務(wù)就是對(duì)前沿技術(shù)進(jìn)行研究,搞模型、發(fā)論文,應(yīng)用部門的人則是要將最新技術(shù)用到產(chǎn)品中探索商業(yè)變現(xiàn)。如何將科研成果進(jìn)行系統(tǒng)性的整合成為開源產(chǎn)品,讓開發(fā)者們能夠很快上手去應(yīng)用轉(zhuǎn)化是長(zhǎng)期困擾業(yè)界的一個(gè)問題。

          Hugging Face之前歪打正著地摸到了這個(gè)痛點(diǎn),接著開始認(rèn)真向下挖掘。簡(jiǎn)單來說,Hugging Face就是承擔(dān)了人工智能科研走向應(yīng)用這個(gè)過程中幾乎所有復(fù)雜、繁瑣、細(xì)碎的工作,然后方便任何人工智能從業(yè)者都可以去便捷地使用這些研究模型和資源。

          目前,除了頭號(hào)產(chǎn)品Transformers之外,Hugging Face還建立了Tokenizers、Datasets、Accelerate等庫(kù),從模型到數(shù)據(jù)集、從托管平臺(tái)到性能優(yōu)化,以開源社區(qū)為載體,Hugging Face已建立起了完整的人工智能開發(fā)生態(tài),涵蓋了 NLP、計(jì)算機(jī)視覺、語(yǔ)音、時(shí)間序列、生物學(xué)、強(qiáng)化學(xué)習(xí)等各個(gè)領(lǐng)域。

          值得注意的是,Hugging Face并不是因?yàn)镃hatGPT帶火的。2022年5月,當(dāng)市場(chǎng)的注意力都還停留在Web3、元宇宙之上時(shí),Hugging Face拿到了有紅杉、Lux Capital參與的1億美元融資,讓其估值一舉突破了20億美元。

          圖片Hugging Face的融資歷史,圖片來自于企查查

          Hugging Face當(dāng)前的目標(biāo)是想成為人工智能領(lǐng)域的Github。其創(chuàng)始團(tuán)隊(duì)認(rèn)為,只有將那些少數(shù)人掌握的技術(shù)推廣給更多人使用,才能真正最大程度地推進(jìn)整個(gè)行業(yè)的進(jìn)步。而從商業(yè)的角度來說,Hugging Face認(rèn)為賦能整個(gè)AI社區(qū)所可能產(chǎn)生的價(jià)值可能比一個(gè)專有的工具高出千倍,而只要將其中的1%變現(xiàn)就能夠足以撐起一個(gè)高市值的公司,類似的例子包括MongoDB、Elastic等等。

          除了蓬勃發(fā)展的開源社區(qū),從2020年開始,Hugging Face也開始做面向企業(yè)的定制自然語(yǔ)言模型,其客戶涵蓋彭博社、高通、英特爾等各類大中小型公司,并推出了包括AutoTrain、Inference API & Infinity、Private Hub、Expert Support等針對(duì)不同開發(fā)者類型的產(chǎn)品。據(jù)報(bào)道顯示,從2021年開始Hugging Face就一直處于正現(xiàn)金流的狀態(tài)。

          圖片Hugging Face的的產(chǎn)品服務(wù),圖片來自于其官網(wǎng)

          Hugging Face在當(dāng)前的人工智能領(lǐng)域中能夠以開源社區(qū)的模式異軍突起,有一些偶然也有必然。首先,過去這些年,人工智能技術(shù)所取得的進(jìn)步都是由全世界的科研和產(chǎn)業(yè)領(lǐng)域共同協(xié)作所推動(dòng)的,它的技術(shù)基因里其實(shí)就帶著開放,因此建立起一個(gè)平臺(tái)來鏈接研究者和開發(fā)者順應(yīng)了行業(yè)發(fā)展的歷史和趨勢(shì)。

          此外,Hugging Face通過完成大量的基礎(chǔ)性工作,來幫助彌補(bǔ)在人工智能領(lǐng)域里長(zhǎng)期存在的科學(xué)與生產(chǎn)之間的鴻溝,這是過去很多開源平臺(tái)沒有關(guān)注和做到的。

          在此前的一個(gè)采訪中Hugging Face的CEO Clément Delangue表示,機(jī)器學(xué)習(xí)技術(shù)仍然還處于早期發(fā)展階段,開源社區(qū)的能力將是巨大的。他認(rèn)為,在未來5到10年,我們一定還會(huì)看到更多開源機(jī)器學(xué)習(xí)公司的崛起。

          *參考資料:

          注:封面圖來自于hugging face,版權(quán)屬于原作者。如果不同意使用,請(qǐng)盡快聯(lián)系我們,我們會(huì)立即刪除。


          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞: OpenAI

          技術(shù)專區(qū)

          關(guān)閉