色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > 軟硬結(jié)合 百度站上人工智能語(yǔ)音賽道

          軟硬結(jié)合 百度站上人工智能語(yǔ)音賽道

          作者: 時(shí)間:2017-02-21 來(lái)源:DoNews 收藏

            2月16日有兩條關(guān)于的消息很有意思:一條是收購(gòu)渡鴉團(tuán)隊(duì),一條是把度秘團(tuán)隊(duì)升級(jí)為度秘事業(yè)部,兩邊都向陸奇匯報(bào)工作。這種軟硬融合的戰(zhàn)略選擇是極其正確的。這并不是馬后炮,我在2016年10月發(fā)的《雖然很投入,但李彥宏可能正在錯(cuò)過(guò)》里核心觀點(diǎn)之一就是:是國(guó)內(nèi)對(duì)投入力度最大的公司,但其不碰硬件的戰(zhàn)略很可能導(dǎo)致它最終錯(cuò)過(guò)里對(duì)它最關(guān)鍵的部分。雖然大方向正確,但如果互聯(lián)網(wǎng)公司真想學(xué)亞馬遜,就還差了那么一點(diǎn)東西。

          本文引用地址:http://cafeforensic.com/article/201702/344206.htm

           

            語(yǔ)音賽道的AI到底需要解決什么問(wèn)題

            國(guó)內(nèi)絕不缺和Echo類(lèi)似的產(chǎn)品,但此前的命運(yùn)都是折戟沉沙,這里的關(guān)鍵在于對(duì)什么是這類(lèi)產(chǎn)品上要解決的核心問(wèn)題認(rèn)知不清。自由交流,喚醒詞,速度,方言,內(nèi)容,習(xí)慣等每個(gè)似乎都可以成為要解決的核心問(wèn)題,但實(shí)際上所有這個(gè)賽道上玩家最核心的問(wèn)題是:在語(yǔ)義、方言這些剛性約束不突破的條件下打造出速度、精度、內(nèi)容相匹配的產(chǎn)品。

            智能語(yǔ)音也就是說(shuō)要解決的并非寬適配問(wèn)題,而是要在面對(duì)主流人群真在技術(shù)上下功夫,把體驗(yàn)做好。語(yǔ)音交互上糊弄的空間極小,兩句話就能感受出體驗(yàn)咋樣。這里面最受關(guān)注的是語(yǔ)義的問(wèn)題,因?yàn)槿藗兛偸窍蛲杂傻慕涣?,語(yǔ)義肯定是交互的一個(gè)瓶頸,但我們可以把語(yǔ)音交互根據(jù)語(yǔ)義的技術(shù)進(jìn)展分解為兩個(gè)階段:

            第一階段是語(yǔ)義并沒(méi)有核心突破,也就是說(shuō)最理想狀態(tài)也就達(dá)到75分。這時(shí)候打造產(chǎn)品的根本出發(fā)點(diǎn)是不指望自由語(yǔ)言交流,而讓語(yǔ)音交互偏命令控制,但也打造出極為優(yōu)秀的用戶(hù)體驗(yàn)。Echo大的定位就是這樣一種產(chǎn)品。這時(shí)候產(chǎn)品的核心瓶頸是前端的聲學(xué)(麥克風(fēng)陣列+聲學(xué)算法),這是眼下的問(wèn)題,不解決產(chǎn)品體驗(yàn)不可能好?;谶@判斷我在2015年末開(kāi)始使了很大力氣為公司尋找公司,最終這也是我2016年投資聲智科技的核心原因,當(dāng)時(shí)邏輯很簡(jiǎn)單:這個(gè)問(wèn)題顯然中科院聲學(xué)所更擅長(zhǎng)解決,而聲智科技幾乎是聲學(xué)所人員所創(chuàng)辦的唯一的一家AI企業(yè)。

            第二階段是語(yǔ)義真的取得突破,這無(wú)疑會(huì)更大的擴(kuò)展語(yǔ)音交互的應(yīng)用范圍,一旦這個(gè)點(diǎn)得以突破,語(yǔ)音交互會(huì)變的無(wú)處不在,但我們必須承認(rèn)什么時(shí)候語(yǔ)義能夠徹底解決仍然不確定,這是屬于未來(lái)的事情。

            這種時(shí)間軸上的錯(cuò)亂是很可怕的,那樣就會(huì)在現(xiàn)有產(chǎn)品上挑戰(zhàn)不可能解決的問(wèn)題,比如不用喚醒詞,指望Echo這類(lèi)產(chǎn)品什么都能干等。

            總結(jié)來(lái)看我們可以這樣講:如果真想做出Echo那樣的產(chǎn)品,聲學(xué)(麥克風(fēng)陣列+算法),語(yǔ)音識(shí)別,語(yǔ)義三層里面眼下的瓶頸是聲學(xué),未來(lái)的瓶頸是語(yǔ)義,前者影響現(xiàn)在產(chǎn)品賣(mài)不賣(mài)的出去,后者影響適用范圍的大小。但即使只是前者這也是一個(gè)足以對(duì)標(biāo)Pad的新品類(lèi)。

            差的那么一點(diǎn)點(diǎn)

            真走軟硬融合的道路,顯然的關(guān)鍵要素是:良好的產(chǎn)品定義,足夠成熟的技術(shù)要素,系統(tǒng)整合產(chǎn)品的能力(其實(shí)還有通暢的銷(xiāo)售渠道)。系統(tǒng)整合一項(xiàng)要求一個(gè)公司整合軟硬團(tuán)隊(duì),否則不同利益訴求會(huì)導(dǎo)致軟硬團(tuán)隊(duì)很難高度配合,而在產(chǎn)業(yè)初期,不同層次間接口標(biāo)準(zhǔn)化很差,容易導(dǎo)致產(chǎn)品夭折。產(chǎn)品定義則高度依賴(lài)于個(gè)人,就看當(dāng)事人的能力,對(duì)公司而言需要一點(diǎn)運(yùn)氣。

            這樣一來(lái)唯一欠缺的是足夠成熟的技術(shù)要素。這是非常麻煩的一點(diǎn),對(duì)于互聯(lián)網(wǎng)公司尤其艱難,因?yàn)檎嫱@條路上走欠缺的并非是計(jì)算機(jī)算法上的認(rèn)識(shí),也還牽扯物理,這對(duì)于互聯(lián)網(wǎng)公司是個(gè)大大的盲點(diǎn)。

            從這個(gè)視角正好可以理解蘋(píng)果和Google的差別,蘋(píng)果是要高度關(guān)注物理層面的東西的,比如材料、電池、屏幕、傳感器等,Google顯然會(huì)更關(guān)注算法。所以蘋(píng)果的云端技術(shù)始終不好,而Google做產(chǎn)品就也總是一般。喬布斯萬(wàn)眾矚目所以大家看到的是他的偏執(zhí)、癲狂乃至藝術(shù)氣息,但實(shí)際上他背后是有一坨人在幫他解決物理上的麻煩事的,現(xiàn)在的庫(kù)克就是其中之一。

            這并不只是一個(gè)公司的問(wèn)題,而是新時(shí)代趨勢(shì)對(duì)互聯(lián)網(wǎng)公司的一種系統(tǒng)型挑戰(zhàn)。我在之前的文章中曾經(jīng)提到過(guò),一個(gè)行業(yè)的興起事實(shí)上是三個(gè)大的階段:

            第一階段是Enabling技術(shù)的成熟,類(lèi)比的話就是手機(jī)上的高通和MTK,在語(yǔ)音產(chǎn)業(yè)鏈上聲智科技扮演類(lèi)似的角色。

            第二階段是硬件產(chǎn)品的成熟,類(lèi)比的話就是Apple II或者iPhone 1代,在語(yǔ)音產(chǎn)業(yè)鏈上就是Echo。需要注意Echo是起點(diǎn)而不是終點(diǎn),是剛跨過(guò)可用線的一款產(chǎn)品。

            第三階段才是新硬件平臺(tái)上軟件應(yīng)用的成熟,比如PC上就是Office,手機(jī)上就是微信。在語(yǔ)音產(chǎn)業(yè)鏈上這點(diǎn)還沒(méi)展開(kāi)。

            互聯(lián)網(wǎng)縮短了第一階段和第二階段間的過(guò)渡過(guò)程,相當(dāng)于兩者在同步發(fā)生,也正因此才需要軟硬融合。但互聯(lián)網(wǎng)公司獨(dú)自解決第一個(gè)問(wèn)題能力會(huì)偏弱,這就是欠缺的那一點(diǎn)點(diǎn)。


          上一頁(yè) 1 2 下一頁(yè)

          關(guān)鍵詞: 百度 人工智能

          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉