MR整合現(xiàn)實與虛擬 創(chuàng)造元宇宙數(shù)字生態(tài)系
在Connect2021的開發(fā)者大會上,F(xiàn)acebook公布了Metaverse計劃,構(gòu)筑出基于元宇宙的下一代3D空間社交網(wǎng)絡(luò)平臺。此后,元宇宙被視為現(xiàn)實空間和虛空間的融合,未來人們可以在這里展開互動和各種商業(yè)。同時Meta(Facebook母公司)也將Metaverse定位為下一個行動平臺,繼Apple和Google之后,又另一新創(chuàng)建的網(wǎng)絡(luò)平臺。
Meta構(gòu)建元宇宙的基礎(chǔ)技術(shù)與概念是,整合增強實境(AR)和虛擬現(xiàn)實(VR)后所產(chǎn)生混合實境(MR)。而這些MR相關(guān)的應(yīng)用技術(shù)都在元宇宙研究所「Facebook Reality Labs」積極的開發(fā)中。
創(chuàng)造虛擬世界的技術(shù):Presence Platform
Meta開發(fā)的Metaverse是期望讓現(xiàn)實社會和虛擬社會的平滑融合,而創(chuàng)造出這種社會的技術(shù)則被稱為「Presence Platform」。這個平臺是以視覺運算和人工智能為核心,將虛擬對象整合到現(xiàn)實空間的數(shù)據(jù)處理模塊。具體來說,它提供了產(chǎn)生MR、對象互動和語音互動的能力。如前所述,MR是一種混合實境的環(huán)境,融合了真實空間和虛空間,成為元宇宙的核心功能。
Presence Platform 由三個SDK組成,包括了「Insight SDK」:在現(xiàn)實空間中嵌入虛擬對象來產(chǎn)生MR環(huán)境的技術(shù)?!窱nteraction SDK」:手動操作虛擬對象的技術(shù)?!竀oice SDK」:使用對話語音來對虛擬對象進行操控的技術(shù)。
圖一 : Mixed Reality 全球市場規(guī)模預(yù)測(兆日圓)。(source:PWC;作者整理)
MR空間生成技術(shù):Insight SDK
Insight SDK是元宇宙的核心技術(shù),目的在產(chǎn)生高質(zhì)量的MR空間。Insight SDK包含兩個函數(shù),「Passthrough」和「Spatial Anchors」,以及Scene Understanding功能。
Passthrough是一種透過VR耳機來創(chuàng)建出MR空間,并在現(xiàn)實空間中描繪虛擬物體的技術(shù)。圖二顯示了利用「Oculus Quest 2」來進行鋼琴課程。鋼琴鍵盤上會顯示一個圓形的虛擬對象,操作者可以用手指輕敲它來播放音樂。
同時,「Oculus Quest 2」還內(nèi)建了攝影鏡頭,可以黑白方式看到前方的影像。因此,「Oculus Quest 2」不僅可以用作VR,還可以用以當作MR玻璃。
圖二 : 透過MR技術(shù)將實體物品與虛擬圖像結(jié)合后進行鋼琴課程。(source:META)
Spatial Anchors是一種透用手機映像出真實空間的功能。它能利用Oculus手機,讓操作者利用手指沿著家具移動,繪制出房間內(nèi)部的地圖。經(jīng)由這個功能,可以了解真實空間的結(jié)構(gòu),并顯示出相對應(yīng)的虛擬對象。
Scene Understanding是對用戶空間進行理解的功能,判斷出空間的位置關(guān)系及其意義。使用此場景模型時,可在房間中建立出一個MR空間。
利用這種方式,可以整合Passthrough、Spatial Anchors和 Scene Understanding來開發(fā)可判斷物理空間含義的高度復(fù)雜Metaverse。
表達手部動作的技巧:Interaction SDK
Interaction SDK是針對手或手機在虛空間中移動的處理和控制操作,例如用手抓握、觸摸和指向虛擬對象。圖三顯示了一個虛擬的咖啡杯被用手抓著。Interaction SDK是利用視覺運算、AI追?手部動作并判斷出與對象的互動程度。
圖三 : 一個虛擬的咖啡杯被用手抓著。(source:META)
理解語音的技巧:Voice SDK
Voice SDK是一種自然語言分析功能,可透過聲音來進行語音操控。當應(yīng)用于游戲時,可以透過語音來進行操控。除了語音導航外,Voice SDK還提供語音搜索和語音問答功能。例如當操作者說出虛擬角色的名字「Oppy」時,系統(tǒng)就會明白這個詞的意思并接近它。
行動MR技術(shù)正積極被開發(fā)
行動MR具有許多明顯的優(yōu)勢,因此備受全球所注目,也吸引了相當多業(yè)者投入開發(fā)相關(guān)的各項技術(shù)。目前許多潛在的用戶已經(jīng)擁有一款可支持MR的智能型手機,因此無需耗費金錢購買昂貴且笨重的耳機。就其本質(zhì)而言,今天的行動設(shè)備已經(jīng)非常便于攜帶,也相當容易進入任何空間。
Apple ARKIT 5
Apple的最新版本AR/MR開發(fā)工具集開放原始碼行動ARKit5,進行了重大改進。其中最重要的功能,包括對位置錨點(Anchors)的擴充支原、改進的運動追?,以及在超廣角攝影鏡頭中可提供更好的臉部跟?,App Clip Codes還可支持快速掃描啟動體驗。
自從在ARKit 4中加入位置錨點后,允許APP開發(fā)人員可以將具有特定緯度、經(jīng)度和高度的虛擬對象放置在屏幕上,并且可相對于現(xiàn)實環(huán)境中的位置。例如,位置錨點可在標志性建筑旁邊的空間中,顯示三維圖標或文字。在ARKit 5中,此功能的支持性已擴展到倫敦和美國的其他城市。
擴充的臉部追?技術(shù),允許一次最多追?三個人的臉部,現(xiàn)在可支持所有配備A12Bionic處理器,以及更高版本的設(shè)備,即使沒有真深度鏡頭(TrueDepth Camera)也可以應(yīng)用。
而App Clip Codes則是應(yīng)用在類似于QR Code的影像,可以透過掃描來啟動APP的lightweight,并且能與 ARKit整合,允許從任何地方啟動AR/MR,而無需下載其他軟件。
Google ARCORE
Android的ARKit-ARCore提供了開發(fā)人員在Android設(shè)備上,雖然可以開發(fā)出AR/MR APP所需的開放原始碼工具集,但由于需要注意Android設(shè)備上各種硬件的兼容性,因此這通常被視為也些挑戰(zhàn)性。
2021年,Google在ARCore中加入了一些新功能,例如錄制和播放API等。這些功能可以讓開發(fā)人員使用AR原始數(shù)據(jù)錄制視訊片段,在透過深度和IMU運動傳感器數(shù)據(jù),來以重新建立與視訊中相同的環(huán)境,同時也為開發(fā)人員能更輕松地測試特定環(huán)境的方式。
錄制和播放API不僅是開發(fā)人員所需要,對使用者來說也有一定的用處,這項技術(shù)提供用戶可以錄制視訊,應(yīng)用在以后的AR/MR效果中,因為這些視訊可以包含環(huán)境原始數(shù)據(jù)。
ARKit和ARCore之間的競爭并不如外界想象中的明顯。由于APPLE掌控了所有的設(shè)備組件,因此ARKit在軟件和硬件之間有著較佳的兼容性。但是在市場上,并非每個使用者都擁有iPhone或iPad。因此對于其他的用戶或行動產(chǎn)品業(yè)者來說,ARCore就變得非常重要。盡管由于采用的硬件的不同,不能保證每臺Android設(shè)備都能獲得完全支持和兼容,但Google仍舊盡可能讓其眾多用戶擁有一定程度的競爭力。
就實際效能而言,這兩個平臺背后的技術(shù)幾乎是一樣的。例如,對于場景檢測等應(yīng)用,這兩種技術(shù)使用相同的方法,但差異最大還是在硬件的部分,與兼容能力。
手機增強實境:Spark AR
Spark AR是一款針對行動終端的AR/MR開發(fā)環(huán)境,這款行動終端AR/MR,可以整合到智能手機的APP中來使用。例如,Spark AR可應(yīng)用在臉部插入特殊效果,像是用Spark AR對臉部進行特殊化妝,并將其轉(zhuǎn)變?yōu)楣治锏膽?yīng)用。
Project Aria
Meta也正在開發(fā)AR/MR眼鏡「Project Aria」。這是一個在眼鏡上內(nèi)建攝影鏡頭和顯示器產(chǎn)品,并在面前的真實空間中強行加入一個虛擬對象。AR/MR眼鏡可被當數(shù)字助理應(yīng)用,透過AI來了解周圍物體的類型和含義,例如識別沙發(fā)和桌子。此外,也可利用人工智能掌握用戶的想法,并協(xié)助進行下一步行動。例如,當操作者看著燈時,開關(guān)就會被自動打開。
智能眼鏡的輸入:Electromyography
但是挑戰(zhàn)在于如何將數(shù)據(jù)輸入AR/MR眼鏡,因此Meta正在開發(fā)一種稱為Electromyography(肌電圖)的技術(shù)。
這個想法是將設(shè)備戴在手腕上后,并測量肌電圖,再透過人工智能分析肌肉中產(chǎn)生的弱電場來預(yù)測操作者的意圖。例如當您用手指書寫字母時,此設(shè)備會將其轉(zhuǎn)換為文字(圖四)。
圖四 : 利用肌肉的電位變化轉(zhuǎn)換稱操控方式。(source:META)
MR在工業(yè)領(lǐng)域的潛力和未來
第一個實現(xiàn)MR的產(chǎn)品是,HoloLens于2015年1月所發(fā)布的產(chǎn)品。這是一款無需外接控制器的獨立頭戴式顯示器,可透過手部追?和語音輸入進行操作。HoloLens的產(chǎn)品透過攝影鏡頭和深度傳感器,來對周圍環(huán)境進行識別,并經(jīng)由透射式顯示器在真實空間中加迭內(nèi)容來提供新體驗的設(shè)備。
隨后,Magic Leap One也于2017年12月發(fā)表一款新技術(shù),將需要處理數(shù)據(jù)的機制,轉(zhuǎn)移到外部的獨立計算設(shè)備,大幅度減輕顯示器的重量,并且利用數(shù)字內(nèi)容,以更真實的方式強化顯示能力,例如擴大視角,和根據(jù)視線切換影像,在發(fā)表之后便大大威脅HoloLens的領(lǐng)先地位。
面對此一挑戰(zhàn),HoloLens也于2年后發(fā)表第二代產(chǎn)品-HoloLens 2。與初代的HoloLens相比,無論是顯示視角、縱橫比、分辨率、運算和佩戴感等,多項性能都獲得了大幅度的提升。此外,傳感器的加入更使得佩戴者五根手指的動作都可以被檢測到,來達到捏握等全影像操作,提高了實用性。
雖然這些主要用于工業(yè)用途的MR設(shè)備,性能相當卓越,但價格卻是非常昂貴。因此針對消費者使用的MR設(shè)備商品化更是備受期待,市場上終于在2020年8月,出現(xiàn)了一款專為消費者使用而開發(fā)的MR產(chǎn)品-Nreal Light。這款產(chǎn)品可與智能型手機連接,將處理數(shù)據(jù)的工作轉(zhuǎn)移到智能型手機,來達到減輕頭戴式顯示器重量,雖然在攝影鏡頭數(shù)量、畫素數(shù)、環(huán)境偵測與掌握,和各種跟?的精度等性能方面不如工業(yè)設(shè)備,但它實現(xiàn)了大幅降低售價,讓消費者在低價格負擔下就能輕松體驗MR(表一)。
MR技術(shù)的未來
未來將有很多業(yè)者進入MR設(shè)備市場,透過提高性能和減輕重量來增強現(xiàn)有產(chǎn)品,就像前述高整合度的HoloLens 2。雖然頭戴式顯示器是目前MR設(shè)備的主流,但掛戴眼鏡式和隱形眼鏡式等,無需考慮佩戴舒適度的顯示器設(shè)備,也有業(yè)者積極的投入開發(fā)。不過,目前MR的主要用途主要是還是工業(yè)用,根據(jù)PWC預(yù)測工業(yè)用市場短期內(nèi)將會持續(xù)擴大。
從中長期來看,市場有機會在各種應(yīng)用領(lǐng)域擴大,例如數(shù)字內(nèi)容和虛擬全影像顯示、醫(yī)療領(lǐng)域醫(yī)師與患者僅行互動、減壓和復(fù)健等醫(yī)療,都將可在MR平臺上僅行。此外,MR在娛樂應(yīng)用和商業(yè)產(chǎn)業(yè)的應(yīng)用也將進一步擴大,因此不僅工業(yè)市場,包括普通消費者的市場的成長也將持續(xù)增加。
評論