語音識(shí)別電路設(shè)計(jì)圖集錦 —電路圖天天讀(71)
TOP1 語音識(shí)別控制家用電器系統(tǒng)電路
本文引用地址:http://cafeforensic.com/article/201710/369387.htm語音識(shí)別技術(shù)是近年來十分活躍的研究領(lǐng)域。語音識(shí)別系統(tǒng)的實(shí)用化研究是語音識(shí)別研究的一個(gè)主要方向。以玩具市場為例,具有高科技含量的電子玩具、智能玩具發(fā)展迅猛,電子互動(dòng)式、智能化玩具已經(jīng)成為玩具行業(yè)發(fā)展的主流。我國是玩具生產(chǎn)和出口大國,但在高科技玩具的發(fā)展方面和國外的差距很大,因此,及時(shí)投入精力廣泛開展這方面的研究,無論對(duì)技術(shù)創(chuàng)新應(yīng)用,還是社會(huì)經(jīng)濟(jì)發(fā)展,都有巨大的現(xiàn)實(shí)意義。與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢寐以求的事情。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。語音識(shí)別功能大大增加了玩具使用的樂趣,并使玩具體現(xiàn)出一定的智能性,因此成為大部分電子玩具、智能玩具設(shè)計(jì)中使用的關(guān)鍵技術(shù)。
語音模塊
語音輸出電路如圖所示,其中VDDH為參考電壓,VSS是系統(tǒng)的模擬地。音頻信號(hào)由SPCE061A 的DAC引腳輸出送到電路的J4端,通過音量電位器R9的調(diào)節(jié)端送到集成音頻功率放大器SPY0030,經(jīng)音頻放大后,音頻信號(hào)從SPY0030輸出經(jīng) J2 端口外接揚(yáng)聲器播放聲音。 SPCE061A內(nèi)置2路10位精度的DAC,只需要外接功放電路即可完成語音的播放。圖中的SPY0030是凌陽的一款音頻放大芯片,可以工作在 2.4~6V范圍內(nèi),最大輸出功率可達(dá)700mW。 J5 都是語音輸出接口,;是兩針的插針外接喇叭,由DAC 輸出引腳經(jīng)語音集成。
放大器SPY0030 放大,然后輸出。SPY0030 是音頻功率放大器。因?yàn)槁曇羰遣煌穹筒煌l率的波,即交流信號(hào)電流,三極管的集電極電流永遠(yuǎn)是基極電流的β倍,β是三極管的交流放大倍數(shù),應(yīng)用這一點(diǎn),若將小信號(hào)注入基極,則集電極流過的電流會(huì)等于基極電流的β倍,然后將這個(gè)信號(hào)用隔直電容隔離出來,就得到了電流(或電壓)是原先的β倍的大信號(hào),這現(xiàn)象稱為三極管的放大作用。經(jīng)過電流與電壓的共同放大,就完成了功率放大。R14為可調(diào)電阻,當(dāng)調(diào)節(jié)阻值大小事,即調(diào)節(jié)了基極的輸入信號(hào),最終影響的就是輸出信號(hào)即語音輸出音量的大小。SPY0030的放大倍數(shù)固定為20倍。
語音輸入電路如圖所示,其中VMC提供傳聲器的電源,AVSS1是系統(tǒng)的模擬地,VCM為參考電壓,1腳和2腳分別是傳聲器X1的正極、負(fù)極的輸入引腳,連接SPCE061A的MICP、NICN管腳上。當(dāng)對(duì)著傳聲器講話時(shí),1腳和2腳將隨著傳聲器輸入的聲音產(chǎn)生變化的波形,并在SPCE061A的兩個(gè)端口處形成兩路反相的波形,送到SPCE061A 控制器內(nèi)部的運(yùn)算放大器進(jìn)行音頻放大,經(jīng)過放大的音頻信號(hào),通過ADC轉(zhuǎn)化器轉(zhuǎn)化為數(shù)字量,保存到相應(yīng)的寄存器中。 SPCE061A的A/D轉(zhuǎn)換器有8個(gè)通道,其中有1個(gè)通道是MIC-NI輸入,它專門用于對(duì)語音信號(hào)進(jìn)行采樣。語音信號(hào)經(jīng)過MCI轉(zhuǎn)換成電信號(hào),然后輸入至SPCE061A內(nèi)部前置放大器。由于人們說話時(shí),麥克風(fēng)距離嘴邊的距離不同,語音信號(hào)的能量將會(huì)有很大的差異,此時(shí),如果芯片的的輸入信號(hào)太大或是太小都將影響識(shí)別的精度。而SPCE06lA內(nèi)部就帶有自動(dòng)增益控制電路AGC能隨時(shí)跟蹤、監(jiān)視前置放大器輸出的音頻信號(hào)電平,當(dāng)輸入信號(hào)增大時(shí)AGC電路自動(dòng)減小放大器的增益;當(dāng)輸入信號(hào)減小時(shí),AGC電路自動(dòng)增大放大器的增益,從而以補(bǔ)償太小或是太大的信號(hào),以便使進(jìn)入戶A/D的信號(hào)保持在最佳電平,又可使削波減至最小。 SPCE061A芯片中已經(jīng)集成了音頻輸入專用ADC以及AGC放大電路,因?yàn)榇诵酒獠康碾娐繁容^簡單。
MICP和MICN將隨著MIC產(chǎn)生的波形變化,并在兩個(gè)端口處形成兩路反相波形,在經(jīng)過兩級(jí)運(yùn)放放大,把放大的語音信號(hào)交給ADC轉(zhuǎn)換為數(shù)字量,這時(shí)就可以通過單片機(jī)編程對(duì)這些數(shù)據(jù)進(jìn)行處理,進(jìn)行語音處理識(shí)別等功能。 正如我們在前面介紹的61 板具有強(qiáng)大的語音處理功能,如圖3-8所示,X1 是語音的MIC 輸入端,帶自動(dòng)增益(AGC)控制。
SPR4096外擴(kuò)Flash模塊
在本系統(tǒng)中,當(dāng)我們對(duì)系統(tǒng)進(jìn)行訓(xùn)練、識(shí)別、操作時(shí),有一些語音提示,由于SPCE061A內(nèi)部只有32k字的flash空間,除了一部分空間作為程序的存儲(chǔ)之后,剩下的用來存儲(chǔ)語音數(shù)據(jù)時(shí)遠(yuǎn)遠(yuǎn)不夠的,于是系統(tǒng)外擴(kuò)了flash。SPR4096與SPCE061A的連接方式為:SCK與SPCE061A的 IOB0接,SDA與SPCE061A的IOB1口接。SPR4096按串行接口模式工作,要把CF2~CF0均接高電平。CF7為低電平時(shí)選中 FLASH,高電平時(shí)選中SRAM。 SPR4096是一個(gè)高性能的4M-bit(512&TImes;8-bit)FLASH,分為256個(gè)扇區(qū)。每個(gè)扇區(qū)2Kbyte。SPR4096還內(nèi)置了以個(gè) 4K&TImes;8bit的SRAM。在進(jìn)行FLASH的編程/擦除時(shí),可以并發(fā)執(zhí)行SRAM的讀/寫。SPR4096內(nèi)置了一個(gè)總線存儲(chǔ)器接口和一個(gè)串行接口,它允許單片機(jī)通過8-bit并行模式或者1-bit的串行模式訪問FLASH/SRAM存儲(chǔ)區(qū)。 SPR4096串行接口的工作頻率可達(dá)到5MHz。SPR4096有兩個(gè)電源輸入端VDDI和VDDQ。VDDI是給內(nèi)部FLASH和控制邏輯供電的;VDDQ是專門為I/O供電的。
供電電壓VDDQ:2.25V~3.6V。SPR4096最大讀電流為2mA,最大編程/擦除電流為6 mA 。SPR4096模塊包括總線存儲(chǔ)接口,串行接口,SRAM,編程與擦除控制器和一個(gè)4M的FLASH。選擇串行接口時(shí),SCLK作為時(shí)鐘信號(hào)線,SDA 作為1-bit的數(shù)據(jù)線。如果接收到FLASH的讀指令或者SRAM的讀/寫指令,串口會(huì)把這些指令傳給編程和擦除控制器,讓編程和擦除控制器去完成相應(yīng)操作。 串行接口模式的選中是通過CF2~CF0來實(shí)現(xiàn)的。當(dāng)CF2~CF0均接高電平時(shí),選中的就是串行接口模式,在串行接口模式下,CF7為低電平時(shí)選中 FLASH,高電平時(shí)選中SRAM。該芯片有SIF(Serial Interface)和BMI(Busmenory Interface)兩種工作方式,但DIP24只支持SIF方式。
全球電子測量技術(shù)與市場領(lǐng)導(dǎo)者——是德科技(原安捷倫電子測量事業(yè)部)UXM新品體驗(yàn)會(huì)將于近期拉開帷幕,歡迎各位業(yè)內(nèi)人士踴躍參加,您的到來,將是KEYSIGHT的最大榮幸!報(bào)名地址請點(diǎn)擊以下圖片進(jìn)入:
TOP2 語音識(shí)別機(jī)器人系統(tǒng)電路
系統(tǒng)電源電路設(shè)計(jì)
SPCE061A采用低電壓供電方式,這可以大大降低芯片的功率損耗。其中,SPCE06lA的電源分兩種,即內(nèi)核電源(VDD)和I/O口電源(VDDH)。I/O口電源采用5V電壓,而內(nèi)核電源則為3.3V或者更低。降低芯片內(nèi)核電壓的目的主要還是降低芯片的功耗,同時(shí)也可以降低芯片的工作溫度,延長芯片使用壽命。盡管這種語音芯片的工作電壓范圍很大,但是為了使芯片內(nèi)核運(yùn)行更加穩(wěn)定,同時(shí)又保證I/O口及外部擴(kuò)展部件的工作電壓要求,電源電路采用芯片7805和SPY0029分別提供5V和3.3V電壓完成對(duì)整個(gè)系統(tǒng)供電。 7805芯片電路中正常工作是,輸入、輸出電壓差為2~3V。電路中靠近引腳處接入電容C40、C41用來實(shí)現(xiàn)頻率補(bǔ)償,防止穩(wěn)壓器產(chǎn)生高頻自激震蕩和抑制電路引入的高頻干擾,C39是電解電容,以減小穩(wěn)壓電源輸出端由輸入電源引入的低頻干擾。
6是保護(hù)二級(jí)管,當(dāng)輸入端短路時(shí),給輸出電容器C39一個(gè)放電通路,防止C39兩端電壓作用于調(diào)整管的be結(jié),造成調(diào)整管be結(jié)擊穿而損壞。
控制與結(jié)果顯示電路
鍵盤模組可直接用排線與61單片機(jī)I/O口相連。1*8KEY 的8 列分別定義為COL1~COL8,1 行定義為ROW1。如圖3-11所示。 按鍵分別和SPCE061A的IOA0~IOA7相連,他們的作用分別為1個(gè)系統(tǒng)開關(guān)鍵,1個(gè)系統(tǒng)復(fù)位鍵,1個(gè)單個(gè)命令訓(xùn)練按鍵,1個(gè)所有語句循環(huán)訓(xùn)練按鍵,剩余4個(gè)初步設(shè)定為LCD功能控制按鍵。每個(gè)按鍵的按下與抬起都會(huì)送給IOA口一個(gè)電壓值,當(dāng)按鍵按下使相應(yīng)的IOA口得到一個(gè)高電壓。相反,則為低電壓。單片機(jī)則根據(jù)IO口的電壓值進(jìn)行相應(yīng)的操作。
LED模組
利用LED顯示來測試是否達(dá)到控制電器目標(biāo)。利用數(shù)碼管顯示數(shù)字的不同來模擬驗(yàn)證是否能達(dá)到對(duì)家用電器的控制。 LED和LCD電路作為系統(tǒng)的顯示部分,以顯示當(dāng)前的系統(tǒng)狀況及識(shí)別結(jié)果以便檢驗(yàn)實(shí)驗(yàn)結(jié)果和提示用戶進(jìn)行下一步操作。LCD部分在實(shí)驗(yàn)階段可不接入。 計(jì)劃采用內(nèi)置SPLC0501點(diǎn)陣式圖形液晶顯示模塊由液晶驅(qū)動(dòng)控制器SPLC501、LCD顯示器和外部設(shè)備的接口等幾部分組成,液晶驅(qū)動(dòng)控制器 SPLC501集行、列驅(qū)動(dòng)器、顯示數(shù)據(jù)存儲(chǔ)器(DDRAM,Display Data RAM)和控制器與一體,廣泛用于小規(guī)模液晶顯示模塊。內(nèi)置SPLC501點(diǎn)陣式圖形液晶顯示模塊的管腳排列和SPEC061A接線方法如圖所示。
雖然實(shí)現(xiàn)了語音控制家用電器,但是總的來說系統(tǒng)界面不是很友好。為此,我們可以充分利用計(jì)算機(jī)和通信技術(shù),并用VB等軟件開發(fā)友好的管理界面,將數(shù)據(jù)和其他信息通過計(jì)算機(jī)統(tǒng)一進(jìn)行管理和控制。
語音識(shí)別機(jī)器人系統(tǒng)電路設(shè)計(jì)
目前制造業(yè)市場上,工業(yè)機(jī)器人具有相當(dāng)大的市場潛力,要使工業(yè)機(jī)器人真正應(yīng)用于生產(chǎn)線上的各個(gè)方面,滿足人們?nèi)找嬖鲩L的需求,就離不開高性能的語音識(shí)別控制系統(tǒng)。隨著計(jì)算機(jī)軟硬件技術(shù)、半導(dǎo)體技術(shù)、電子技術(shù)、通訊技術(shù)等的飛速發(fā)展人類已經(jīng)進(jìn)入后PC時(shí)代。語音識(shí)別技術(shù)得到了迅猛發(fā)展, 支持語音識(shí)別的各種產(chǎn)品紛紛面世。人類實(shí)現(xiàn)了語音命令控制空調(diào)、電視、燈光、自動(dòng)窗簾等的使用,讓人們的生活“隨音所欲”,更加舒適,更加便捷?;诹桕?16位SPCE061A單片機(jī)設(shè)計(jì)了一個(gè)具有語音識(shí)別功能的機(jī)器人。在經(jīng)過訓(xùn)練后使機(jī)器人對(duì)訓(xùn)練人的命令做出應(yīng)答,完成跳兩首舞曲、走步、轉(zhuǎn)向、轉(zhuǎn)頭、發(fā)射飛盤等動(dòng)作。
語音識(shí)別可劃分為訓(xùn)練和識(shí)別兩個(gè)過程。在第一階段,語音識(shí)別系統(tǒng)對(duì)人類的 語言進(jìn)行學(xué)習(xí),把學(xué)習(xí)內(nèi)容組成語音庫存儲(chǔ)起來,在第二階段就可以把當(dāng)前輸入的語音在語音庫中查找相應(yīng)的詞義或語義。凌陽16位SPCE061A單片機(jī)內(nèi)嵌 32K字閃存,2K字SRAM,內(nèi)置10位ADC、DAC,有多達(dá)14個(gè)的中斷源。它的CPU內(nèi)核采用16位具有DSP功能的微處理器芯片, 而且CPU可最高工作在49MHz的主頻下,能夠非常容易地、快速地處理復(fù)雜的數(shù)字信號(hào),因此與其他類型的單片機(jī)相比,在數(shù)字語音處理方面 SPCE061A更具有優(yōu)勢。基于SPCE061A設(shè)計(jì)了一個(gè)具有語音識(shí)別功能的機(jī)器人。經(jīng)過訓(xùn)練,訓(xùn)練人可使用各種命令讓機(jī)器人完成許多有趣的動(dòng)作,使得人機(jī)交互更具智能化。
SPCE061A最小系統(tǒng)
SPCE061A最小系統(tǒng)中,含有SPCE061A芯片外圍的基本模塊,其主要由晶體輸入模塊(OSC)、鎖相環(huán)外圍電路(PLL)、復(fù)位電路(RESET)、指示燈(LED)等組成,參看圖 4-1。在OSC32O、OSC32I端口接上晶體振蕩器和諧振電容,在VCOIN端口接上相對(duì)應(yīng)的電容和電阻后即可工作。在其他不用的VDD端口和 GND端口也不能懸空應(yīng)該接上0.1uF的耦合電容以提高抗干擾能力。 圖 4-1 SPCE061A最小系統(tǒng)。
TOP3 機(jī)器人硬件驅(qū)動(dòng)電路
電源輸入端口是61板的能源供應(yīng)中心,整塊板子的電源都是由此提供進(jìn)去,可采用電池或穩(wěn)壓電源提供5V輸入,并且必須至少保證電流在50mA以上,否則會(huì)造成系統(tǒng)無法倍頻和下載出錯(cuò)。SPCE061A的內(nèi)核供電為3.3V,由于I/O端口可接3.3V也可以接5V,所以在電源模塊中有一個(gè)端口電平選擇跳線J5用于選擇端口電壓,電源模塊參看圖,如下:
由于此系統(tǒng)需要的端口高電平為5V,所以圖當(dāng)中的J5跳線需要跳到1和2上。
放音電路設(shè)計(jì)
將HM628128A中存儲(chǔ)的語音數(shù)據(jù)順序取出,解碼后,以8kHz的速率進(jìn)行D/A轉(zhuǎn)換輸出,語音數(shù)據(jù)經(jīng)電容濾波恢復(fù)成原始語音波形,最后用三極管驅(qū)動(dòng)揚(yáng)聲器放音。SPCE061A音頻輸出共有兩個(gè)DAC通道,DAC1和DAC2輸出的模擬電信號(hào)通過DAC1和DAC2引腳輸出。DAC的輸出范圍是 0x0000~0xFFFF。DAC1和DAC2的輸出數(shù)據(jù)應(yīng)寫入P_DAC1和P_DAC2單元。上電復(fù)位以后,兩個(gè)DAC均被自動(dòng)打開,此時(shí)會(huì)消耗少量的電流(幾個(gè)毫安)。如若不需要,盡量關(guān)閉DAC輸出(將P_DAC_Ctrl單元的第一位置為1)。而且DAC的直流電壓必須保持平穩(wěn)地變化,否則可能由于電壓的突變引起揚(yáng)聲器產(chǎn)生雜音。為減緩電壓的變化幅度,從而輸出高質(zhì)量的音頻數(shù)據(jù)可以采用ramp up/down技術(shù)。其應(yīng)用條件是:被喚醒/上電復(fù)位后首次使用DAC時(shí),上電復(fù)位功能應(yīng)在被關(guān)閉/進(jìn)入睡眠狀態(tài)之前。 放音利用的是SPCE061A內(nèi)部的DAC,電路參看圖 4-8。圖中的SPY0030是凌陽公司的產(chǎn)品。和LM386相比,在工作電壓上,LM386需在4V以上,而SPY0030僅需2.4V(兩節(jié)電池)即可工作;在輸出功率上,LM386僅在100mW以上,而SPY0030可達(dá)700mW。
機(jī)器人硬件驅(qū)動(dòng)電路
機(jī)器人驅(qū)動(dòng)電路采用功率較大的三極管搭成H橋來驅(qū)動(dòng)電機(jī)從而實(shí)現(xiàn)電機(jī)的正向旋轉(zhuǎn)與電機(jī)的反向旋轉(zhuǎn),本系統(tǒng)中使用H橋驅(qū)動(dòng)的電機(jī)包括兩個(gè)用于走路的電機(jī)與一個(gè)頭部轉(zhuǎn)向的電機(jī)。同時(shí)用了一個(gè)三極管驅(qū)動(dòng)單向旋轉(zhuǎn)的電機(jī),如加速電機(jī)與發(fā)射電機(jī)。語音處理技術(shù)本身就是一門理論性強(qiáng)、實(shí)用面廣而且難度較大的綜合學(xué)科。而開發(fā)出具有語音功能的單片機(jī)也是相當(dāng)困難的。凌陽unsp系列16位單片機(jī),就是適應(yīng)這種需求而設(shè)計(jì)的。凌陽SPCE061A實(shí)現(xiàn)語音識(shí)別其獨(dú)特之處在于:硬件電路簡單,因?yàn)镾PCE061A是一款專門為語音信號(hào)處理設(shè)計(jì)的單片機(jī),麥克風(fēng)和喇叭可以直接接入,接放大電路可不用外接。具有一套高效的指令系統(tǒng),軟件編程容易,有相應(yīng)的API函數(shù),可直接調(diào)用。
TOP4 SPCE061A智能小車語音識(shí)別電路
本文利用凌陽單片機(jī)設(shè)計(jì)一個(gè)具有語音識(shí)別功能的智能遙控小車。該設(shè)計(jì)將遙控車由傳統(tǒng)的手動(dòng)遙控改成了語音識(shí)別遙控,集成了先進(jìn)的語音識(shí)別技術(shù),加上小車的機(jī)動(dòng)靈活的特點(diǎn),使控制者可以通過語音控制小車實(shí)現(xiàn)預(yù)設(shè)動(dòng)作,從而釋放控制者的雙手,而且小車和控制者之間還具有一定的交互功能。所以此次研究具有較強(qiáng)的實(shí)用性和發(fā)展前景。
繼電器驅(qū)動(dòng)電路的設(shè)計(jì)
由于單片機(jī)I/O口提供的電流太小,不能直接驅(qū)動(dòng)繼電器工作。在這里采用8050NPN管來提供一個(gè)開關(guān)電壓,實(shí)現(xiàn)I/O口對(duì)繼電器的驅(qū)動(dòng);用IN4007去掉繼電器斷開時(shí)線圈產(chǎn)生的反向電流,保護(hù)8050NPN管不被損壞。繼電器驅(qū)動(dòng)電路如圖所示。
行駛狀態(tài)控制電路設(shè)計(jì)
如圖所示為行使?fàn)顟B(tài)控制電路,整個(gè)小車的行駛狀態(tài)由兩個(gè)電機(jī)MOTOR A和MOTOR B來控制;MOTOR A控制小車的左邊兩個(gè)輪子,MOTOR B控制小車右邊兩個(gè)輪子。具體控制如所示。
麥克錄音輸入及AGC電路
麥克風(fēng)電路如圖所示。凌陽的SPCE061A是16位單片機(jī),具有DSP功能,有很強(qiáng)的信息處理能力,最高時(shí)鐘可達(dá)到49M,具備運(yùn)算速度高的優(yōu)勢等等,這為語音的播放、錄放、合成及辨識(shí)提供了條件。本系統(tǒng)接入MIC電路如下圖所示,MIC為錄制語音辨識(shí)命令服務(wù)。麥克錄音輸入及AGC電路。
語音播報(bào)電路
音頻部分的原理圖如下所示,在下圖中可以看到兩個(gè)跳線,其作用在于可以測量DAC的輸出波形;另外拔掉跳線,可以斷開DAC到喇 叭放大的通路,使得DAC通道處于開路狀態(tài)。這樣便于用DAC做其他用途,用戶可以用過這個(gè)跳線來加入自己的外圍電路。
本設(shè)計(jì)綜合應(yīng)用了SPCE061A豐富的硬件資源,成功的實(shí)現(xiàn)了語音控制功能。下面簡單的介紹一下實(shí)際應(yīng)用中的一些資源優(yōu)勢:在硬件方面,較高的執(zhí)行速度、內(nèi)置的硬件乘法器、ADC和DAC功能、內(nèi)置的AGC自動(dòng)增益環(huán)節(jié),這些為語音處理提供了強(qiáng)大基礎(chǔ)。在軟件方面,標(biāo)準(zhǔn)的C語言編程,豐富的語音資源函數(shù)為編程提供了很大的方便。 該設(shè)計(jì)方案結(jié)構(gòu)簡單,以單芯片實(shí)現(xiàn)了語音播放與識(shí)別以及電機(jī)控制功能,相當(dāng)于“語音識(shí)別芯片+普通單片機(jī)”的功能。但是比“語音識(shí)別芯片+普通單片機(jī)”方案實(shí)現(xiàn)起來要簡單很多,而且成本也會(huì)降低很多。
TOP5 AVR單片機(jī)語音識(shí)別電路模塊
基于AVR單片機(jī)的語音識(shí)別系統(tǒng)設(shè)計(jì),系統(tǒng)以AVR單片機(jī)為控制核心,實(shí)現(xiàn)對(duì)人的語音的識(shí)別控制。系統(tǒng)采用的主控芯片為Atreel公司的 ATMEGAl28,語音識(shí)別功能采用ICR oute公司的單芯片LD3320。LD3320內(nèi)部集成語音識(shí)別算法,無需外部FLASH,RAM資源,可以很好地完成非特定人的語音識(shí)別任務(wù)。同時(shí)該芯片內(nèi)部集成了MP3播放功能,支持MPEG等格式,可實(shí)現(xiàn)語音提示或MP3歌曲的播放功能。由于內(nèi)部含有16位A/D、D/A轉(zhuǎn)換器和功放電路,所以不需要外接功放電路就可以產(chǎn)生清晰的聲音。該系統(tǒng)已經(jīng)預(yù)留好各種接口,具有良好的擴(kuò)展性。
LD3320語音識(shí)別電路
LD3320芯片是一款“語音識(shí)別”專用芯片。該芯片集成了語音識(shí)別處理器和一些外部電路,包括A/D、D/A轉(zhuǎn)換器、麥克風(fēng)接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產(chǎn)品中即可以實(shí)現(xiàn)語音識(shí)別、聲控、人機(jī)對(duì)話功能。圖3為LD3320電路原理圖,與MCU通信采用SPI總線方式,時(shí)鐘不能超過1.5MHz。
麥克風(fēng)工作電路如圖所示,音頻輸出只需將揚(yáng)聲器連接到SPOP和SPON即可。使用SPI總線方式時(shí),LD3320的MD要設(shè)為高電平,SPIS設(shè)為低電平。SPI總線的引腳有SDI,SDO,SDCK以及SCS。INTB為中斷端口,當(dāng)有識(shí)別結(jié)果或MP3數(shù)據(jù)不足時(shí),會(huì)觸發(fā)中斷,通知MCU處理。 RSTB引腳是LD3320復(fù)位端,低電平有效。LED1,LED2作為上電指示燈。
嵌入式語音識(shí)別處理ISD-SR3000應(yīng)用電路
由ISD-SR3000構(gòu)成的語音識(shí)別系統(tǒng)由電路如圖2所示。以下分別介紹電路中各部分的功能。
時(shí)鐘電路
SR3000內(nèi)含片內(nèi)振蕩器,但應(yīng)用時(shí)也可通過X1和X2/CLKIN端的外接晶振或外部時(shí)鐘源來產(chǎn)生時(shí)鐘信號(hào)。外部時(shí)鐘源信號(hào)應(yīng)通過X2/CLKIN端輸入。要注意的是,外部時(shí)鐘源電平與CLKIN的輸入電平要相符(3.3V或5V)。
外接晶振可通過X1和X2/CLKIN端與芯片內(nèi)的振蕩電路相連。為減少寄生電容和電感對(duì)振蕩頻率的影響,外接的晶振和電容應(yīng)盡量靠近X1和X2 /CLKIN端。ISD-SR3000可工作在3.3V±10%和5V±10%兩種電壓,不同電壓的接線方式不同。圖3是采用3.3V電源時(shí)的接線圖,圖 4為采用5V電源時(shí)的接線圖。SD-SR3000具有低功耗模式,在低功耗模式時(shí)的電流消耗僅12mA,此時(shí)芯片中的一些功能模塊處于未激活狀態(tài),因而不能進(jìn)行語音識(shí)別。低功耗模式時(shí)的引腳CS0和CS1必須置1,這時(shí),MWCLK、MWDIN信號(hào)將保持在Vss+0.5V,而RESET、MWCS信號(hào)則將保持在Vcc- 0.5V。
TOP6 揭秘DSP和HMM的語音識(shí)別系統(tǒng)電路
存儲(chǔ)器接口
ISD-SR3000利用擴(kuò)展的Flash(閃存)和RO來存儲(chǔ)聲音標(biāo)簽、詞匯、提示符和音質(zhì)模型。建議選用16M以上存儲(chǔ)容量的擴(kuò)展Flash存儲(chǔ)器,如Am29LA160D等。外接64kB的SRAM可實(shí)現(xiàn)HMM算法。表2給出了擴(kuò)展地址線的接口信號(hào)。
ISD-SR3000可為模擬和數(shù)字電話提供一個(gè)支持主和從CODEC接口模式的CODEC接口,該接口具有8位和16位的信道寬度,能支持可變和固定格式的通信協(xié)議。在主模式下,可利用SR3000來控制CODEC的運(yùn)行以滿足模擬電話和獨(dú)立標(biāo)準(zhǔn)的應(yīng)用;在從模式下,CODEC接口由外接信號(hào)控制,此模式可用于數(shù)字電話,如ISDN或DECT線等。CODEC接口使用的5個(gè)信號(hào)分別為CDIN、CODUT、CCLK、CFS0和CSF1。其中 CDIN、CDOUT、CCLK和CFS0被連接到第一個(gè)CODEC。CDIN、CDOUT、CCLK和CFS1被連接到第二個(gè)CODEC接口。數(shù)據(jù)通過 CDOUT輸出端傳送給CODEC接口,并通過CDIN輸入端從CODEC讀出。CCLK和CFS0端在主模式下為輸出狀態(tài),而在從模式下為輸入狀態(tài)。 CFS1是一個(gè)輸出端。
揭秘DSP和HMM的語音識(shí)別系統(tǒng)電路模塊設(shè)計(jì)
語音信號(hào)采集模塊主要包括語音信號(hào)的輸入輸出模擬通道、DSP和AD50的連接、DSP和AD50的周邊設(shè)備連接等。其中,DSP和AD50的周邊設(shè)備連接包括電源電路、時(shí)鐘電路、復(fù)位電路、存儲(chǔ)器擴(kuò)展電路和去耦電路等,這些電路的連接可查看相關(guān)芯片資料。語音信號(hào)的前后端處理主要由輸入輸出模擬通道組成。這兩個(gè)電路的主要作用是將信號(hào)進(jìn)行處理,盡量減少輸入輸出引入的噪聲。同時(shí),還可以調(diào)整輸入輸出的放大系數(shù),使語音信號(hào)適合各種不同的功放,得到最佳的語音效果。為了達(dá)到更好的效果,AD50的模擬信號(hào)輸入采用差分輸入方式,即使用兩個(gè)運(yùn)算放大器,將單端輸入信號(hào)轉(zhuǎn)換成差分輸入信號(hào),電路連接如圖3.5所示。使用差分信號(hào),信號(hào)一J下一負(fù)同時(shí)進(jìn)入采集系統(tǒng),如果此時(shí)有隨機(jī)噪聲出現(xiàn),通過『F負(fù)信號(hào)的加減,可以有效消除部分噪聲。
AD50差分輸入電路
AD50的D/A輸出為差分信號(hào),可以直接驅(qū)動(dòng)600歐姆的負(fù)載。
差分輸出電路
要使TLC320AD50正常工作,還需要進(jìn)行電源供電及去耦電路以及一些功能引腳包括幀同步延遲輸出、電壓下拉、輸出監(jiān)控、參考電壓過濾輸出等的連接,具體連接如圖3.7所示。
TLC320AD50外圍電路
DSP通過多通道緩沖串口連接AD50。DSP最多可以使一個(gè)緩沖串口與3個(gè)AD50芯片連接。本系統(tǒng)采用DSP為主設(shè)備、AD50為從設(shè)備的連接方法。如圖3.8所示,AD50的時(shí)鐘信號(hào)MCLK由DSP的定時(shí)器0的輸出TOUT0提供,時(shí)鐘頻率可以通過設(shè)置定時(shí)器0來改變。AD50的移位時(shí)鐘輸出 SCLK連接到DSP的緩沖串口0的接收時(shí)鐘引腳CLKR0,幀同步信號(hào)FS連接到DSP緩沖串口0的FRXO。AD50的FC引腳連接到DSP的通用 I/O引腳XF,用于控制二次串行通信。圖3.8中DSP的DR0為輸入,其余均為輸出。
TOP7 程序存儲(chǔ)器電路
程序存儲(chǔ)器主要用于系統(tǒng)運(yùn)行時(shí),將采集的數(shù)字語音信號(hào)暫時(shí)存儲(chǔ)在RAM中以備后續(xù)的處理。由于采集的數(shù)據(jù)不是太大,擴(kuò)展32k的程序存儲(chǔ)器即可滿足要求。因此本系統(tǒng)只用到CY7C1021的低32k字空間,將DSP的地址線的低15位與CY7C1021的地址線引腳相連,而地址線的1卜18位通過一個(gè)數(shù)字邏輯電路后用于尋址CY7C1021的低32k字空間。電路原理圖如圖3.9所示。
Y7C1021主要電路原理圖
圖3.10是CY7C1021讀和寫信號(hào)數(shù)字邏輯電路。圖中,DSP的DSP—R/W和DSP—MSTRB引腳通過或門后的輸出作為SRAM的寫信號(hào),DSP—R/W的非和DSP—MSTRB引腳通過或門后輸出作為SRAM的讀信號(hào)。
圖3.1l是CY7C1021的第16位地址引腳數(shù)字邏輯電路。圖中,DSP A15經(jīng)過一個(gè)非門作為二四譯碼器SN74LSl39AD的使能信號(hào),DSP A16和DSP A17經(jīng)過譯碼器后輸出端Yl與Y2的非通過一個(gè)與門后的輸出作為SRAM的第16位地址線。因此,低32k的SRAM映射到DSP程序空間的0X1 8000__oXlFFFF。
數(shù)據(jù)存儲(chǔ)器電路
數(shù)據(jù)存儲(chǔ)器主要用于存儲(chǔ)編譯后的系統(tǒng)軟件的數(shù)據(jù),用于語音識(shí)別系統(tǒng)板上電自舉。選用flash芯片,是因?yàn)閒lash芯片是電可擦可寫芯片,可以在線對(duì)flash進(jìn)行操作,修改應(yīng)用程序方便。地址緩沖器和數(shù)據(jù)緩沖器電路連接分別如圖3.12和3.13所示:
SN74LVTHl6244外圍電路
SN74LVTHl6245外圍電路原理圖
TOP8 LED顯示電路與外圍電路設(shè)計(jì)
SST39VFl60有1M*16bit的容量,但擴(kuò)展數(shù)據(jù)存儲(chǔ)器只需64K空間足以,所以電路SST39VFl60的地址線的高4位接地。電路原理圖如圖3.14所示:
SST39VFl60外圍電路
LED顯示電路
LED顯示電路在此系統(tǒng)中用于顯示語音識(shí)別的結(jié)果,與輸入的語音比較可知系統(tǒng)識(shí)別率的高低。電路中用SN74LS373作為暫存器,通過DSP的I/O 端口選擇引腳IS和DSP的第17個(gè)地址引腳來控制SN74LS373的輸出使能端,用一個(gè)共陰極七段數(shù)碼管來顯示識(shí)別結(jié)果【241。電路圖如圖3.15 所示:
LED顯示電路原理圖
J-TAG電路
JTAG標(biāo)準(zhǔn)是IEEEl990年公布的1 149.1標(biāo)準(zhǔn)的又一稱呼,是針對(duì)現(xiàn)代超大規(guī)模集成電路測試、檢驗(yàn)困難而提出的、基于邊界掃描機(jī)制和標(biāo)準(zhǔn)測試存儲(chǔ)口的國際標(biāo)準(zhǔn)。JTAG標(biāo)準(zhǔn)公布以后,TI公司為其以后的DSP器件均設(shè)置符合國際標(biāo)準(zhǔn)的JTAG邏輯測試口,通過JTAG測試口訪問和調(diào)試TI DSP芯片。電路設(shè)計(jì)中需要注意的問題:當(dāng)仿真器與DSP距離大于15.24cm時(shí),JTAG仿真頭與DSP之間的EMUO、EMUl、TMS、TDI引腳互聯(lián)時(shí)應(yīng)通過上拉電阻接高電平,而TMS、TDI、TDO、TCK之問互聯(lián)時(shí)還要加緩沖器,只在距離小于15.24cm時(shí)它們之間不用通過緩沖器連接。
JTAG在線仿真電路原理圖
電源電路
此系統(tǒng)中,有兩類電壓,一類是DSP芯片的內(nèi)核電壓,為1.8V,另一類是DSP的外圍電路供電電壓,為3.3V。為了能夠滿足雙電壓供電,本系統(tǒng)選用TPS767D318電源芯片供電。根據(jù)芯片推薦電路搭建電路原理圖如圖3.17所示:
系統(tǒng)電源供電電路原理圖
簡述了與硬件相關(guān)的驅(qū)動(dòng)程序的設(shè)計(jì),將硬件驅(qū)動(dòng)程序與語音識(shí)別程序綜合,編譯通過后載入目標(biāo)板即對(duì)語音信號(hào)進(jìn)行識(shí)別。介紹了一個(gè)基于DSP的非特定人漢語孤立數(shù)字語音識(shí)別系統(tǒng)的設(shè)計(jì)過程,系統(tǒng)通過AD50芯片將模擬語音信號(hào)采集到DSP芯片中,再采用語音識(shí)別算法對(duì)采集到的信號(hào)進(jìn)行處理,并將識(shí)別的結(jié)果用LED輸出完成了整個(gè)系統(tǒng)設(shè)計(jì)。
TOP9 語音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人應(yīng)用電路
語音是人類最常用的交流方式,也是人類和計(jì)算機(jī)交流最渴望的方式。因此用語音同計(jì)算機(jī)交流也成為了最近研究的熱點(diǎn),計(jì)算機(jī)對(duì)語音的理解是計(jì)算機(jī)科學(xué)中的一個(gè)引人人勝的、富有挑戰(zhàn)性的課題。我國語音識(shí)別研究工作開始的較晚,但近年來發(fā)展得很快,一直緊跟國際水平,國家也很重視,中科院自動(dòng)化所研制的非特定人、連續(xù)語音聽寫系統(tǒng)和漢語語音人機(jī)對(duì)話系統(tǒng),其字準(zhǔn)確率或系統(tǒng)響應(yīng)率可達(dá)90%以上。鑒于中國未來龐大的市場,國外也非常重視漢語語音識(shí)別的研究。
STM32嵌入式語音識(shí)別電路模塊設(shè)計(jì)
介紹了一種以ARM為核心的嵌入式語音識(shí)別模塊的設(shè)計(jì)與實(shí)現(xiàn)。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對(duì)話管理單元為中心,通過以LD3320芯片為核心的硬件單元實(shí)現(xiàn)語音識(shí)別功能,采用嵌入式操作系統(tǒng)μC/OS-II來實(shí)現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,本文設(shè)計(jì)的語音識(shí)別模塊具有高實(shí)時(shí)性、高識(shí)別率、高穩(wěn)定性的優(yōu)點(diǎn)。
語音識(shí)別電路
圖3為語音識(shí)別部分原理圖,參照了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊進(jìn)行設(shè)計(jì)。LD3320的內(nèi)部集成了快速穩(wěn)定的優(yōu)化算法,不需外接Fla-sh、RAM,不需要用戶事先訓(xùn)練和錄音而完成非特定人語音識(shí)別,識(shí)別準(zhǔn)確率高。
圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數(shù)據(jù)段還是地址段;控制信號(hào),復(fù)位信號(hào)以及中斷返回信號(hào)INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統(tǒng)穩(wěn)定工作;和STM32F103C8T6采用同一個(gè)外部8 MHz時(shí)鐘;發(fā)光二極管D1、D2用于復(fù)位后的上電指示;MBS(引腳12)作為麥克風(fēng)偏置,接了一個(gè)RC電路,保證能輸出一個(gè)浮動(dòng)電壓給麥克風(fēng)。
智能語音識(shí)別云臺(tái)轉(zhuǎn)動(dòng)模塊電路設(shè)計(jì)
云臺(tái)轉(zhuǎn)動(dòng)電路
雙自由度云臺(tái)有4 個(gè)控制轉(zhuǎn)動(dòng)方向的端口, 分別是水平左轉(zhuǎn)、水平右轉(zhuǎn)、上升、下降, 需要24 V 的交流電來驅(qū)動(dòng), 而語音識(shí)別結(jié)果的二進(jìn)制序列經(jīng)過解碼后由單片機(jī)AT89S52 的I/O 口輸出, 其端口電平是0 ~5 V 的直流。為了能使單片機(jī)根據(jù)語音識(shí)別結(jié)果驅(qū)動(dòng)云臺(tái)轉(zhuǎn)動(dòng),在AT89S52 和云臺(tái)之間放置一個(gè)電流放大器件ULN2003 。ULN2003 是大電流、高耐壓達(dá)林頓陣列, 包括7 個(gè)達(dá)林頓管, 在5 V 的工作電壓下, 能夠與TTL 和CMOS 電路直接相連, 這樣就可以直接處理原來需要標(biāo)準(zhǔn)邏輯緩沖器來處理的數(shù)據(jù)。將控制云臺(tái)轉(zhuǎn)動(dòng)方向的4 個(gè)端口D_Right 、D_Left 、D_Up 、D_Down 分別與繼電器K1、K2、K3、K4 相連, 單片機(jī)AT89S52 根據(jù)解碼后的語音識(shí)別結(jié)果控制繼電器的斷開和閉合, 從而控制云臺(tái)轉(zhuǎn)動(dòng)的方向和角度。云臺(tái)轉(zhuǎn)動(dòng)電路圖如圖所示。
TOP10 語音識(shí)別播放電路
語音識(shí)別播放電路主要由語音芯片LD3320、STC10L08XE 單片機(jī)及其他外圍電路構(gòu)成。語音芯片LD3320 內(nèi)部固化有完整的非特定人語音識(shí)別特征庫和高效的非特定人語音識(shí)別搜索引擎模塊, 不需要事先訓(xùn)練和錄音。只需要單片機(jī)把候選識(shí)別語句的拼音串傳入芯片內(nèi)部, 通過芯片內(nèi)部的DSP 算法, 找出最佳識(shí)別結(jié)果。同時(shí)此芯片還支持MP3 播放功能, 此時(shí)需要外接Flash 芯片, 用來存儲(chǔ)播放的聲音素材等數(shù)據(jù)。STC10L08XE 單片機(jī)讀取串行存儲(chǔ)芯片的MP3 數(shù)據(jù), 依次送入LD3320 芯片內(nèi)部就可以從芯片的相應(yīng)引腳輸出聲音。STC10L08XE 單片機(jī)與語音芯片LD3320 之間采用并行的通信方式, 故在硬件上需要使用8 根數(shù)據(jù)線和4 個(gè)控制信號(hào)將語音芯片與單片機(jī)并行連接。
最小系統(tǒng)電路
最小系統(tǒng)電路圖如下圖所示,在OSC0,OSC1 口接晶振以及諧振電容,在鎖相環(huán)接入相應(yīng)電容電阻,在電源端和接地端接上0.1UF 去耦電容,提高考干擾能力。
SPCE061A 語音識(shí)別模塊硬件結(jié)構(gòu)
在SPCE061A 主控芯片對(duì)語音信號(hào)進(jìn)行A/D 轉(zhuǎn)換具有專門的轉(zhuǎn)換通道——聲音模-數(shù)轉(zhuǎn)換通道。并且SPCE061A 內(nèi)部置有麥克風(fēng)放大電路和自動(dòng)增益控制部分。自動(dòng)增益控制部分可以自動(dòng)調(diào)節(jié)所收到的麥克風(fēng)音量,這樣使得該系統(tǒng)不會(huì)受到發(fā)送命令的人所處位置的限制。 SPCE061A 內(nèi)部的麥克風(fēng)前置放大電路主要由輸入級(jí)、中間級(jí)、輸出級(jí)三部分組成,輸入級(jí)采用的是差分放大電路,它是麥克風(fēng)前置放大電路的主要組成部分,差分放大電路作為輸入級(jí)有很大的優(yōu)勢,能夠有效的抑制輸入端輸入的共模干擾,對(duì)于輸入的有效差分信號(hào)則不會(huì)產(chǎn)生任何干擾。本系統(tǒng)的語音識(shí)別信號(hào)輸入電路如下圖所示。 C23,C24 是作為退偶電容用,減少噪音信號(hào)對(duì)語音識(shí)別的干擾。
SPCE061A 的音頻輸出模塊硬件電路設(shè)計(jì)圖如下所示:
電源模塊電路設(shè)計(jì)分析
TOP11 RSC-4X系列語音識(shí)別集成應(yīng)用電路
在本系統(tǒng)中SPCE061A 所需要用到的3.3V 電源,采用AMS1117 芯片產(chǎn)生。AMS1117 是一個(gè)正向低壓降穩(wěn)壓器,AMS1117 有兩種:一種為固定輸出電壓,輸出的電壓值有:1.5V、1.8V、2.5V、2.85V、3.0V、3.3V;另一種為可調(diào)節(jié)輸出電壓。AMS1117 內(nèi)部集成了過熱保護(hù)電路和過流保護(hù)電路。為了保護(hù)AMS1117 的穩(wěn)定性,在輸出端要接一個(gè)至少22UF 的鉭電容由AMS1117 構(gòu)成的3.3V 電壓產(chǎn)生電路圖。
由LM2576 構(gòu)成的5V 電壓產(chǎn)生電路圖如下圖所示:
電機(jī)驅(qū)動(dòng)模塊硬件電路設(shè)計(jì)
L298 是專用驅(qū)動(dòng)集成電路,可以驅(qū)動(dòng)感性負(fù)載,例如:大功率直流電機(jī)和步進(jìn)電機(jī)等,可驅(qū)動(dòng)46V,2A 以下的電機(jī)。其輸入端可以直接與單片機(jī)連接,并且可以實(shí)現(xiàn)電機(jī)的正轉(zhuǎn)、反轉(zhuǎn)、加速和減速等控制。L298 有兩個(gè)電源,分別為邏輯電源和動(dòng)力電源,6V 為邏輯電源。12V 為動(dòng)力電源。電路圖如下所示:
總的來說,計(jì)還是比較簡單的,對(duì)于語音識(shí)別技術(shù)更是有了全新的認(rèn)識(shí),完全掌握了SPCE061A的原理及其技術(shù)。還有,語音識(shí)別是一項(xiàng)很有應(yīng)用前景的全新項(xiàng)目,可以應(yīng)用于多種未來新新項(xiàng)目,應(yīng)用范圍廣,可靠性高。是一個(gè)很有前途的創(chuàng)新項(xiàng)目!
RSC-4X系列語音識(shí)別集成應(yīng)用電路設(shè)計(jì)
RSC-4x系列是新一代嵌入式語音識(shí)別處理器集成電路,它具有集成度高、外圍電路簡單、功耗低、不怕掉電、使用方便等特點(diǎn)。一個(gè)完整的語音識(shí)別系統(tǒng)僅由RSC-4x系列芯片及少量外部元器件(揚(yáng)聲器、麥克風(fēng)、音頻輸入/輸出電路、存儲(chǔ)器和電池或整流穩(wěn)壓電源)等組成.R S C-4 x系列芯片適用7.0語音識(shí)別技術(shù)RSC-4x系列芯片通常采用48P/64P/100P-LQFP封裝。
工作原理:RSC-4x是一種交互式智能語音識(shí)別電路,通過執(zhí)行內(nèi)嵌的馬爾可夫鏈和神經(jīng)網(wǎng)絡(luò)去處理語音識(shí)別。說話者需要在芯片的外部存儲(chǔ)器(如 sRAM、EEPROM、閃存等)存儲(chǔ)語音識(shí)別信息,識(shí)別過程中需要ROM去存儲(chǔ)要被識(shí)別的字.RSC-4x有如下幾個(gè)獨(dú)創(chuàng)的識(shí)別特性:
1、語音識(shí)別無須訓(xùn)練。在一個(gè)活動(dòng)單元內(nèi)可識(shí)別16個(gè)字(單元存儲(chǔ)的字由內(nèi)部ROM和外部存儲(chǔ)器限制)。
2、連續(xù)接收每一個(gè)特殊的字。由于這個(gè)功能,所以此產(chǎn)品可以用在一般的場合和對(duì)一些特殊的字時(shí)需要安靜的環(huán)境。
3、字定點(diǎn)測量允許芯片一次可連續(xù)接收達(dá)5個(gè)SI或10個(gè)SD,在該字定點(diǎn)方式下,無須保持安靜的環(huán)境.RSC-4x系列可在芯片的sRAM中存儲(chǔ)6個(gè)sD字或在外部存儲(chǔ)器中存入更多的字。
RSC-4x利用巧妙的頻域規(guī)則提供高質(zhì)量語音合成,典型的數(shù)據(jù)率小于5k/s.語音合成需要片內(nèi)或片外ROM去存儲(chǔ)所要合成的語音數(shù)據(jù).RSC-4x 提供4種高質(zhì)量音樂/語音合成手段.RSC-4x獨(dú)到之處還有可使用計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)產(chǎn)生具有128種音色、47種真實(shí)樂器聲的高檔音樂 MIDI.。RSC-4x可以在不同的采樣比率下對(duì)聲音進(jìn)行錄音和重播,采樣比取決于對(duì)語音時(shí)長和音質(zhì)的要求,數(shù)據(jù)率在14k/s時(shí),一般就可以獲得較高音質(zhì)的效果.RSC-4x還可以消除靜差以提高聲音質(zhì)量和減少存儲(chǔ)容量。
評(píng)論