基于Directshow的H.264流媒體播放器設計
DirectsHow應用框架完成了流媒體處理的底層工作,使得編程者無需關心數(shù)據(jù)如何輸入,以及處理完后如何輸出,而只需關心如何對輸入數(shù)據(jù)進行處理。H.264視頻編解碼標準具有高壓縮比和優(yōu)良的網(wǎng)絡親和性,被普遍認為是最有影響力的流媒體視頻壓縮標準。將Direct-show和H.264兩種相結合的流媒體播放器無疑將具有非常優(yōu)秀的性能。
1Directshow技術和H.264視頻壓縮標準簡介
Directshow是微軟公司提供的一套流媒體開發(fā)軟件包,為在windows平臺上處理各種格式的媒體文件的回放、音視頻采集的高性能要求的多媒體應用,提供了完整的解決方案。
Directshow是一套完全基于COM的應用系統(tǒng),該系統(tǒng)位于應用層中,它使用FilterGraph的模型來管理整個數(shù)據(jù)流的處理過程;參與數(shù)據(jù)處理的各個功能模塊叫Filter;各個Filter在FilterGraph中按照一定的順序連接成一條“流水線”協(xié)同工作。Filter是一個COM組件,其功能可以由用戶自行實現(xiàn),DirectShowSDK也為用戶提供了一些標準的Filter供用戶使用。各個Filter在FilterGraph中按一定順序通過Pin互相連接起來,Pin也是一個COM對象。
H.264是由ITU-T和ISO/IEC的聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標準。H.264/AVC視頻編碼標準在編碼質量和壓縮比上比原有的視頻編碼標準都有了明顯的提高。在相同的視覺感知質量上,編碼效率比H.263,MPEG-2和MPEG-4提高了50%左右。H.264不僅具有優(yōu)異的壓縮性能,而且具有良好的網(wǎng)絡親和性。因此,H.264被普遍認為是最有影響力的流媒體視頻壓縮標準。
2系統(tǒng)設計框架
本系統(tǒng)基于Direotshow應用框架和H.264視頻壓縮標準,實現(xiàn)了從網(wǎng)絡接收流媒體數(shù)據(jù),并在客戶端實時播放的功能。流媒體文件是采用H.264編碼的AVI文件,由于directshow提供了AVISplitteRFilter、AudioDecoder和標準的Video/AudioRenderer,因此,本系統(tǒng)只需設計自定義的網(wǎng)絡源Filter、H.264解碼Filter。
多媒體流式傳輸實際上牽涉到兩個方面的技術。其一就是服務器與客戶端的通信技術,包括多媒體數(shù)據(jù)的傳輸、命令控制等;其二就是客戶端對接收到的多媒體流實時解碼后播放的技術。顯然,網(wǎng)絡通信可以使用windowssocket技術,多媒體流的解碼播放可以使用direct-show技術。本文采用direetshow應用框架,設計了網(wǎng)絡源filter和h.264解碼filter,并通過FilterGraph構建了流媒體播放器。
播放本地基于H.264編碼的AVI文件的FilterGraph如圖1。只需將本地FileSourceFilter替換為網(wǎng)絡源Filter,將CoreAVCVideoDe-coder替換為h.264解碼Filter,即可實現(xiàn)網(wǎng)絡H.264視頻播放器。
3系統(tǒng)的設計與實現(xiàn)
3.1Filter設計流程
Filter的編碼實現(xiàn)包括Filter的注冊信息、Filter上的框架函數(shù)實現(xiàn)、邏輯控制類實現(xiàn)、自定義接口實現(xiàn)、屬性頁實現(xiàn)、產(chǎn)權保護等。
首先,要對Filter所要完成的功能和它在FilterGraph中的位置進行分析,以確定filter模型,選擇一個合適的基類;然后,再定義輸入輸出PIN以及自定義接口,注冊Filter信息;最后實現(xiàn)基類的全部純虛函數(shù)和自定義接口函數(shù),并重寫基類的相關函數(shù)以定制filter功能。
3.2網(wǎng)絡源Filter的設計
源Filter主要功能是接收服務器發(fā)來的流媒體數(shù)據(jù),并提供給FilterGraph中其它Filter使用。
由于directshow自帶的AVIsplitter工作于拉模式,故該源Filter也工作于拉模式。
本源Filter采用雙緩沖循環(huán)隊列技術來實現(xiàn)數(shù)據(jù)的接收和向下一級Filter傳遞數(shù)據(jù)。采用該技術有如下理由:
(1)在SourceFilter與SpliRer連接的過程中,會從SourceFilter中讀取一部分數(shù)據(jù),以獲得數(shù)據(jù)的格式描述,否則FilterGraph無法完成連接。源Filter與SplitterFilter進行連接前,應啟動一個等待線程,當SourceFilter的數(shù)據(jù)緩存預先接收到足夠的數(shù)據(jù)后,再構建完整的FilterGraph。
(2)當完整的FilterGrapH構建完成,并且處于運行狀態(tài)后,SourceFilter必須動態(tài)地接收數(shù)據(jù),并持續(xù)地把新數(shù)據(jù)提供給SplitteRFilter,雙緩沖循環(huán)隊列既充分利用內(nèi)存空間,又能為SplitterFilter提供穩(wěn)定的數(shù)據(jù)源。
(3)緩沖隊列可以穩(wěn)定碼率,有效減小網(wǎng)絡延時、阻塞和抖動的影響。
源Filter的工作過程如下:建立一個循環(huán)緩沖隊列,隊列尾指針用于緩沖從網(wǎng)絡接收的數(shù)據(jù),隊列頭指針供Splitter讀取數(shù)據(jù),進行音視頻分離,并傳給下一級Decoder處理;當Socket接收到網(wǎng)絡數(shù)據(jù)后,將數(shù)據(jù)插入隊列尾部,并使尾指針后移;當Splitter需要讀取數(shù)據(jù)時,從隊列頭讀取數(shù)據(jù),并使頭指針后移。
流媒體傳輸采用客戶端/服務器的架構,服務器與客戶端之間還有一個Socket通信協(xié)議問題,由于流媒體是連續(xù)的,它的同步點不能隨意選擇,因此,為了傳送流媒體數(shù)據(jù),必須使用面向連接的可靠的傳輸協(xié)議(TCP)??蛻舳伺c服務器端的控制與反饋消息,則可以使用(UDP)來傳輸。服務器端首先創(chuàng)建一個偵聽Socket,偵聽來自客戶端的連接請求。一旦偵聽到客戶端的請求,服務器端就創(chuàng)建一個用于數(shù)據(jù)傳送的Socket,并綁定到請求連接的客戶端,此時,服務器處于數(shù)據(jù)傳送的就緒狀態(tài)。當客戶端發(fā)出命令,服務器再根據(jù)命令的類型執(zhí)行相應的操作,如數(shù)據(jù)發(fā)送、停止、斷開連接等。
在服務器端首先將連續(xù)的H.264流分成一塊一塊小包的負載數(shù)據(jù),并且加上一個信息頭一起使用TCP協(xié)議發(fā)送;在客戶端根據(jù)信息頭描述,將小包的負載數(shù)據(jù)進行拼裝,然后進行H.264的解碼播放。Socket數(shù)據(jù)傳送結構為:負載類型(8bit)、負載數(shù)據(jù)長度(16bit)和負載數(shù)據(jù)包(2324Byte)。
客戶端的實現(xiàn)可以參考SDK中的MEMFileFilter,直接從SDK例子將asyncrdr.cpp、asyncrdr.h、asyncio.cpp、asyneio.h四個文件拷貝過來,然后在MemFilter.h文件中從CAsyncStream派生流處理類CMemStream,定制數(shù)據(jù)源并進行數(shù)據(jù)的讀取操作;從CAsyncReader派生濾波器類CMemReader,實現(xiàn)含1個輸出PIN的SourceFilter框架,完成與SplitterFilter的連接。
網(wǎng)絡源濾波器類間數(shù)據(jù)流程如圖2,下一級Filter“拉”線程數(shù)據(jù)流程如圖3。其中:CAsyneStream用以標示數(shù)據(jù)流;CAsyneRequest標示輸入與輸出請求;CAsyncIo實現(xiàn)數(shù)據(jù)輸入和輸出的控制。編程主要實現(xiàn)CMemStream:Read()函數(shù)以實現(xiàn)從特定的數(shù)據(jù)源讀取數(shù)據(jù)到下一級Filter的Sample中。
該濾波器工作于Splitter和Rendererfilter之間,包含一個輸入和一個輸出,且輸入和輸出pin上的媒體類型不一致,故選擇CTrans-formFilter作為基類,派生子類CX264Decode。
ffmpeg是一個集錄制、轉換、音/視頻編碼解碼功能為一體的完整的開源解決方案。利用ffmpeg中的Libavformat和libavcodec庫訪問大多數(shù)視頻文件格式是一個很好的方法。將ffmpeg中關于h.264解碼的操作封裝為C++類,供H.264解碼Filter調(diào)用以實現(xiàn)解碼功能。
子類CX264Decode必須要實現(xiàn)的純虛函數(shù)有:CheckInputType()實現(xiàn)輸入Pin上的媒體類型檢查;CheckTransform()檢查是否支持從該輸入pin到輸出pin的變換操作;DecideBufferSize()決定Samlple內(nèi)存的大小;GetMediaType():提供輸出Pin上的首選媒體類型;Transform():實現(xiàn)解碼變換。
子類CX264Decode可選的重寫虛函數(shù)有:初始化和反初始化流:StartStreaming()和StopStreaming();響應質量通告消息:AlterQuali-ty();獲取媒體類型被實際設置的時間:SetMediaType();連接時獲取額外的接口:CheckConnect()、BreakConnect()和CompleteConneet();定制變換過程:Receive();標準化設置輸出Sample:InitializeOutputSample()。
本Filter設計主要流程如下:
(1)Filter注冊信息
定義類工廠模板,填寫Filter的注冊信息;同時實現(xiàn)DLL文件所必須實現(xiàn)的注冊和反注冊函數(shù):DLLRegisterServer和DLLUnregisterSe-rver。
(2)框架函數(shù)的實現(xiàn)
實現(xiàn)函數(shù)CreateInstanee,用于創(chuàng)建Filter對象實例;實現(xiàn)函數(shù)CheeklnputType,用于對輸入Pin上的媒體類型檢查;實現(xiàn)函數(shù)Transfo-rm,用于H.264的解碼操作;實現(xiàn)函數(shù)NonDelegafingQueryIntefface,用于暴露Filter支持的自定義接口,使應用程序可以設置解碼器的參數(shù);實現(xiàn)函數(shù)CompleteConnect,可以在輸入Pin成功連接后取得媒體類型描述,并將輸入數(shù)據(jù)的格式設置給應用邏輯控制對象;實現(xiàn)函數(shù)St-artStreaming和StopStreaming,可以分別調(diào)用應用控制邏輯對象的相應函數(shù),進行流處理的初始化和反初始化操作。
(3)邏輯控制類的實現(xiàn)
邏輯控制類是本Filter設計的核心,框架函數(shù)和自定義接口函數(shù)的相關操作都是委托給邏輯控制類來實現(xiàn)的。該類實現(xiàn)了H.264.的解碼參數(shù)的設置與解碼操作,主要調(diào)用封裝了H.26
c++相關文章:c++教程
p2p機相關文章:p2p原理
評論