圖像質(zhì)量分析:客觀視頻質(zhì)量的實(shí)時(shí)測(cè)量
概覽
本文引用地址:http://cafeforensic.com/article/192860.htm數(shù)字聲頻與音頻為消費(fèi)者提供了立體聲且高清晰度的聲頻體驗(yàn),而相關(guān)測(cè)試則從傳統(tǒng)的靜態(tài)、單幀像分析,轉(zhuǎn)換為動(dòng)態(tài)測(cè)試、圖像質(zhì)量分析。 雖然單幀像分析可提供信號(hào)定時(shí)、色深、線條同步化,以及更多有用信息,但壓縮/解壓縮算法與緩沖錯(cuò)誤的數(shù)字影像也常造成瑕疵,且無(wú)法通過單幀像所察覺。 常見錯(cuò)誤則包含宏區(qū)塊、幀像停滯、聲頻遺失與截?cái)啵蛳袼鼗?此篇教學(xué)指南概述了圖像質(zhì)量分析,并說明NI Picture Quality Analysis軟件應(yīng)如何搭配NI Digital Video Analyzer使用,偵測(cè)數(shù)字聲頻與視頻的瑕疵或假影。
HDMI串流的常見瑕疵
首先應(yīng)了解圖像質(zhì)量分析,從而知道數(shù)字視頻系統(tǒng)可能產(chǎn)生的瑕疵類型。 而用戶自己就能發(fā)覺最常見、最重要的瑕疵,如宏區(qū)塊、像素化、幀像模糊、停滯、遺失、聲頻截?cái)嗪蚅ipSync。
宏區(qū)塊– 數(shù)字影像往往是通過MPEG 4或H.264壓縮成多個(gè)8x8色塊。 若壓縮/解壓縮算法之間并無(wú)高度相關(guān),則可能產(chǎn)生多個(gè)定義邊緣的區(qū)域。 這就是宏區(qū)塊。
圖1. 若原始圖像的解壓縮效果不佳,宏區(qū)塊就可能在解壓縮后的像素之間形成定義邊緣。
若傳輸期間遺失數(shù)據(jù),則解碼器將無(wú)法正確讀取數(shù)據(jù)區(qū)塊從而檢索原始的像素?cái)?shù)據(jù),這樣會(huì)造成明顯的掉色區(qū)塊錯(cuò)誤。 與宏色塊相比,雖然這些錯(cuò)誤均較為少見,但仍極為明顯。
圖 2. 因數(shù)據(jù)遺失與錯(cuò)誤解碼而產(chǎn)生的像素化錯(cuò)誤。
– 在解碼或調(diào)整期間,可能遺失高頻率的組件,進(jìn)而在邊緣之間遺失定義,或出現(xiàn)模糊的情況。 視頻信號(hào)將因此丟失清晰度或鮮明度。
圖3. 模糊將使視頻信號(hào)產(chǎn)生不清晰的邊緣。 圖左在黑、白邊緣之間的定義較不明顯。
從圖1到圖3呈現(xiàn)了單一圖像的模糊、像素化、宏區(qū)塊;這些瑕疵往往不會(huì)再各個(gè)幀像逐一出現(xiàn),而必須全時(shí)間完整測(cè)量設(shè)備以獲得正確的結(jié)果。其他瑕疵如幀像停滯/遺失、聲頻切割、LipSync (聲頻/視頻同步化),也需分析多組幀像。
圖像質(zhì)量分析評(píng)分
圖像質(zhì)量分析即測(cè)量視頻流的整體。 因此匯集了專業(yè)技術(shù)人員觀看視頻,并以其專業(yè)的主觀角度評(píng)分,設(shè)立了Differential Mean Opinion Scores (DMOS)。 但此方法仍有許多待解的難題,如訓(xùn)練技術(shù)人員的成本,還有操作人員觀看屏幕的重復(fù)性成本。 另一個(gè)重大挑戰(zhàn)則是關(guān)于主觀測(cè)試的質(zhì)量。 在制造過程中,根本不可能聘請(qǐng)視頻質(zhì)量專家觀看各組設(shè)備的生產(chǎn)細(xì)節(jié),只能讓水平較差的操作人員觀看視頻并評(píng)分。 因此如分心、疲勞、眼睛過度刺激等人為因素,均會(huì)降低產(chǎn)品品質(zhì)而讓劣質(zhì)品過關(guān),由此促使了工程師必須重新設(shè)計(jì)影像測(cè)試的方法。
較好的圖像質(zhì)量分析方式,即必須能重復(fù)套用客觀的測(cè)量方式,以測(cè)量音頻與視頻的質(zhì)量。 目前有多種算法,均與專業(yè)操作人員的主觀評(píng)分相關(guān)。常見的兩種測(cè)量之一為峰值信噪比 (PPSNR),它是以均方差 (MSE)以及德州大學(xué)圖像與視頻工程實(shí)驗(yàn)室(LIVE)的Al Bovik教授和其團(tuán)隊(duì),所設(shè)定的結(jié)構(gòu)相似性(SSIM)指數(shù)為構(gòu)架。 此項(xiàng)指數(shù)已成為最具公信力的視頻質(zhì)量測(cè)量指數(shù)。 只要套用如PSNR與SSIM算法,即可通過自動(dòng)化、可重復(fù)的測(cè)量方法,輕松評(píng)定視頻質(zhì)量。
圖4. 愛因斯坦照片的比較,代表了不同的失真程度: a) 參考圖像, b)平均對(duì)比伸展, c)亮度平移, d)高斯噪音污染,e)脈沖噪音污染, f)JPEG壓縮, g)模糊, h)空間縮放 (縮小), i)空間平移 (向右), i)空間平移 (向左), k)旋轉(zhuǎn) (逆時(shí)針), l)旋轉(zhuǎn) (順時(shí)針)。
下載 “Image Quality Assessment: From Error Visibility to Structural Similarity” 由Zhou Wang與Alan C. Bovik撰寫,并被IEEE Signal Processing Society授予最佳學(xué)術(shù)文章獎(jiǎng)。
另一種視頻質(zhì)量測(cè)試方法是測(cè)量視頻與音頻內(nèi)容的特定假影。 此時(shí)可套用特定瑕疵算法,以找出視頻中的特定錯(cuò)誤,如方格或幀像停滯/遺失。 許多生產(chǎn)應(yīng)用不太需要如PSNR或SSIM的高性能測(cè)試。 反之,往往僅需確認(rèn)沒有產(chǎn)生宏區(qū)塊、聲頻切割、視頻停滯即可。 通過特定瑕疵的測(cè)量,即可迅速?zèng)Q定該款設(shè)備是通過還是失敗。
具備NI Picture Quality Analysis軟件的NI Digital Video Analyzer能夠測(cè)量特定瑕疵,也可達(dá)到如PSNR與SSIM的高圖像質(zhì)量測(cè)量。 通過用戶定義的測(cè)量,即可套用自定義的算法,以建立完全自定制的圖像質(zhì)量分析應(yīng)用。
圖5. 針對(duì)水平與垂直空間中的宏區(qū)塊,需采集并分析1080p60的視頻流。
參考與無(wú)參考測(cè)試
針對(duì)視頻/音頻流,進(jìn)行圖像質(zhì)量分析測(cè)量的方法目前有三種。
1. 無(wú)參考測(cè)試: 不論圖像內(nèi)容如何,此方式可將測(cè)量套用至任何系統(tǒng)。 而此測(cè)量方式的挑戰(zhàn)之處在于,因分析圖像內(nèi)容的不同,測(cè)量結(jié)果的差異也相當(dāng)大。
2. 簡(jiǎn)化參考測(cè)試: 簡(jiǎn)化參考測(cè)試則需要“金級(jí)”或理想樣本設(shè)備。在測(cè)量了金級(jí)樣本設(shè)備的音頻/視頻質(zhì)量之后,其它設(shè)備即根據(jù)金級(jí)樣本結(jié)果進(jìn)行測(cè)試,以定義該系統(tǒng)是通過還是失敗。
3. 完全參考測(cè)試:: 完整參考測(cè)試也需要金級(jí)的樣本設(shè)備。但不同于簡(jiǎn)化參考測(cè)試(分e測(cè)量測(cè)試與參考流),完整參考是將2組串流依像素進(jìn)行分析。它是目前功能最為強(qiáng)大的測(cè)試,但針對(duì)參考串流的分析,其處理/存儲(chǔ)/檢索的難度更高。PSNR與SSIM測(cè)量均屬于完整參考方式。
評(píng)論