色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁 > 智能計算 > 進(jìn)階指南 > OpenVINO+OpenCV 文本檢測與識別

OpenVINO+OpenCV 文本檢測與識別

作者：時間：2020-11-09 來源：OpenCV學(xué)堂

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

模型介紹
　　文本檢測模型
　　OpenVINO支持場景文字檢測是基于MobileNet的PixelLink模型，該模型有兩個輸出，分別是分割輸出與bounding Boxes輸出，結(jié)構(gòu)如下：

本文引用地址：http://cafeforensic.com/article/202011/420108.htm

　　下面是基于VGG16作為backbone實(shí)現(xiàn)的PixelLink的模型結(jié)構(gòu)：

　　輸入格式：1x3x768x1280 BGR彩色圖像
　　輸出格式：
　　name: "model/link_logits_/add", [ 1x16x192x32 0] – pixelLink的輸出 name: "model/segm_logits/add", [ 1x2x192x32 0] – 像素分類text/ notext

　　這里CNN使用類似 VGG16結(jié)構(gòu)提前特征，序列預(yù)測使用雙向LSTM網(wǎng)絡(luò)。
　　輸入格式： 1x1x32x120 輸出格式： 30, 1, 37 輸出解釋是基于 CTC貪心解析方式。
代碼演示
　　01文本檢測
基于PixelLink完成文本檢測，其中加載模型與獲取輸入與輸出層名稱的

代碼實(shí)現(xiàn)如下：

log.info( "Creating Inference Engine")
ie = IECore
dete_net = ie.read_network(model=dete_text_xml, weights=dete_text_bin)
reco_net = ie.read_network(model=reco_text_xml, weights=reco_text_bin)
　　
# 文本檢測網(wǎng)絡(luò)，輸入與輸出格式
log.info( "加載文本檢測網(wǎng)絡(luò)，解析輸入與輸出格式...")
input_it = iter(dete_net.input_info)
input_det_blob = next(input_it)
print(input_det_blob)
output_it = iter(dete_net.outputs)
out_det_blob1 = next(output_it)
out_det_blob2 = next(output_it)

# Read andpre-process input images
print(dete_net.input_info[input_det_blob].input_data.shape)
dn, dc, dh, dw = dete_net.input_info[input_det_blob].input_data.shape

# Loading model to the plugin
det_exec_net = ie.load_network(network=dete_net, device_name= "CPU")
print( "out_det_blob1: ", out_det_blob1, "out_det_blob2: ", out_det_blob2)

執(zhí)行推理與解析輸出的

代碼如下：

image = cv.imread( "D:/images/openvino_ocr.jpg")
# image = cv.imread("D:/facedb/tiaoma/1.png")
h, w, c = image.shape
cv.imshow( "input", image)
img_blob = cv.resize(image, (dw, dh))
img_blob = img_blob.transpose( 2, 0, 1)
# Start sync inference
log.info( "Starting inference in synchronous mode")
inf_start1 = time.time
res = det_exec_net.infer(inputs={input_det_blob: [img_blob]})
inf_end1 = time.time - inf_start1
print( "inference time(ms) : %.3f"% (inf_end1 * 1000))
link_logits_ = res[out_det_blob1][ 0]
segm_logits = res[out_det_blob2][ 0]
link_logits_ = link_logits_.transpose( 1, 2, 0)
segm_logits = segm_logits.transpose( 1, 2, 0)
pixel_mask = np.zeros(( 192, 320), dtype=np.uint8)
print(link_logits_.shape, segm_logits.shape)
# 192, 320
forrow inrange( 192):
forcol inrange( 320):
pv1 = segm_logits[row, col, 0]
pv2 = segm_logits[row, col, 1]
ifpv2 > 1.0:
pixel_mask[row, col] = 255

mask = cv.resize(pixel_mask, (w, h))
cv.imshow( "mask", mask) 運(yùn)行結(jié)果如下：

02運(yùn)行結(jié)果：

ie = IECore
reco_net = ie.read_network(model=reco_text_xml, weights=reco_text_bin)

# 文本識別網(wǎng)絡(luò)
log.info( "加載文本識別網(wǎng)絡(luò)，解析輸入與輸出格式...")
input_rec_it = iter(reco_net.input_info)
input_rec_blob = next(input_rec_it)
print(input_rec_blob)
output_rec_it = iter(reco_net.outputs)
out_rec_blob = next(output_rec_it)

# Read and pre-process input images
print(reco_net.input_info[input_rec_blob].input_data.shape)
rn, rc, rh, rw = reco_net.input_info[input_rec_blob].input_data.shape

# Loading model to the plugin
rec_exec_net = ie.load_network(network=reco_net, device_name= "CPU")
print( "out_rec_blob1: ", out_rec_blob)

# 文字識別
image = cv.imread( "D:/images/zsxq/ocr3.png")
gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
se = cv.getStructuringElement(cv.MORPH_RECT, ( 5, 1))
binary = cv.dilate(binary, se)
cv.imshow( "binary", binary)
cv.waitKey( 0)
contours, hireachy = cv.findContours(binary, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
for cnt inrange(len(contours)):
x, y, iw, ih = cv.boundingRect(contours[cnt])
roi = gray[y:y + ih, x:x + iw]
rec_roi = cv.resize(roi, (rw, rh))
rec_roi_blob = np.expand_dims(rec_roi, 0)

# Start sync inference
log.info( "Starting inference in synchronous mode")
inf_start1 = time.time
res = rec_exec_net.infer(inputs={input_rec_blob: [rec_roi_blob]})
inf_end1 = time.time - inf_start1
print( "inference time(ms) : %.3f"% (inf_end1 * 1000))
res = res[out_rec_blob]
txt = greedy_prase_text(res)
cv.putText(image, txt, (x, y), cv.FONT_HERSHEY_PLAIN, 1.0, ( 0, 0, 255), 1, 8)
cv.imshow( "recognition text demo", image)
cv.waitKey( 0)
cv.destroyAllWindows

運(yùn)行結(jié)果如下：

　　重新整理了一下，解析部分的代碼函數(shù)。不用看公式，看完你會暈倒而且寫不出代碼！

實(shí)現(xiàn)如下：
　　defctc_soft_max(data): sum = 0; max_val = max(data) index = np.argmax(data) fori inrange(len(data)): sum += np.exp(data[i]- max_val) prob = 1.0/ sum returnindex, prob
　　defgreedy_prase_text(res): # CTC greedy decode from hereprint(res.shape)# 解析輸出textocrstr = ""prev_pad = False; fori inrange(res.shape[ 0]): ctc = res[i] # 1x13ctc = np.squeeze(ctc, 0) index, prob = ctc_soft_max(ctc)ifdigit_nums[index] == '#': prev_pad = Trueelse: iflen(ocrstr) == 0orprev_pad or(len(ocrstr) > 0anddigit_nums[index] != ocrstr[ -1]): prev_pad = Falseocrstr += digit_nums[index]print(ocrstr)returnocrstr

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： OpenVINO OpenCV 文本檢測 文本識別

評論

相關(guān)推薦

ZYNQ平臺OPENCV的移植(1)

CMika | 2013-10-20

第四部分：深度學(xué)習(xí)的Workbench 和Streamer

視頻 Intel OPENVINO | 2020-08-04

OPENCV中子圖像的獲取拷貝以及源代碼

資源下載顯示圖形圖像 OpenCV | 2014-11-27

oneAPI & OpenVINO?聯(lián)合開發(fā)者大會開啟:英特爾持續(xù)開源創(chuàng)新,助力AI開發(fā)落地

智能計算 oneAP OpenVINO 英特爾開源 | 2023-11-04

點(diǎn)特征的雙目視覺雜草定位系統(tǒng)研究

資源下載顯示圖形圖像 OpenCV | 2014-11-27

第二部分：OPENVINO中的IE和 Multi Models

視頻 Intel OPENVINO | 2020-08-04

第三部分：基于VPU和FPG應(yīng)用OPENVINO

視頻 Intel OPENVINO | 2020-08-04

基于ZYNQ-7000的Opencv包

CMika | 2013-10-20

英特爾亮相EdgeX+OpenVINO開發(fā)者生態(tài)大會

智能計算英特爾 EdgeX OpenVINO | 2023-06-13

第一部分：OPENVINO的安裝和MO

視頻 Intel OpenVINO^TM | 2020-08-03

英特爾OpenVINO DEVCON中國系列工作坊 2023第一期

智能計算英特爾 OpenVINO，AI | 2023-05-22

CEVA-CV：實(shí)現(xiàn)嵌入式視覺應(yīng)用

設(shè)計方案 CEVA-CV 嵌入式視覺 openCV | 2015-06-17

OPencv安裝后不能使用問題???

佐真妮亞 | 2011-09-29

OpenVINO? DevCon 2023重磅回歸!英特爾以創(chuàng)新產(chǎn)品激發(fā)開發(fā)者無限潛能

智能計算 OpenVINO 英特爾 | 2023-06-05

隆重推出OpenVINO? 2023.3最新長期支持版本

智能計算 Intel openvino 人工智能智能計算 | 2024-02-01

基于HALCON的IC卡噴碼符號識別技術(shù)研究與實(shí)現(xiàn)

資源下載顯示圖形圖像 OpenCV | 2014-11-27

膚色模型的面部膚色區(qū)域提取

資源下載顯示圖形圖像 OpenCV | 2014-11-27

第五部分：OPENVINO如何配合DevCloud開發(fā)

視頻 Intel OPENVINO | 2020-08-04

opencv移植到DSP的過程

hzhzhj | 2012-03-07

基于Jetson TX2視覺識別的取放一體平衡機(jī)器人

?202308 視覺識別平衡機(jī)器人機(jī)器人 PID控制 OpenCV STM32 | 2023-08-20

OpenVINO? DevCon 2024盛大啟動：英特爾以技術(shù)之力，攜手開發(fā)者共筑AI未來

智能計算 OpenVINO 英特爾 | 2024-03-25

Rayeager PX2開發(fā)板測試opencv邊緣檢測效果測試

穿prada的008 | 2015-02-14

基于圖像處理的智能交通信號系統(tǒng)設(shè)計*

汽車電子 202304 OpenCV 車流量檢測幀間差分虛擬線圈計數(shù) 專家系統(tǒng) | 2023-04-25

WTM上海站 | 嘉賓揭曉！與卓越的科技女性/企業(yè)女高管互動交流！

國際視野科技女性英特爾 OpenVINO | 2023-04-03

基于INTEL 11代芯片Tiger Lake 在OPENVINO AI 套件上所開發(fā)之LUS.AI即時互動智慧醫(yī)療解決方案

物聯(lián)網(wǎng)與傳感器 INTEL Tiger Lake OPENVINO AI LUS.AI | 2023-05-18

OPENCV

資源下載 ZYNQ OPENCV | 2013-10-20

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)