色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<i id="beot4"><acronym id="beot4"></acronym></i>

<sub id="beot4"></sub>

<p id="beot4"><tr id="beot4"></tr></p>

<td id="beot4"></td>

"); //-->

博客專欄

EEPW首頁 > 博客 > 深度解決添加復雜數據增強導致訓練模型耗時長的痛點（1）

深度解決添加復雜數據增強導致訓練模型耗時長的痛點（1）

發(fā)布人：計算機視覺工坊時間：2022-12-22 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發(fā)布文章

本文來自社區(qū)投稿

作者：教主

原文鏈接：https://zhuanlan.zhihu.com/p/585270139

0 Introduction

一直以來，得益于 GPU 的日益發(fā)展，深度學習中網絡訓練以及部署推理速度越來越快，在各大主流的深度學習框架，諸如 PyTorch、TensorFlow、OneFlow 等都有很多算子對 GPU 的加速支持。

從網絡結構角度，PyTorch 雖然已經使用了 NVIDIA cuDNN、Intel MKL 和 NNPACK 這些底層來加快訓練速度，但是在某些情況下，比如我們要實現一些特定算法/算子，如果只是用 PyTorch 已有的算子或操作遠遠不夠。

因為 PyTorch 雖然在特定操作上經過了很好的優(yōu)化，但是對于 PyTorch 已經寫好的這些操作，假如我們組合起來成為一個新的算子（OP），PyTorch 不會管你的算法的具體執(zhí)行流程，一般 PyTorch 只會按照設計好的操作去使用 GPU，然后 GPU 可能不能充分利用或者直接超負載，并且 python 解釋器也不能對此進行優(yōu)化，導致訓練過程變慢很多 [1]。

從數據流角度，深度學習一般都需要復雜的、多階段的數據處理流程，包括數據加載、解碼以及一定量的數據增強預處理操作，這些目前在 CPU 上執(zhí)行的數據處理管道已經成為瓶頸，使得模型訓練耗時很長大。

對于此，NVIDIA 提出了 Data Loading Library（DALI）[2]，通過將數據預處理交給 GPU 處理，緩解 CPU 瓶頸問題。DALI 依賴于它自己的執(zhí)行引擎，其構建目的是最大化輸入管道的吞吐量。諸如預取、并行執(zhí)行和批處理等特性都是為用戶透明處理，如下圖所示：

DALI Pipeline

使用 DALI 以及配置 DALI 環(huán)境比較復雜，并且 DALI 當前的支持的函數實現也比較有限，具體使用可以看文獻 [2] 中的說明文檔。

實際開發(fā)中，對于一些復雜的特定數據增強操作，就需要自己實現。因此，構建了一個比較全面的工程以供大家學習和相互交流。

本工程利用 Pytorch 的 C++/CUDA 擴展，實現 GPU 的數據增強，然后直接推送給網絡，從而達到訓練加速效果。

為了指導大家系統性掌握該方面的相關知識，本工程也包含了 Python 的 C++ 拓展，且詳細講解了在需要依賴第三方庫的情況下怎樣編寫 setup.py 文件以及相關配置，關于如何編譯和測試，在后續(xù)有詳細的講解。

1. Project Address

https://github.com/ChenCVer/python_cpp_extension

2. Project Structure

├── 3rdparty          # 工程依賴的第三方庫│    ├── opencv│    │    ├── linux│    │    └── win│    └── pybind11├── docs              # 說明文檔及相關資料├── requirements      # python相關安裝依賴├── requirements.txt  # python相關安裝依賴項, 與requirements文件夾配合├── scripts           # 相關測試腳本├── tools             # 分析工具├── orbbec            # 源碼文件│    ├── nms          # 非極大值抑制│    ├── roi_align    # ROI Align│    ├── utils        # 編譯工具函數│    └── warpaffine   # 仿射變換增強└── setup.py          # 用于編譯和構建python包(.egg), 類似:CMakeLists.txt

3. Compilation And Python Environment

3.1. Compile Environment

GCC/G++ >= 5.5.0(Visual Studio 2017 or newer for Windows)
CUDA(NVCC): 10.1~11.5

3.2. Python Environment

（requirements.txt）

certifi==2021.5.30cycler==0.11.0future==0.18.2kiwisolver==1.3.1matplotlib==3.3.4mkl-fft==1.3.0mkl-random==1.1.1mkl-service==2.3.0numpy @ file:///C:/ci/numpy_and_numpy_base_1603480701039/workolefile==0.46opencv-python==3.4.0.12Pillow @ file:///C:/ci/pillow_1625663293114/workpyparsing==3.0.9python-dateutil==2.8.2six @ file:///tmp/build/80754af9/six_1644875935023/workterminaltables==3.1.10torch==1.5.0torchvision==0.6.0wincertstore==0.2

3.3. Python Package infos

Package         Version --------------- --------- certifi         2016.2.28cycler          0.11.0Cython          0.29.32future          0.18.2kiwisolver      1.3.1matplotlib      3.3.4mkl-fft         1.3.0mkl-random      1.1.1mkl-service     2.3.0numpy           1.19.2olefile         0.44opencv-python   3.4.0.12Pillow          8.3.1pip             21.3.1pyparsing       3.0.9python-dateutil 2.8.2setuptools      59.6.0six             1.10.0terminaltables  3.1.10torch           1.5.0torchvision     0.6.0wheel           0.29.0wincertstore    0.2

【注】：上述環(huán)境中的 PyTorch 版本需要對應的 CUDA 版本，本工程支持的 PyTorch 版本：PyTorch version：1.5.0~latest。

*博客內容為網友個人發(fā)布，僅代表博主個人觀點，如有侵權請聯系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

相關推薦

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產力

winni945 | 2018-09-12

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

海聯達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

釋說芯語16：硬科技：構建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

加大調整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

2021春晚黑科技，火爆全網的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

EEPW2018年3月刊(工業(yè)物聯網)

資源下載工業(yè)物聯網 AI | 2018-03-12

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯網技術 | 2023-04-25

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

繼上次海聯達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

AI+機器視覺成趨勢，圖文詳解N大應用場景

智能計算安森美 AI 機器視覺 | 2024-07-31

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創(chuàng)建AI... 一臺來模擬AI... 一臺來運行AI”

智能計算 AI | 2024-07-31

如何快速搭建手寫體識別演示系統

視頻 digikey AI 手寫體識別 | 2022-07-29

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

焦點

推薦視頻

更多>>

技術專區(qū)

關閉

<i id="hy94h"></i>

<sub id="hy94h"></sub>

<i id="hy94h"><tr id="hy94h"></tr></i>

<rp id="hy94h"></rp>