色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<pre id="s8oo4"></pre>

"); //-->

博客專欄

EEPW首頁 > 博客 > CPU& 內(nèi)存加壓工具 stress-ng 介紹

CPU& 內(nèi)存加壓工具 stress-ng 介紹

發(fā)布人：地平線開發(fā)者時間：2024-11-22 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

發(fā)布文章

01 文章背景介紹

在實車測試時，除了感知算法外，往往還會有別的 APP 在同時運行，從而擠壓算法的資源占用，影響模型性能，降低部署效果。因此在項目早期做板端驗證的時候，我們就可以使用一些工具對 CPU 和內(nèi)存進(jìn)行加壓，再運行模型，以模擬實車測試的情況，得到模型在硬件資源受限時的性能數(shù)據(jù)，做到心中有數(shù)，及時調(diào)整優(yōu)化，避免到了項目后期還要為節(jié)約性能開銷而裁剪模型，得不償失。

本文的重點在于向廣大開發(fā)者介紹 stress-ng 工具，并探究該工具是否能明顯影響模型的性能表現(xiàn)，以方便開發(fā)者在非實車環(huán)境下能做好性能驗證工作。關(guān)于模型或工程的性能調(diào)優(yōu)，可參考社區(qū)其他精品貼。因作者水平有限，文章如有錯漏之處，歡迎指出并共同交流。

02 開發(fā)板加壓工具介紹

2.1 stress-ng 簡介

Stress-ng 可以在 linux 上產(chǎn)生系統(tǒng)負(fù)載，可加壓 CPU、內(nèi)存、磁盤 IO 等，且有多種加壓策略，比如浮點運算、整數(shù)運算、矩陣運算、壓縮、解壓縮等，可以用來測試系統(tǒng)在高負(fù)載的狀況下的穩(wěn)定性。

Stress-ng 工具的 github 開源地址為：https://github.com/ColinIanKing/stress-ng

2.2 stress-ng 編譯說明

首先進(jìn)入 stress-ng 的 github 頁面，下載源碼到我們的 x86 服務(wù)器上

接下來進(jìn)行源碼編譯。由于我們的加壓測試環(huán)境是 arm 開發(fā)板，而 github 介紹的編譯流程基于 x86，因此我們需要配置**環(huán)境變量來設(shè)置交叉編譯器**，以編譯出可在開發(fā)板運行的二進(jìn)制文件，參考代碼如下：

cd stress-ng-0.17.06export CC=aarch64-linux-gnu-gccmake

編譯完成后，會在源碼所在的文件夾下生成可執(zhí)行文件 stress-ng，將其復(fù)制到開發(fā)板上的/userdata 路徑即可。

2.3 stress-ng 使用說明

2.3.1 主要參數(shù)介紹

--cpu N：讓 N 個 CPU 滿載，N=0 會讓所有 CPU 滿載
--cpu-load M：搭配--cpu 使用，占用 N 個核各自 M%的 CPU 負(fù)載
--vm N：啟用 N 個進(jìn)程占用內(nèi)存，不斷釋放和分配
--vm-bytes N：所有 vm 進(jìn)程共占用 N 字節(jié)的內(nèi)存大小，可帶單位，如 1M 1G
--vm-keep：vm 進(jìn)程一直占用內(nèi)存不釋放
--timeout N：加壓時長 N 秒，可帶單位，如 1s 1m 1h 1d，不配置則為 1d

2.3.2 CPU 加壓方法

CPU 加壓命令：

stress-ng --cpu 4 --cpu-load 90

運行以上命令可讓 4 個 CPU 核各以 90%左右的負(fù)載運行。

2.3.3 CPU 和內(nèi)存共同加壓方法（推薦）

執(zhí)行以下命令可讓 CPU 和內(nèi)存共同被加壓：

stress-ng --vm 2 --vm-bytes 2G --vm-keep

vm 為 2 會讓 2 個 CPU 核滿載運行，vm-bytes 為 2G 則會占用 2G 的內(nèi)存（和 vm 數(shù)量無關(guān)），添加 vm-keep 會讓內(nèi)存一直占據(jù)不被釋放。這個命令可以同時為 CPU 和內(nèi)存加壓，是比較推薦的一種方式，本文也會基于這種方法做性能測試工作。

03 模型性能評測工具介紹

3.1 hrt_model_exec 簡介

hrt_model_exec 是地平線算法工具鏈提供的模型執(zhí)行工具，可以使用該工具的 perf 功能在開發(fā)板上評測模型的推理性能，該工具的完整介紹可以查看用戶手冊：

https://developer.horizon.cc/api/v1/fileData/horizon_j5_open_explorer_cn_doc/runtime/source/tool_introduction/source/hrt_model_exec.html

我們可以在 OE 包的 ddk/package/board/hrt_tools/bin 路徑找到這個工具，需要將其復(fù)制到開發(fā)板。

3.2 hrt_model_exec 使用方法

hrt_model_exec 可以在單核單線程下評測模型的單幀延時（Latency），也可以在雙核多線程下評測模型的吞吐量（FPS）。單幀延時體現(xiàn)了單個模型處理一幀數(shù)據(jù)所需的時間，是衡量計算平臺能滿足實時性能要求的重要指標(biāo)。

這里我們選擇基于單幀延時來分析性能影響，相比 FPS，對單幀延時的觀測會更加穩(wěn)定。

評測模型單幀延時的參考命令如下：

hrt_model_exec perf --model_file ./model.bin --frame_count 1000

frame_count 默認(rèn)為 200，這里我們設(shè)置為 1000，為的是讓評估的數(shù)值更加準(zhǔn)確。

04 實驗部分

4.1 實驗思路

本文分別使用一大一小兩個模型分析 CPU 和內(nèi)存加壓對單幀延時的影響，計算平臺為 征程 5。

大模型使用 CenterPoint（來自 OE 包 ddk/samples/model_zoo/runtime/ai_benchmark/qat/centerpoint_pointpillar_nuscenes），小模型使用 Resnet18（OE 包 ddk/samples/ai_toolchain/horizon_model_convert_sample/03_classification/03_resnet18 以 O3 編譯）。加壓手段采用本文 2.3.3 “CPU 和內(nèi)存共同加壓方法”，比較兩個模型的單幀延時受影響程度。

4.2 征程 5 硬件資源說明

對本實驗涉及到的征程 5 硬件資源，這里做出以下簡單介紹。

CPU: 8 * A55
BPU：征程 5 有雙核 BPU，但本文所做的性能測試只用到單核
內(nèi)存：可使用 free 命令查看開發(fā)板內(nèi)存分配情況，在不執(zhí)行任何用戶進(jìn)程時，可用內(nèi)存約為 3.8G，見下圖

4.3 實驗結(jié)果展示

*4.3.1 實驗數(shù)據(jù)總表*

實驗 1 為不加壓時，分別單獨運行 CenterPoint 和 Resnet18 得到的單幀延時數(shù)據(jù)；
實驗 2-8 為 1 個 CPU 核滿載時，內(nèi)存占用依次提升的單幀延時數(shù)據(jù)；
實驗 9-15 為 4 個 CPU 核滿載時，內(nèi)存占用依次提升的單幀延時數(shù)據(jù)；
實驗 16-22 為全部 CPU 核滿載時，內(nèi)存占用依次提升的單幀延時數(shù)據(jù)；
CenterPoint 和 Resnet18 分開測試，不會同時運行。

可以查看下方更加直觀的，基于表格信息制作的折線圖。

4.3.2 CenterPoint 折線圖

圖中藍(lán)色圓點代表不加壓時，CenterPoint 的性能數(shù)據(jù)，綠色折線表示單核滿載時內(nèi)存占用依次提升的性能數(shù)據(jù)，黃色折線表示 4 核滿載時內(nèi)存占用依次提升的性能數(shù)據(jù)，紅色折線表示 8 核滿載時內(nèi)存占用依次提升的性能數(shù)據(jù)。

4.3.3 Resnet18 折線圖

Resnet18 折線圖的閱讀方法同 Centerpoint。由于在 8 核滿載（紅色折線）時，模型性能下降尤為嚴(yán)重，因此額外提供了下圖，可方便地看出單核滿載（綠色折線）和 4 核滿載（黃色折線）下的性能變化情況。

05 實驗結(jié)論

stress-ng 工具對 CPU 和**內(nèi)存的占用，可以顯著影響模型性能**；
內(nèi)存加壓對模型單幀延時的影響相對較小，CPU 加壓影響較大；
在內(nèi)存占用相同時，CPU 占用越高，模型單幀延時越高；
在 CPU 負(fù)載相同時，隨著內(nèi)存占用的提升，模型的單幀延時有上升趨勢；
在 CPU 全部核滿載時，小模型的單幀延時上升情況比大模型嚴(yán)重很多。

06 結(jié)論

本文重點介紹了 stress-ng 工具并通過實驗證明了 stress-ng 對 CPU 和內(nèi)存的加壓可以明顯影響模型的性能表現(xiàn)，該工具可方便開發(fā)者驗證模型在資源受限時的實際運行性能。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：算法 自動駕駛

相關(guān)推薦

村田制作所：助力ADAS發(fā)展，推動自動駕駛未來

汽車電子 202408 村田 ADAS 自動駕駛 | 2024-08-20

特斯拉陶琳談某境外企業(yè)開展非法測繪：合規(guī)是企業(yè)經(jīng)營的底線

汽車電子特斯拉測繪自動駕駛 | 2024-10-17

76-81GHz自動駕駛CMOS RADAR

視頻 ADI 自動駕駛 CMOS RADAR | 2018-05-31

有關(guān)指紋算法

wsf999 | 2004-08-06

[轉(zhuǎn)帖]us/os就緒表的維護(hù)算法分析

amine | 2002-05-17

數(shù)字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

邊界工況推動下，汽車圖像傳感器的四大發(fā)展方向

物聯(lián)網(wǎng)與傳感器 Hyperlux 圖像傳感器自動駕駛 | 2024-09-09

攜手ADI贏得未來

視頻 ADI 自動駕駛醫(yī)療健康 | 2019-11-08

無線傳感器網(wǎng)絡(luò)低功耗分簇路由算法設(shè)計

設(shè)計方案無線傳感器網(wǎng)絡(luò) 功耗路由算法設(shè)計 | 2012-09-07

【供應(yīng)商亮點】艾邁斯歐司朗推出用于自動駕駛的8通道脈沖激光器

汽車電子艾邁斯歐司朗自動駕駛脈沖激光器 | 2024-08-16

ADI：傳感技術(shù)助力未來自動駕駛的發(fā)展

視頻 ADI 自動駕駛 | 2020-03-16

CRC算法原理及C語言實現(xiàn)

資源下載 CRC 算法 C語言 | 2007-02-16

基于LPC2138的血壓測量算法開發(fā)平臺電路圖

設(shè)計方案基于 LPC2138 血壓測量算法開發(fā)平臺電路圖 | 2010-01-20

計算機(jī)科學(xué)與技術(shù)反思錄(2)

liujt_ic | 2003-06-06

vxwokrs下靜態(tài)圖像壓縮算法（上）

C-- | 2004-07-26

加快實現(xiàn)自動駕駛（完整小組討論）

視頻 ADI 自動駕駛 | 2020-06-12

數(shù)字PID控制及其改進(jìn)算法的應(yīng)用

設(shè)計方案數(shù)字控制及其改進(jìn) 算法應(yīng)用 | 2011-05-11

PID算法

資源下載 PID 算法誤差 | 2007-02-16

馬斯克在削減成本上毫不手軟無視各種規(guī)則和慣例

汽車電子馬斯克 SpaceX Twitter 電動汽車自動駕駛雷達(dá)傳感器 | 2024-11-18

采用Mean-Shift和Camshift算法相結(jié)合的火焰視頻圖像跟蹤設(shè)計

設(shè)計方案采用 Mean-Shift Camshift 算法相結(jié)合 | 2011-06-27

安森美：感知技術(shù)引領(lǐng)自動駕駛技術(shù)革命

汽車電子 202408 安森美感知技術(shù) 自動駕駛 | 2024-08-20

自動駕駛公司文遠(yuǎn)知行啟動美股IPO

智能計算自動駕駛文遠(yuǎn)知行 IPO | 2024-10-23

簡單實用的單片機(jī)CRC 快速算法

資源下載 CRC 算法單片機(jī) | 2007-02-16

一文讀懂｜自動駕駛需要的所有傳感器

自動駕駛傳感器 ADAS 雷達(dá) 毫米波 | 2024-08-20

小馬智行獲深圳市智能網(wǎng)聯(lián)汽車高快速路測試許可

汽車電子小馬智行自動駕駛 | 2024-08-30

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

自動駕駛的現(xiàn)狀與未來（節(jié)選）

視頻 ADI 自動駕駛 | 2020-03-16

求FSK信號的解調(diào)算法，主要是鐵路上的移頻信號!

dhlwq007 | 2004-08-04

目標(biāo)跟蹤算法在紅外熱成像跟蹤技術(shù)上的應(yīng)用

設(shè)計方案目標(biāo) 跟蹤算法紅外成像技術(shù)上應(yīng)用 | 2009-09-03

小鵬自研圖靈芯片已成功流片，為AI大模型定制

汽車電子小鵬 AI芯片自研自動駕駛 | 2024-08-29

焦點

推薦視頻

更多>>

技術(shù)專區(qū)

<samp id="y6qew"><optgroup id="y6qew"></optgroup></samp>

<kbd id="y6qew"></kbd>

<button id="y6qew"><strong id="y6qew"></strong></button>

<table id="y6qew"><tbody id="y6qew"></tbody></table>