色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > Linux核心修補程序讓第五代樹莓派增速18%

          Linux核心修補程序讓第五代樹莓派增速18%

          作者: 時間:2024-08-13 來源:CTIMES 收藏

          操作系統(tǒng)的核心(kernel)是不斷迭代精進的,包含正式改版或若干程度的修補(patch,對岸稱為補?。┑龋谡降皶扔腥颂峤?,提交后需要再評估確認,有些會舍棄,有些會納入后續(xù)正式的迭代。
          最近64位Arm架構的核心程序,有一家自由軟件顧問公司Igalia嘗試在樹莓派上模擬NUMA(Non-Uniform Memory Access,翻譯成非統(tǒng)一內存存取,但使用不普遍),如此可以讓(RPi 5)增速6%~18%,這作法已經(jīng)在核心清單的相關討論中,由賬號Tvrtko Ursulin所提出。

          本文引用地址:http://cafeforensic.com/article/202408/461965.htm

          圖片.png
          圖一 : 單板計算機(圖片來源:Amazon)


          NUMA簡述
          在這里要先說明一下何謂NUMA,這其實是一種計算機硬件架構,1990年代UNIX高階服務器飛速發(fā)展時,系統(tǒng)內CPU數(shù)目的增加、RAM容量的增加,但要讓多顆CPU跟過往一樣,都存取同一塊RAM內存空間,這一段存取變成了效能瓶頸,故系統(tǒng)商開始提倡NUMA。
          NUMA把內存分切、配發(fā)給CPU,CPU平常多數(shù)時間只存取自己所屬的內存,必要時才與其他內存快進行數(shù)據(jù)同步或交換,另外NUMA也可能將內存分層,分成CPU專屬層、一個群中的共享層、整體系統(tǒng)的共享等等。
          雖然有這些空間切分、數(shù)據(jù)同步機制,但這些都以硬件方式實現(xiàn),是在背地里無形中運作,軟件執(zhí)行上感受不到差異,運作上仍然以為是一個整體連續(xù)的內存空間。Linux核心在2.5版后也支持NUMA。


          效能提升6%~18%
          雖然Linux核心支持NUMA,但如果系統(tǒng)硬件設計上本身就沒有NUMA,Linux核心的NUMA功能一樣無法發(fā)揮,RPi 5即是如此,主要是RPi 5的主控芯片BMC2712沒有。
          不過,前述的Igalia公司提出一個,讓樹莓派系統(tǒng)跑一個NUMA仿真軟件(Emulator),以軟件方式實現(xiàn)NUMA(可能搭配運用上BMC2712內的GPU),這個修補程序其實才約100行,主要的C語言程序代碼也不到60行。

          圖片.png
           
          圖二 : Igalia公司官網(wǎng)強調該公司擅長的多項技術中,Linux核心效能提升也是其一(圖片來源:Igalia)

          #include
          #include "numa_emulation.h"
          static unsigned int emu_nodes;
          int __init numa_emu_cmdline(char *str)
          {
          int ret;
          ret = kstrtouint(str, 10, &emu_nodes);
          if (ret)
          return ret;
          if (emu_nodes > MAX_NUMNODES) {
          pr_notice("numa=fake=%u too large, reducing to %un",
          emu_nodes, MAX_NUMNODES);
          emu_nodes = MAX_NUMNODES;
          }
          return 0;
          }
          int __init numa_emu_init(void)
          {
          phys_addr_t start, end;
          unsigned long size;
          unsigned int i;
          int ret;
          if (!emu_nodes)
          return -EINVAL;
          start = memblock_start_of_DRAM();
          end = memblock_end_of_DRAM() - 1;
          size = DIV_ROUND_DOWN_ULL(end - start + 1, emu_nodes);
          size = PAGE_ALIGN_DOWN(size);
          for (i = 0; i < emu_nodes; i++) {
          u64 s, e;
          s = start + i * size;
          e = s + size - 1;
          if (i == (emu_nodes - 1) && e != end)
          e = end;
          pr_info("Faking a node at [mem %pap-%pap]n", &s, &e);
          ret = numa_add_memblk(i, s, e + 1);
          if (ret) {
          pr_err("Failed to add fake NUMA node %d!n", i);
          break;
          }
          }
          return ret;


          修補程序相關的C語言程序代碼,一起頭即放入Linux內存區(qū)塊的含括檔memblock.h及NUMA模擬的含括檔numa_emulation.h(數(shù)據(jù)源:CNX Software)

          相關配套修改也包含在操作系統(tǒng)上要使用一個NUMA_EMULATION的新Kconfig選項,核心啟動參數(shù)要加入numa=fake=,然后搭配命令行numactl –interleave=all COMMAND等,如此可以改變BMC2712內存儲器控制器的存取方式,另外也要透過systemd命令來重新配置系統(tǒng)范圍政策(system-wide policy)。
          既然NUMA是為了讓整體系統(tǒng)更具效能的,那就需要測試看看NUMA仿真軟件是否真的有效果,對此用效能基準程序Geekbench 6來測試,發(fā)現(xiàn)有無安裝修補程序確實有效能差異。
          測試的結果顯示,安裝修補程序后的單核效能提升約6%,多核(RPi 5有4個核心)則提升到18%,這樣的提升形同把2.4GHz的RPi 5超頻到2.83GHz。


          仍待觀望
          雖然測試結果不錯,但目前還有兩個問題,一是真的在一般運用上能得到加速感受嗎?有時基準檢驗的跑分不錯,實際上沒有幫助,類似紙上成績不錯,實際表現(xiàn)不佳,因此信息業(yè)界有時也會強調所謂的real application performance,而不是看benchmark。
          另一個問題是:這個修補程序提交出去了,但是否能正式列入成Linux核心修補還需要一段時間,且估計時間冗長。目前提交上的相關討論似乎有不樂意的聲音出現(xiàn),認為這有點變通取巧不正規(guī),不應該正式列入,一旦正式列入就需要后續(xù)一連串的相關維護等。


          結語
          最后筆者覺得,無論提交能否納入正式核心修補,這一嘗試肯定是正向的,過往的樹莓派其實在I/O方面已經(jīng)出現(xiàn)瓶頸(芯片內的Interconnect帶寬不足),硬件規(guī)格數(shù)字雖已與過往PC相仿,效能卻仍有落差,估計這是新一代樹莓派要額外提出RP1附屬搭配芯片的原因。

          既然有人提出NUMA仿真軟件,這表示開始有人嘗試提升樹莓派的內存存取效率,會引起各方關注此一環(huán)節(jié)的效能提升,是真的起用仿真軟件來零成本提升效能,還是考慮在下一代的樹莓派主控芯片上改善此一環(huán)節(jié)的硬件設計,對用戶而言都是好消息。



          評論


          相關推薦

          技術專區(qū)

          關閉