RISC-V 高效能運算要解決的三個問題

語言: CN / TW / HK

近日,OSCHINA 和 Gitee 聯合釋出了《2022 中國開源開發者報告》澎峰科技聯合創始人兼營運長王軍輝在報告中對 RISC-V 領域進行了解讀,以下為原文。

 

RISC-V 高效能運算要解決的三個問題

不久前,RISC-V 國際基金會宣佈 RISC-V 晶片出貨超 100 億顆,這對 RISC-V 新架構而言,是一個不錯的里程碑。不過,成果主要集中在嵌入式 SoC 領域。我們觀察到,在 RISC-V 高效能運算領域,已有多家創新企業計劃在 2023 年釋出類似 64 核@2.0GHz 規格的伺服器級處理器,這必將成為 RISC-V 下一個令人激動的里程碑。當然,關於 RISC-V 高效能運算,還有三大問題需要解決:

(1)需要為 RISC-V 體系構建一套數學計算庫,類似 Intel 處理器的 MKL(Math Kernel Libarary),以支援 RISC-V 在高效能運算的應用,保證計算精度、計算效率以及原始碼級安全可控。

目前業內常用的數學計算庫主要為 Intel 的 MKL 和 AMD 的 ACML,二者都是免費的,但不開源,因為這是軟體類核心智慧財產權。也許您認為免費不就可以了嗎?但當您遇到針對場景需要優化時,將無能為力。這些程式碼誰擔保它的安全性、可靠性呢?

雖然有 OpenBLAS、FFTW、Libm 等部分開源專案可以使用,但這遠遠不夠。而且,開源的版本無法保證計算效率和計算精度。偏偏這在高效能運算應用領域(AI 計算、科學計算)是至關重要的。

數學計算庫作為計算中介軟體,函式規模上以千計,與計算效能、安全性、可靠性深度繫結。也就是說,它將最終決定處理器是否能進入高效能運算領域。

(2)如何讓 RISC-V 迴歸到計算機技術的垂直整合,而不是橫向分解的時代?在算力驅動的數字經濟時代,計算硬體將呈現出多樣性。RISC-V 因其開放性,將比 x86 和 arm 生態更加豐富和多樣,換一種說法就是嚴重碎片化。如果單純追求硬體計算效能的 spec 資料,很容易滑入橫向分解的邏輯,出現類似 VLIW(Very Long Instruction Word)超長指令這種怪物,數十億美金化為教訓。

RISC-V 應該回歸到垂直整合的思路上來,要去思考,如何前瞻性地理解應用,從計算語言到編譯器,再到底層數學計算庫,再到計算機體系結構,實現多個方面垂直整合。存量市場只有赤裸裸的價效比競爭,瞄準增量市場才有跨越式發展的可能。

(3)在異構計算時代,如何構建 “RISC-V CPU + 加速卡(GPU、NPU、DSA、FPGA)” 的高效能異構計算軟體棧?面向異構計算黃金時代,國際三巨頭以其雄厚的資本實力各自為戰,都在整合異構計算硬體平臺(CPU、GPU、FPGA等)和佈局異構計算軟體棧(CUDA、OneAPI、ROCm),試圖形成自己的軟硬融合的生態體系,同時展開封閉和開放生態之爭。

這也意味著 RISC-V 領域也必須面臨如何解決異構生態的問題,即,如何解決“n 家公司的 RISC-V CPU + m 家公司的加速卡”的硬體組合,這種組合數量將高達到 n x m;如何實現軟硬融合,遵循什麼樣的 API 標準(開源/自研);異構計算軟體棧的應投入多少預算等問題。

王軍輝

澎峰科技聯合創始人兼營運長,畢業於中南大學。曾在科廣電子、Thomson、Vimicro、中科院計算所西研院任職,積體電路設計行業從業二十多年。聯絡方式:[email protected]

《2022 中國開源開發者報告》由” 前沿開源技術領域解讀 “ ” 中國開源創業觀察 2022“,以及” 開發者畫像分析 “ 三個章節組成。在 “前沿開源技術領域解讀” 部分,多位在其領域有所建樹的一線開發者和開源商業化公司創始人,對目前國內外流行的前沿開源技術領域過去的發展和未來的趨勢進行了深入的洞察,覆蓋開源雲原生、開源 AI、開源大前端、開源大資料、開源 DevOps、RISC-V、開源作業系統、開源資料庫、程式語言九大領域。

欲瞭解更多報告內容,請點選:http://gitee.com/report/china-open-source-2022/