以數(shù)據(jù)中心、云計算和人工智能為代表的高性能計算類應用的發(fā)展,驅動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經(jīng)無法處理更復雜、更多樣的數(shù)據(jù)。如何在增強數(shù)據(jù)中心算力和性能的同時,具備應對多類型任務的處理能力,成為全球性的技術難題。在計算領域龍頭芯片企業(yè)的不斷探索和研究中,異構計算成為公認的算力突破“抓手”。
芯片巨頭紛紛發(fā)力異構計算
異構計算可以提高算力和性能,降低功耗和成本,又具備多類型任務的處理能力,業(yè)內廣泛認為是未來高性能計算領域的市場主導。英偉達、英特爾、AMD作為行業(yè)領頭羊,近兩年在異構計算方面的新產(chǎn)品層出不窮。
英特爾在最近的投資者會議中提出了一款將x86和Xe GPU 整合到一個Xeon插槽中的新架構Falcon Shores。英特爾中國研究院院長宋繼強向《中國電子報》記者介紹到,將x86的主芯片和GPU的性能整合在一起,這是一個創(chuàng)新。在性能上,F(xiàn)alcon Shores將提供超過5倍的每瓦性能、計算密度以及內存容量和帶寬。
英偉達在今年的GTC2022上,宣布推出首款面向AI基礎設施和高性能計算的基于Arm Neoverse的數(shù)據(jù)中心專屬CPU——Grace CPU 超級芯片。該芯片專為AI、HPC、云計算和超大規(guī)模應用而設計,由兩個CPU芯片組成,兩者通過NVLink-C2C進行互連。根據(jù)NVIDIA實驗室使用同類編譯器估算,這一結果較當前的DGX A100要高1.5倍以上。
AMD完成對賽靈思的合并后,將其CPU與賽靈思的FPGA結合為CPU+FPGA的異構模式。借助賽靈思在5G、通信、自動駕駛和行業(yè)領域的資源,AMD能夠將高性能計算能力帶入更多領域。AMD全球高級副總裁、大中華區(qū)總裁潘曉明曾在2021世界半導體大會上表示:“今天和未來的工作負載需要強大的計算能力,異構計算是未來的關鍵。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算,在持續(xù)發(fā)展的行業(yè)中保持高性能計算領導力。”
異構計算瓶頸待突破
異構的優(yōu)勢顯而易見,與此同時暴露出的技術難題也越來越多。一是,異構計算產(chǎn)品需要面對不同的系統(tǒng)架構、指令集和編程模型,需要降低多樣計算帶給軟件開發(fā)者的難度;二是,異構計算芯片產(chǎn)品除了在芯片設計層面實現(xiàn)突破之外,還需要解決其在芯片制造、制程和封裝過程中不同結構之間的適配和升級;三是,異構計算要實現(xiàn)性能的多樣性合一,使其同時滿足人工智能訓練、推理、圖像視頻處理等各種不同的需求。
燧原科技創(chuàng)始人兼CEO趙立東在接受《中國電子報》記者采訪時表示,從產(chǎn)業(yè)規(guī)范與標準層面看,異構計算是指在完成一個計算任務時,采用一種以上的硬件計算單元、互聯(lián)協(xié)議、差異化架構、軟件接口等,由于不同的硬件設備、協(xié)議、應用二進制接口(ABI)、軟件應用層接口(API)等都存在著巨大的差異,如何構建一個高效、系統(tǒng)化的協(xié)調統(tǒng)一的異構計算系統(tǒng),就成為異構計算最為關鍵的技術問題。
宋繼強同樣表示,異構計算在技術方面、互連方面和軟件方面都面臨瓶頸,仍然沒有達到要求。一是技術設計流程的協(xié)同問題。要保證與其他不同廠商的芯粒一起互聯(lián)互通、協(xié)同工作時,電和傳輸通路不出現(xiàn)問題。二是需要統(tǒng)一各廠商芯粒之間的互連標準。未來全球各大芯片制造商、科技巨頭的芯粒可能會集成在一個芯片上,目前它們之間的互連標準并不統(tǒng)一,各個廠商之間并沒有做好互聯(lián)互通的準備。最近英特爾攜手業(yè)界部分企業(yè),推出了UCIe標準,未來可以把不同廠商的芯粒連到一起,形成一個符合要求的、大的、封裝級的集成芯片。三是軟件層面要過關。不同廠商的計算芯片之間要做出最好的I/O、內存的通道。
東數(shù)西算帶來新風口
當下正值我國“東數(shù)西算”工程建設穩(wěn)步推進之際。這一宏觀戰(zhàn)略,對數(shù)據(jù)中心、計算、存儲、數(shù)據(jù)通信、光傳輸?shù)犬a(chǎn)品有較高建設需求,從而帶動了我國計算領域的整體發(fā)展,形成了諸多新風口,其中數(shù)據(jù)中心的建設是底層基礎中最重要的一環(huán)。
宋繼強表示,“東數(shù)西算”是個非常棒的工程。首先,它非常精準地看到了未來在數(shù)字化轉型之后,所需要的大量算力,而算力本身又分成很多種,并不是建一個大的計算中心就能解決所有問題。所以要先將算力網(wǎng)搭建起來,按照數(shù)據(jù)的產(chǎn)生和算力的使用情況,形成一個比較完美的布局。
宋繼強明確指出,異構是“東數(shù)西算”的底層支撐。“東數(shù)西算”所需的大型計算中心內部,CPU、GPU、FPGA、DPU、專用加速器等,對處理不同種類的工作數(shù)據(jù)各有優(yōu)勢與劣勢,也有運營成本高低之分,所以未來一定要綜合部署,多種架構可能都需要涵蓋,而且要有機聯(lián)合起來。
趙立東認為,異構計算對于“東數(shù)西算”來說是剛需。從半導體集成電路發(fā)展特性來講,它是“贏家通吃”的——不管是從內部的產(chǎn)品業(yè)務布局還是外部的生態(tài)與商業(yè)布局出發(fā),單個數(shù)據(jù)中心或智算中心項目在落地時,會考慮異構計算的復雜性及發(fā)展不完備性所帶來的巨大的額外部署成本,在一定程度上會偏好選擇以單一廠商為核心的現(xiàn)成產(chǎn)品組合,盡量避免技術適配投入。而置身于“東數(shù)西算”政策背景下,最終要實現(xiàn)的是全國算力中心的大一統(tǒng),從而盡可能地優(yōu)化利用資源,在多個數(shù)據(jù)中心或智算中心進行互聯(lián)互通的場景下,異構計算的復雜性會是前所未有的。因此,在異構算力溯源、調度與管理平臺的建設上,需要盡早布局與投入。
算力網(wǎng)絡的構建不只依賴于異構計算,通用計算也將為“東數(shù)西算”提供更多助力。近兩年,國內涌現(xiàn)出一批通用計算芯片初創(chuàng)企業(yè),以FPGA和ASIC類型芯片作為切入點,或者購買國外公司的IP授權開發(fā)通用GPU芯片,其中也有少數(shù)企業(yè)自主研發(fā)通用GPU核心IP,實現(xiàn)了國內通用計算的突破。
天數(shù)智芯副總裁郭為向《中國電子報》記者表示,通用計算所構建的算力平臺通常并行處理能力特別強,計算能效比高,并且有很大的存儲帶寬,能夠釋放非常可觀的算力。
郭為提出要強化頂層謀劃,將算力網(wǎng)絡上升為國家戰(zhàn)略,從全局層面整體謀劃其戰(zhàn)略定位、發(fā)展目標,加快構建新型算力網(wǎng)絡格局。此外,還應成立國家重點實驗室,打造重大原創(chuàng)技術的策源地。優(yōu)化異構計算產(chǎn)業(yè)布局,發(fā)揮龍頭領軍企業(yè)的“鏈長”作用,協(xié)同上下游企業(yè),制定產(chǎn)業(yè)鏈供應鏈圖譜及協(xié)同發(fā)展計劃,推動異構計算產(chǎn)業(yè)鏈本土化、供應鏈多元化,確保異構計算產(chǎn)業(yè)安全穩(wěn)定。
(審核編輯: 智匯聞)
分享