国产精品久久久久影院,成人午夜福利视频,国产精品久久久久高潮,国产精品 欧美 亚洲 制服,国产精品白浆无码流出

邊緣AI芯片架構的思考:為何可擴展GPU架構值得關注

發(fā)布者:EE小廣播最新更新時間:2025-04-17 來源: EEWORLD關鍵字:邊緣AI  芯片架構  GPU架構  芯片  AI 手機看文章 掃描二維碼
隨時隨地手機看文章

華興萬邦行業(yè)觀察

 邊緣AI芯片架構的思考:為何可擴展GPU架構值得關注

 

作者:北京華興萬邦管理咨詢有限公司  翔煜  商瑞

 

隨著大模型在不斷演進的同時將推理應用大規(guī)模推向邊緣和端點設備,以及物聯(lián)網智化、具身智能、AI智能體(AI Agent)和物理AI等新的AI應用場景和模式的快速涌現(xiàn),AI賦能設備的主控芯片設計師正面臨著全新的挑戰(zhàn)。尤其是對于邊緣和端點設備,它們既可能成為大模型的承載設備,也可能是用智能去為應用提供更好的核心功能,新的產品定義方向使主芯片架構師不得不去思考,其芯片在如何應對大模型快速演進的同時,還能實現(xiàn)用智能手段賦能傳統(tǒng)應用和實現(xiàn)新興功能。


因此,在追求極致性能、功耗和面積(PPA)的模式之外,架構師們需要富有前瞻性地去選擇高性能、高靈活性、可升級和開發(fā)者(生態(tài))友好的架構。我們不妨先回顧AI發(fā)展的歷程,從感知AI到生成式AI,再到智能體AI和物理AI,其應用場景不斷拓展。在感知AI階段,Al技術在語音識別、深度推薦系統(tǒng)和醫(yī)學影像等領域取得顯著進展;生成式AI在數(shù)字營銷和內容創(chuàng)作方面發(fā)揮了重要作用;智能體AI為編程、客戶服務、患者護理提供助力;物理AI推動了自動駕駛汽車和通用機器人發(fā)展。

 image.png

伴隨著AI技術的發(fā)展,在傳統(tǒng)的CPU、GPU和FPGA等計算技術之外,諸如TPU、NPU 和DPU等專門針對特定算法或者模型的新型硬件數(shù)據(jù)處理加速器也開始出現(xiàn),它們帶來高效率因而在許多場景中得到了應用。與此同時,AI技術不斷向新的場景和應用廣泛滲透,使得面向特定模型和場景的NPU等架構難以應對模型的變化和場景的多樣化,從而使傳統(tǒng)的 靈活性更高的CPU和GPU架構依舊在計算領域占據(jù)重要地位。


但是,AI技術的進步和新場景的出現(xiàn),正在迫使半導體知識產權(IP)提供商和芯片設計公司快速做出變化,無論是采用傳統(tǒng)架構的廠商,還是新的xPU提供商都需要尊重產業(yè)規(guī)律。華興萬邦亦認為,從技術經濟學和企業(yè)實際經營來看,高額的研發(fā)費用和市場營銷費用是多數(shù)芯片設計企業(yè)面臨的最重要費用,而靈活可擴展的架構可以覆蓋更廣的市場并可以實現(xiàn)更長的產品生命周期,它們是攤銷這些費用以提升盈利能力的重要手段。

 

架構創(chuàng)新迫在眉睫


Imagination Technologies中國業(yè)務發(fā)展負責人黃音在慕尼黑電子展AI技術創(chuàng)新論壇演講中分析道:“當前主芯片設計不僅需要芯片企業(yè)投入大量研發(fā)資源,更需要協(xié)調生態(tài)合作伙伴的技術路線。面對AI算法快速迭代的挑戰(zhàn),行業(yè)在探索創(chuàng)新架構的同時,仍需重視經過長期驗證的基礎計算架構價值。以GPU為例,其架構在保持高并行計算優(yōu)勢的同時,新一代設計正通過模塊化擴展能力(如可配置Shader集群、彈性內存子系統(tǒng))來適應不同AI工作負載需求。作為專注圖形計算領域的IP廠商,Imagination觀察到,理想的AI加速架構需要在三個維度取得平衡:支持細粒度并行的計算單元設計、滿足算法動態(tài)調整的可配置性,以及維持開發(fā)工具鏈的持續(xù)兼容性?!?p style="text-align: center;"> image.png

“擴展能力是Imagination GPU開發(fā)演進的方向:在具備強大的渲染能力的同時,融合AI并行計算能力,在邊緣AI的場景下能提供靈活又高效的算力。所以,Imagination將幫助芯片設計人員發(fā)現(xiàn)真正的破局點,幫助他們去構建一個可以持續(xù)適配模型和算法演進、以及支持新興應用的架構平臺——而不是為某個模型做一次性的‘專用硬件定制’,從而避免硬件(處理器)總是費力費錢跟著算法跑的問題?!秉S音補充道。


Imagination正在幫助客戶導入更加靈活的架構。以該公司不久前發(fā)布的Imagination DXTP GPU IP為例,它采用了先進的平衡架構,增加了緩存和系統(tǒng)級帶寬,實現(xiàn)了更高的持續(xù)性能,幾何吞吐量提高50%,不僅能夠輕松同時處理圖形和計算任務,而且其功率效率還較其前序產品提升了20%,為邊緣AI提供了理想的GPU平臺。DXTP  GPU已經被全球知名科技公司采用,用于對AI 多數(shù)據(jù)類型處理、計算任務加速和本地內存的支持。

 image.png

三個落地是成功的關鍵


當然,對于芯片設計師而言,這需要做到三個必須“落地”,即模型算法落地、垂直功能落地和開放生態(tài)落地。針對模型算法落地,Imagination的突破點是堅持構建一個通用可編程的并行架構平臺,并通過開放的編譯器和推理后端(backend),支持客戶軟硬件協(xié)同設計和提供適配路徑,幫助其客戶把諸如Transformer、Diffusion類模型和前沿算法快速落地到GPU上。為此該公司將幫助客戶認識到在算法不斷演化的時代,架構的“適配力”遠比一時的TOPS值更重要。


在垂直功能落地方面,Imagination在移動、汽車、云和桌面等領域深耕了數(shù)十年,積累了豐富的經驗和許多創(chuàng)新的支撐性技術,可以幫助客戶去避開其中的潛在風險和快速在領域內創(chuàng)造優(yōu)勢,這可以從該公司的D系列GPU IP的產品功能創(chuàng)新上可以看出其垂直領域功能落地能力。例如,DXT GPU 是Imagination面向移動應用、高端游戲和專業(yè)圖形設計等應用推出的新一代GPU IP,它不僅率先在移動平臺上提供了可擴展的光線追蹤功能,還有2D雙速率紋理映射等多項可以提升處理速度和優(yōu)化內存帶寬的技術。


為了幫助桌面和數(shù)據(jù)中心客戶實現(xiàn)高性能的云端GPU創(chuàng)新解決方案,Imagination推出了DXD GPU IP,首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著提升了DXD與Windows平臺上的應用程序和游戲的兼容性。同時,Imagination 的硬件虛擬化技術 HyperLane支持在單個GPU上安全且獨立地運行多個操作系統(tǒng),極大地提升了服務器的使用效率,降低了云游戲的運營成本,并為云游戲行業(yè)的發(fā)展帶來了創(chuàng)新的運營模式。


Imagination為汽車智駕芯片提供的專用IP是該公司支持芯片設計企業(yè)垂直功能落地的又一個典范,血的教訓換來了更加嚴格的安全法規(guī),使智駕芯片設計公司在算力、生態(tài)和生命周期之外,必須去認真去考慮功能安全性。為了幫助芯片設計企業(yè)滿足全球汽車智能化需求,Imagination推出了DXS系列GPU,該系列IP不僅為智能駕駛艙和先進駕駛輔助(ADAS)等應用所需SoC帶來匹配的算力,而且專為諸如汽車處理器等對功能安全性要求極為嚴苛的應用,開發(fā)了結合GPU的計算模式特點并大幅降低成本的分布式功能安全機制(DSM)并通過了ASIL-B認證。這為汽車和工業(yè)等越來越多需要GPU的圖形處理能力和計算能力的電子系統(tǒng)帶來了巨大的創(chuàng)新。

 image.png

Imagination在支持客戶實現(xiàn)產業(yè)生態(tài)落地方面也同樣頗費心機,其GPU IP全面支持OpenCL、SYCL、Vulkan Compute等開放標準,與PyTorch、TensorFlow等主流框架完美兼容。如Imagination通過與安卓生態(tài)系統(tǒng)合作,優(yōu)化對LiteRT的支持,為開發(fā)者提供豐富工具和示例,便于開發(fā)高性能AI應用,充分展現(xiàn)了其GPU架構的適配能力。這種開放生態(tài)簡化了新硬件與設備的集成流程,避免供應商鎖定問題,使客戶能在不同平臺輕松部署。通過整合多方資源,Imagination可幫助客戶實現(xiàn)協(xié)同優(yōu)化,提升資源利用率和執(zhí)行效率,鞏固了其在GPU市場的領先地位,為企業(yè)應對AI算法和產品快速迭代提供堅實支持。

 

總結與展望


大模型的下沉、算法創(chuàng)新和邊緣及端側AI的崛起為基于 GPU的主控芯片帶來了新的發(fā)展契機,在AI一體機、新物聯(lián)網、智能安防和自動駕駛等領域已經出現(xiàn)了巨大的需求,這些設備對高性能的圖形處理和AI推理同時都有越來越多的需求,因此更靈活和可擴展的架構可以使芯片設計公司的產品覆蓋更廣泛的市場領域,同時可以擁有更長的產品生命周期,也就有了更高的潛在盈利能力。

 

關鍵字:邊緣AI  芯片架構  GPU架構  芯片  AI 引用地址:邊緣AI芯片架構的思考:為何可擴展GPU架構值得關注

上一篇:“最佳AI拍檔”合作裂痕初現(xiàn):OpenAI謀求獨立、微軟轉向自研
下一篇:E3650工具鏈生態(tài)再增強,IAR全面支持芯馳科技新一代旗艦智控MCU

推薦閱讀最新更新時間:2025-07-21 07:01

大數(shù)據(jù)重塑新芯片架構 AI處理器尋求突破
  業(yè)界共同的愿景是開發(fā)一款人工智能( AI ) 處理器 ,它可為神經網絡處理訓練與推理等任務,甚至可能出現(xiàn)一些新的自我學習技術;這種 AI 處理器 還必須能透過大規(guī)模的平行化方式提供強大的性能,同時具有高功效且易于編程...下面就隨嵌入式小編一起來了解一下相關內容吧。   由亞馬遜(Amazon)、Google和Facebook等網絡巨擘所收集的大量數(shù)據(jù)集,正推動處理這些巨量數(shù)據(jù)的新芯片復興。預計在六月底的年度計算機架構大會上將亮相其中兩項最新成果。   史丹佛大學(StanfordUniversity)的研究人員將介紹一種可重配置 處理器 ——Plasticine,它可支持比FPGA更高近100倍的每瓦特性能,同時也更易于編
[嵌入式]
邊緣AI廣泛應用推動并行計算崛起及創(chuàng)新GPU滲透率快速提升
人工智能(AI)在邊緣計算領域正經歷著突飛猛進的高速發(fā)展, 根據(jù)IDC的最新數(shù)據(jù),全球邊緣計算支出將從2024年的2280億美元快速增長到2028年的3780億美元 。這種需求的增長速度,以及在智能制造、智慧城市等數(shù)十個行業(yè)中越來越多的應用場景中出現(xiàn)的滲透率快速提升,也為執(zhí)行計算任務的硬件設計以及面對多樣化場景的模型迭代的速度帶來了挑戰(zhàn)。 AI不僅是一項技術突破,它更是軟件編寫、理解和執(zhí)行方式的一次永久性變革。傳統(tǒng)的軟件開發(fā)基于確定性邏輯和大多是順序執(zhí)行的流程,而如今這一范式正在讓位于概率模型、訓練行為以及數(shù)據(jù)驅動的計算。這并不是一時的潮流。AI 代表了計算機科學的一次根本性、不可逆的轉變 —— 從基于規(guī)則的編程,邁向自適應的
[網絡通信]
<font color='red'>邊緣</font><font color='red'>AI</font>廣泛應用推動并行計算崛起及創(chuàng)新<font color='red'>GPU</font>滲透率快速提升
致企業(yè):邊緣AI部署,從未如此簡單
科技飛速發(fā)展,人類正步入一個由AI驅動的新時代。在這個時代,數(shù)據(jù)無處不在,算法日益精進,AI正以前所未有的方式重塑企業(yè)的運營模式,改變著各行各業(yè)的面貌。 在近期落下帷幕的第十七屆英特爾網絡與邊緣計算行業(yè)大會上,英特爾展示了未來AI與邊緣計算的結合將如何重塑企業(yè)發(fā)展模式,進而改變人們工作和生活的未來。 AI“進化”三部曲:企業(yè)數(shù)智化的未來還有多遠? 在AI引領的科技浪潮中,企業(yè)正處于轉型的前沿。想象一下,在不久的將來,AI將形成一個高度智能化的生態(tài)系統(tǒng),將企業(yè)所需執(zhí)行的工作全部自動化。它們宛如一支高效協(xié)同的團隊,在人類的智慧引領下,產生巨大的生產力和效益。這正是英特爾高級副總裁兼網絡與邊緣事業(yè)部總經理Sachin Kat
[工業(yè)控制]
意法半導體加快邊緣人工智能應用,助力企業(yè)產品智能化轉型
意法半導體加快邊緣人工智能應用,助力企業(yè)產品智能化轉型 ? ST Edge AI Suite是意法半導體新推出的整合各種軟件和工具的邊緣人工智能開發(fā)套件,為開發(fā)者和企業(yè)在工業(yè)、汽車/出行、消費電子、通信設備中嵌入意法半導體人工智能芯片提供了一個更簡單、更經濟的解決方案 ? 意法半導體為開發(fā)者和企業(yè)提供一個資源豐富的人工智能生態(tài)系統(tǒng),包括各種硬件、免費軟件和工具,以及合作伙伴提供的云服務和人工智能工具鏈 ? 讓任何規(guī)模的企業(yè)都可以從無限制的邊緣人工智能部署中受益,加速其在全球的應用 2023年12月14日, 中國-服務多重電子應用領域、全球排名前列的半導體公司意法半導體(STMicroelectronics,簡稱
[半導體設計/制造]
恩智浦MCX系列MCU專為邊緣AI普及而生
隨著構成物聯(lián)網 (IoT) 的連接節(jié)點數(shù)量每天都在增長,人們普遍認為機器學習 (ML) 推理的執(zhí)行方式必須改變。對實時響應的需求意味著費力地來回傳輸數(shù)據(jù)只會花費太長時間,而需要在更短的時間內做出決策。另一個考慮因素是安全性,因為這種安排會增加網絡攻擊的風險。 因此,物聯(lián)網節(jié)點傳感器獲取的大部分數(shù)據(jù)將需要在源頭進行處理,而不是在云端或集中式數(shù)據(jù)中心站點完成所有工作。通過這種方法,可以提供安全、低延遲的操作。 通過更智能的邊緣,系統(tǒng)將有可能對不斷變化的情況做出更快的反應,例如,在有嚴重成本影響或安全關鍵的情況下,以及允許更好的用戶體驗而不會產生任何煩人的滯后。 能夠訪問基于邊緣的 ML 推理將有利于廣泛的應用場景。 其中包括工
[物聯(lián)網]
一個利用邊緣AI實現(xiàn)山火警報的實際案例
編譯自Edge Impulse 早期發(fā)現(xiàn)對于控制山火蔓延至關重要。然而,大多數(shù)檢測系統(tǒng)依賴于衛(wèi)星和光學熱監(jiān)測,通常在點著火后一到三個小時產生警報。在森林中部署無線傳感器節(jié)點是對抗山火的最常用解決方案之一。但是由于現(xiàn)有設備的功耗,限制了現(xiàn)場部署。此外,到目前為止,這些傳感器節(jié)點只是一個數(shù)據(jù)收集的設備,在遠離數(shù)據(jù)生成點的服務器上盲目地收集數(shù)據(jù)并將數(shù)據(jù)發(fā)送到運行在服務器上的檢測算法,這會顯著增加能耗和響應時間。 邊緣機器學習則解決了這一瓶頸。將計算后的節(jié)點數(shù)據(jù)上傳到云端,可顯著提升電池壽命和系統(tǒng)響應時間。嵌入式愛好者 Pratyush Mallick開發(fā)了一個集成機器學習的山火檢測方案。 該系統(tǒng)包括一個來自 ADI的EV-
[嵌入式]
一個利用<font color='red'>邊緣</font><font color='red'>AI</font>實現(xiàn)山火警報的實際案例
加速AI滲透,富士康、索喜和Hailo聯(lián)合開發(fā)邊緣視頻分析產品
日期,富士康的24核小型服務器BOXiedge已與索喜的并行處理器SynQuacer SC2A11和Hailo-8深度學習處理器結合在一起,提供獨立的AI推理節(jié)點。= 該產品能夠在邊緣處實時處理和分析多達20個攝像機視頻流輸入。 通過高密度,低功耗,完整的本地VMS服務器,確保了視頻分析和隱私,包括圖像分類,檢測,姿勢估計以及其他各種基于AI的實時應用程序。 富士康已經在不同的生產線上部署了數(shù)類內部開發(fā)的AI解決方案,從而將準確性從95%提高到了99%,并且將外觀缺陷檢查項目的運營成本至少降低了三分之一。 Hailo-8深度學習處理器最多可提供26TOPS處理性能,該芯片采用的獨特架構可以使邊緣設備能夠運行以前只能
[物聯(lián)網]
基于全新第五代GPU架構的Arm Immortalis有多強?
GPU如今似乎已經超越了CPU,無論是在桌面,服務器抑或是手機,都可以在圖像處理或者ML處理方面顯著提升用戶體驗。Arm最近推出了采用第五代GPU架構的Immortalis-G720,將為各種設備帶來全新的體驗。Arm 終端事業(yè)部產品管理高級總監(jiān) Anand Patel對該系列新品進行了解讀。 Patel介紹道,全新第五代 GPU架構通過專注于系統(tǒng)級優(yōu)化,專注于處理效率,實際應用場景等完善游戲體驗,并且要支撐包括游戲機、筆記本、電話、游戲手機等豐富場景。 Immortalis-G720帶來了全面系統(tǒng)級的效率提升,使用內存帶寬減少 40%,每瓦特性能提升15%,峰值性能提升15%,并且整個架構吞吐量提升了一倍,而如果在工藝及
[手機便攜]
基于全新第五代<font color='red'>GPU</font><font color='red'>架構</font>的Arm Immortalis有多強?
小廣播
最新嵌入式文章

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發(fā)圈

 
機器人開發(fā)圈

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業(yè)務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved