黑芝麻智能發佈華山A2000芯片 專攻智駕市場
黑芝麻智能宣佈推出專為下一代AI模型設計的高算力芯片平台 — 華山A2000家族。A2000家族芯片平台以更高算力、更強性能賦能汽車行業,加速高階智能駕駛成為標準配備,打造全場景通識智駕標桿。
華山A2000家族為全場景通識智駕設計
華山A2000家族包括A2000 Lite、A2000和A2000 Pro三款產品,分別針對不同等級的自動駕駛需求。A2000 Lite專注於城市智駕,A2000支持全場景通識智駕,而A2000 Pro則是為高階全場景通識智駕設計。
作為新一代自動駕駛芯片,華山A2000家族以其卓越的性能和全面的功能,標誌著華山系列在自動駕駛技術領域的重大飛躍。A2000家族的芯片集成了業界領先的CPU、DSP、GPU、NPU、MCU、ISP和CV等多功能單元,實現了高度集成化和單芯片多任務處理的能力。新一代ISP技術,具備4幀曝光和150dB HDR,在隧道和夜間等場景下表現更好,顯著提升了圖像處理能力。
單芯片數據閉環的設計,使得數據在智駕功能正常運行的同時能夠實現全車數據的脫敏、壓縮、編碼和存儲,為算法的迭代和創新提供堅實基礎。A2000家族算力最大是當前主流旗艦芯片的4倍,原生支持Transformer模型。A2000家族的靈活擴展性,允許多芯片算力的擴展,以適應不同級別的自動駕駛需求,產品組合全面覆蓋從NOA到Robotaxi的廣泛應用場景。
華山A2000家族芯片不僅在智能汽車領域展現出強大的性能,還能夠支持機器人和通用計算等多個領域。值得一提的是,A2000芯片能夠滿足機器人的「大小腦」需求,推動機器人產業從原型開發階段邁向大規模量產。
大核架構支持智駕大模型實時推理
與此同時,黑芝麻智能推出了自研 NPU 新架構——黑芝麻智能「九韶」,九韶是黑芝麻智能為滿足自動駕駛技術需求而推出的高性能 AI 芯片的計算核心。新一代通用AI工具鏈BaRT和新一代雙芯粒互聯技術BLink兩大創新,共同賦能「九韶」計算性能的充分發揮和靈活擴展,構成了一個強大的智能駕駛技術底座,為A2000家族性能躍遷保駕護航。
九韶NPU採用了領先的大核架構,支持智駕大模型的實時推理,降低算法計算的延遲,基於優先級搶佔的機制為處理複雜計算任務提供了強有力的支撐。
同時,九韶NPU也是業界最高安全等級的NPU,高安全等級能夠避免模型推理過程中的隨機錯誤和失效,支持訓練與部署的一致性,確保了自動駕駛系統的高安全性和確定性。
九韶NPU的特點包括高算力、高能效和高帶寬,這是智能駕駛技術向更高階迭代的基礎。它支持包括INT8/FP8/FP16在內的混合精度,集成了針對高精度精細量化和Transformer的硬加速,能夠簡化開發者在量化和部署過程中的工作。
此外,九韶NPU還具備低延時和高吞吐的三層內存架構,包括大容量高帶寬的NPU專用緩存、核心模塊片內共享緩存,以及對稱的雙數據通路和專用DMA引擎。提升了性能和有效帶寬,降低了對外部存儲帶寬的依賴,在性能、帶寬和成本之間取得了極致平衡。
為了充分發揮九韶NPU的潛力,黑芝麻智能研發了新一代通用AI工具鏈BaRT。BaRT支持多種流行框架和模型的轉換,原生兼容PyTorch的推理API,支持Python編程部署。這使得開發者能夠更加便捷地利用九韶架構進行AI模型的開發和部署。
BaRT的另一個優勢是支持業界主流的Triton自定義算子編程,允許開發者使用Python語言編寫Triton自定義算子,這些算子可以被自動化編譯成硬件加速代碼,從而進一步加速開發者AI模型的部署。
為了滿足不同等級自動駕駛的算力需求,新一代雙芯粒互聯技術BLink技術為算力擴充提供了高效解決方案。BLink支持Cache一致性互聯的高效C2C(Chip-to-Chip)技術,能夠擴展支持更大規模模型的算力需求,為算法長期演進做好準備。
通過BLink技術,A2000家族芯片能夠實現軟件單OS跨片部署,支持高帶寬C2C一致性連接,滿足NUMA跨芯片訪存要求,簡化軟件開發和部署的難度。