百度智慧雲升級兩大AI基礎設施 文心大模型日調用量超7億次
近日,2024百度雲智大會在北京召開。為幫助企業更快、更好、更省地使用大模型,百度智慧雲分別針對算力、模型、AI應用,全面升級百舸AI異構計算平臺4.0、千帆大模型平臺3.0兩大AI基礎設施,並升級代碼助手、智慧客服、數碼人三大AI原生應用產品。
升級百舸4.0:模型訓練有效時長達99.5%,高效管理十萬卡集群
百度集團執行副總裁、百度智慧雲事業群總裁沈抖表示,大模型以及配套的算力管理平臺、模型和應用開發平臺,正在迅速成為新一基礎設施。
「2024年大模型的產業落地正在加速,目前在千帆大模型平臺上,文心大模型日均調用量超過7億次,累計幫助用戶精調了3萬個大模型,開發出70多萬個企業級應用。過去一年,文心旗艦大模型降價幅度超過90%,主力模型全面免費,最大限度降低了企業創新試錯的成本。」沈抖說。
大算力是大模型落地的基礎條件。為滿足企業落地大模型從集群創建、開發實驗,到模型訓練、推理的全旅程算力需求,應對超大規模GPU集群高成本、難運營兩大挑戰,百度智慧雲升級發佈百舸AI異構計算平臺4.0,面向萬卡、十萬卡集群全面升級算力管理能力。
首先,在集群創建階段,企業通常需要進行大量複雜、瑣碎的算力配置和調試工作。百舸4.0預置了主流的大模型訓練工具,能夠實現工具層面的秒級部署,並將萬卡集群運行準備時間從幾周縮減至1小時,極大地提升部署效率,縮短業務上線週期。
在開發實驗階段,企業需要針對業務目標對不同架構、參數的模型進行多次測試,進而制定最佳模型訓練策略,保障後續訓練的性能和效果。百舸4.0全新升級的可觀測大盤,能夠對多芯適配、集群效能、任務自動容錯等方面進行全方位監測,提供直觀決策依據,幫助用戶更好地把控整體專案。
在模型訓練階段,穩定和高效是衡量GPU集群水準的「金指標」、「硬通貨」。
在穩定性方面,一張GPU出現故障就會導致集群整體停擺,大量時間、成本浪費在故障恢復和資料回滾上。百舸4.0能夠自動篩查集群狀態,並基於對GPU故障的精准預測,及時轉移工作負載,降低故障發生頻次。此外,百舸獨有的故障秒級感知定位、Flash Checkpoint模型任務狀態回滾等技術,能夠大幅減少集群故障處置時間,實現接近無損的集群容錯。
目前,百舸在萬卡集群上實現了有效訓練時長占比99.5%以上,業界領先,極大地節約了客戶算力與時間成本。此外,百舸4.0通過在集群設計、任務調度、並行策略、顯存優化等一系列創新,大幅提升了集群的模型訓練效率,整體性能相比業界平均水準提升高達30%。
在模型推理環節,百舸則通過架構分離、KV Cache、負載分配等一系列加速方法,實現了模型推理的降本提效,尤其在長文本推理方面,推理效率提升超過1倍。
面向未來,沈抖認為,大模型的Scaling Law將在一段時間內持續有效,很快就會有更多的十萬卡集群出現,但是管理十萬卡的難度與管理萬卡有著天壤之別。
首先,在物理空間方面,十萬卡集群需要佔據大概10萬平方米空間,相當於14個標準足球場的面積;在能耗方面,每天則要消耗大約300萬千瓦時的電力,相當於北京市東城區一天的居民用電量。這種對於空間和能源的巨大需求,遠遠超過了傳統機房部署方式的承載能力,跨地域機房部署又會給網絡通信帶來巨大挑戰。此外,十萬卡集群中的GPU故障將會非常頻繁,有效訓練時長占也將迎來新的挑戰。
針對這些難題,百舸4.0已經構建了十萬卡級別的超大規模無擁塞HPN高性能網路、10ms級別超高精度網路監控,以及面向十萬卡集群的分鐘級故障恢復能力。
「百舸4.0正是為部署十萬卡大規模集群而設計的。今天的百舸4.0,已經具備了成熟的十萬卡集群部署和管理能力,就是要突破這些新挑戰,為整個產業提供持續領先的算力平臺。」沈抖說。
生數科技作為國內領先的多模態大模型廠商,基於百舸平臺開發出國內首款全面對標OpenAI Sora的視頻大模型「Vidu」。會上,生數科技聯合創始人兼CEO唐家渝宣佈,即日起Vidu將通過百度智慧雲千帆大模型平臺面向開發者、企業使用者開放API服務。
對於自建智算中心的客戶,百舸4.0此番還對「一雲多芯」能力進行了升級。在萬卡規模集群上,多芯混合訓練效能高達95%,保持業界領先。「要建設更大的集群,同時確保供應鏈的安全和彈性,勢必會存在不同晶片混合使用的情況,也就是說,對於自建智算中心的客戶來說,一雲多芯是必然選擇。」沈抖說。
以中國郵政儲蓄銀行為例,2023年,為加速大模型應用落地,郵儲銀行新增大量來自不同廠商的GPU資源,基於大模型為18個核心業務系統、30多家分行的金融業務提供AI賦能。在百舸的支持下,郵儲銀行順利完成了不同型號GPU資源的部署、上線;同時,也實現了GPU、CPU算力的規劃重組,有力保障了300多個大小模型、6000多次訓練任務。模型反覆運算時間也從過去的一個半月大幅縮短至半天,並實現了更好的模型效果。
長安汽車執行副總裁張曉宇表示,基於百舸平臺,百度智慧雲與長安汽車合作探索開發了整套自動駕駛模型訓練的最佳實踐方案,實現了GPU資源的精細化管理與調度。雙方緊密配合,在資料載入、計算效率、通信方式等維度進行聯合優化,使得算力總體平均使用率提升到90%以上,綜合資源利用率提升了50%。
發佈千帆3.0:三大服務全面升級,一句話即可生成企業級應用
為了滿足企業客戶對模型調用、模型開發、應用開發的需求,百度智慧雲發佈千帆大模型平臺3.0。
在模型調用方面,升級後的千帆平臺,不但可以調用包括文心系列大模型在內的近百個國內外大模型,還支援調用語音、視覺等各種傳統的小模型。在擴大模型種類的同時,百度智慧雲持續降低模型調用成本。過去一年,文心旗艦大模型降價幅度超過90%、主力模型全面免費,最大限度降低企業創新試錯的成本。
在模型開發方面,對於需要定制、微調專屬模型的客戶,千帆3.0不僅提供了最完善的大模型工具鏈,還支援CV、NLP、語音等傳統模型的開發,並實現資料、模型、算力等資源的統一納管和調度,為企業提供一站式的大、小模型開發服務。
模型投入使用後,千帆平臺還支持企業將應用中產生的資料,經過採樣評估、人工標注、對齊或微調等方式回饋給模型,形成資料飛輪,持續優化模型效果,放大模型在特定場景下的優勢。
在應用開發方面,針對企業落地大模型的高頻應用場景,千帆3.0從檢索效果、檢索性能、儲存擴展、調配靈活性四方面對企業級檢索增強生成(RAG)進行了全面升級;針對企業級Agent的開發,千帆3.0增加了業務自主編排、人工編排、知識注入、記憶能力以及百度搜索等80多個官方組件支援。
此外,本次大會還發佈了智慧化低代碼應用開發平臺「AI速搭」,通過自然語言對話就能進行企業級應用開發,一句話就可以完成應用創建。
沈抖在大會現場還演示了如何通過對話,在AI速搭平臺上開發一個資產管理應用。只需一句話描述對目標系統的需求,包含資產資訊、資產入庫、資產領用、資產維修、資產報廢等功能模組,大模型就可以清晰地理解需求並生成應用。過去,這樣一個應用即使用低代碼方式開發也需要幾天的時間,現在只需幾分鐘就能完成。
工具平臺的不斷完善,也促進了過去一年大模型產業落地的爆發式增長。目前,在千帆平臺上,文心大模型日均調用量超過7億次,千帆平臺累計幫助用戶精調了3萬個大模型,開發出70多萬個企業級應用。
三星電子大中華區總裁崔勝植表示,2024年初,三星在全球市場推出Galaxy AI,並與百度智慧雲達成戰略合作,基於千帆平臺、百度識圖為中國用戶帶來國際領先的Galaxy AI當地語系化功能,包括即圈即搜、筆記助手、轉錄助手、聊天助手、流覽助手等移動AI體驗。
在招聘領域,獵聘基於千帆平臺,通過調用文心大模型,結合自身豐富的行業know-how,能夠對企業崗位需求和求職者簡歷內容進行語義理解分析,並實現智慧化的簡歷篩選功能,人崗匹配準確率相比業界平均水準的70%高出15個百分點,高達85%,並提升招聘效率50%以上。
在教育領域,考試寶作為一款職業教育線上學習App,過去主要依賴人工為會員提供試題解析服務,速度慢、成本高,有些試題甚者需要等待一天以上才能得到解析結果。如今,通過提示詞工程和調用文心大模型,考試寶實現了試題的智慧化解析,只需上傳試題就能秒級得到解析結果,單條試題解析成本也從過去的1.5元降到3厘,降幅高達98%,用戶付費意願也增長了一倍以上。
此外,千帆行業增強版提供了體系化的工具和元件,支援行業客戶、合作夥伴在千帆通用底座上不斷添加行業特色,從而更方便地開發適合自己的行業應用。目前,千帆平臺上已經沉澱了包括製造、能源、交通,政務、金融、汽車、教育、互聯網在內的八大行業解決方案。
南方電網數字電網研究院副總經理胡榮表示,去年九月,南方電網發佈了行業垂直領域首個自主可控的大模型「大瓦特」。「大瓦特」既是大模型、小模型及智慧體構成的模型體系,也是開放共用的平臺與生態體系。平臺上,南方電網基於百度智慧雲千帆平臺構建了電力調度值班助手。在應對突發事件時,電力調度值班助手可以秒級生成處置方案,極大地增強了調度員的應急回應能力。
代碼助手、智慧客服、數碼人全面升級
隨著大模型產業落地逐漸走向深水區,AI原生應用也將迎來爆發式增長,為了滿足企業直接選購成熟AI應用的需求,百度智慧雲面向數碼人、智慧客服、代碼提效三大領域,升級了三大AI原生應用產品。
基於文心大模型重構的AI原生智慧客服應用「客悅」,在用戶複雜意圖理解、多模態資訊交流等方面實現了大幅提升,讓智慧客服變得更聰明、更擬人。「問題自助解決率」是智慧客服領域最關鍵的考核指針,當前業內平均水準是80%,升級後,客悅將這一指標提升至92%,實現業界領先。目前,客悅已累計說明企業客戶服務超過1.5億人次,交互超過5億次。
基於大模型能力,新升級的曦靈數位人4.0支援根據文字快速生成不同妝造、不同行業特色的3D數碼人形象和視頻。本次大會期間,曦靈平臺宣佈:將3D超寫實數碼人的價格從萬元大幅降價至199元,達到業內最低價。
全新升級的4D(3D+時間維度)自動綁定技術和創新模態遷移技術,還解決了傳統2D數碼人動作僵硬的問題,可以實現人物在不同角度、形體、表情的高度一致,即使是面部微表情也能做到自然、逼真。
全新升級的全流程AI代碼提效工具「文心快碼」,聚焦研發全生命週期的業務流,實現了從專案接手到最終交付,全流程編碼開發效率與品質的雙重提升。
本次大會,文心快碼業界首發「企業級代碼架構解釋」、「企業級代碼審查」,兩項全新功能。企業級代碼架構解釋能在專案接手初期,實現工程架構的智慧解讀,幫工程師快速理解業務邏輯;而企業級代碼審查則能傳承資深工程師的編碼經驗,智慧輔助程式師查缺補漏。
此外,針對市面上通用代碼助手缺乏對企業歷史代碼庫的理解的痛點,文心快碼全新升級的「企業級代碼輔助能力」能夠深度理解企業代碼庫,快速學習企業過往的代碼與規範,讓生成的代碼更貼近企業的要求。
目前,文心快碼已經服務超過1萬家企業客戶,說明數百萬中國開發者提升編碼效率,整體提升研發效率20%。