百度文心大模型4.0 Turbo多端面向用戶正式開放
「文心一言累計使用者規模已達3億,日調用次數也達到了5億。」近日,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在WAVE SUMMIT深度學習開發者大會2024上宣佈了文心一言的最新資料,並正式發佈文心大模型4.0 Turbo、飛槳框架3.0等最新技術,披露飛槳文心生態最新成果。
通用人工智能新視角:技術通用、能力全面
人工智能的目標是類比、延伸和擴展人的智慧。王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術的通用性,二是能力的全面性。
人工智能技術歷經幾十年發展,從早期的人工撰寫規則,到後來統計機器學習,可以自動從資料中學習,但解決不同場景的問題需要不同的演算法,演進到深度學習時代,演算法的通用性大大加強,深度神經網路一套架構和技術可以解決各種問題,再到大模型時代,除了演算法,模型也變得更加通用和統一。
在技術的通用性方面,大模型在面向不同任務、語言、模態、場景時,通用性越來越強。以自然語言處理為例,之前有分詞、句法分析、語義匹配、機器翻譯、問答、對話等很多子方向,現在一個大語言模型就可以解決絕大多數任務;語言方面,大模型既可以解決單語言的問題,也可以跨語言,不僅學習了人類的自然語言,也學習了人工定義的形式語言,架起了從思考到執行的橋樑;同時,大模型也可以實現多模態的統一建模,廣泛賦能各行各業應用等。總體上,人工智能技術的通用性越來越強。
在能力的全面性方面,理解、生成、邏輯、記憶是人工智能的四項基礎能力,創作、解題、代碼、規劃、決策等人工智能的典型能力,基本上都是這四項基礎能力的綜合運用。以基於文心大模型實現的運營活動系統為例,模型首先理解使用者需求,進行系統設計,然後規劃相關的任務來執行,接下來根據規劃生成代碼,逐步實現系統搭建,包括資料庫、後端功能、前端頁面等等,再進行服務的部署,如果部署失敗,模型能夠根據報錯資訊自動反思反覆運算,直到部署成功,服務順暢運行。大模型完成系統開發到服務運行的過程,充分體現了大模型的理解、生成、邏輯、記憶四項基礎能力,以及對這四項能力的綜合運用。這四項能力越強,越接近通用人工智能。
文心大模型4.0 Turbo發佈 文心一言使用者達3億
大會現場,王海峰發佈了文心大模型4.0 Turbo,網頁版、APP、API陸續面向用戶開放。據瞭解,企業用戶即刻起登錄百度智慧雲千帆大模型平臺即可使用API服務。以使用者使用文心大模型設計調查問卷為例,展示了文心大模型 4.0 Turbo的速度更快,效果更好。
公開資料顯示,百度自2010年起開始全面佈局人工智能,2019年3月推出文心大模型1.0,持續反覆運算升級, 去年10月發佈文心大模型4.0,今年4月發佈文心大模型4.0工具版。現又發佈了文心大模型4.0 Turbo。文心大模型是基於飛槳平臺研製的知識增強大模型,從萬億級數據和千億級知識中融合學習,具備知識增強、檢索增強和對話增強等核心技術。
在強大的基礎大模型基礎上,進一步創新智慧體技術,包括理解、規劃、反思和進化,能夠做到可靠執行、自我進化,並一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,能夠調用工具自主完成複雜任務,在環境中持續學習實現自主進化。目前,文心一言累計使用者規模已達3億,日調用次數5億。
大會還發佈了中國工程院朱有勇院士及團隊與百度共同打造的首個農業智慧體——「農民院士智慧體」。它基於文心智慧體平臺創建,學習了朱有勇院士的研究成果以及相關的農業知識,可以為農民解答生產生活中的問題,促進科技助農惠農。瀾滄拉祜族自治縣竹塘鄉黨委書記丁杏杏、雲山村村民李福受邀來到大會現場,分享了使用「農民院士智慧體」為他們的農業生產帶來的便利。
飛槳框架3.0發佈 飛槳文心生態開發者達1465萬
文心大模型的持續快速進化,得益於百度在晶片、框架、模型和應用上的全棧佈局,尤其是飛槳深度學習平臺和文心的聯合優化。王海峰發佈了飛槳新一代框架——飛槳框架3.0,具備動靜統一自動並行、編譯器自動優化、大模型多硬體適配、大模型訓推一體等核心技術,支撐大模型效果更好,性能更優。截至目前,飛槳文心生態已凝聚1465萬開發者,服務37萬家企事業單位,創建95萬個模型。
王海峰最後表示,縱觀人類經歷的前三次工業革命,其核心驅動力量機械技術、電氣技術和資訊技術都有很強的通用性,會應用於各行各業,當它們呈現出標準化、自動化和模組化的工業大生產特徵,核心技術就進入工業大生產階段。現階段的人工智能技術,基於深度學習及大模型工程平臺,包括演算法、資料、模型、工具等,也已經具備了非常強的通用性,並具備了標準化、模組化和自動化的特徵,推動人工智能進入到工業大生產階段,通用人工智能將加速到來。