百度文心大模型3.5全球評測榮獲7項滿分
國內百「模」大戰下,究竟誰實力強,IT市場研究和諮詢公司IDC最新發佈的《AI大模型技術能力評估報告,2023》給出了答案。百度文心大模型拿下12項指標的7個滿分,綜合評分第一,尤其是演算法模型、通用能力等基礎技術領跑全行業,演算法模型獲得唯一一個滿分。
百度文心大模型7項滿分 綜合評分第一
IDC報告指出,百度AI大模型整體競爭力位於領先水準,在模型能力、工具平臺、生態佈局以及行業覆蓋上優勢明顯,並已提前進入商業化落地探索階段。
這是IDC首次提出AI大模型技術能力評估框架,結果顯示,百度文心是這場大模型技術突破者和應用引領者。大模型的發展為通用人工智慧帶來了曙光,而「演算法模型」能力無疑是大模型能力最為核心的要素,也是決定大模型應用效果的根本所在。只有通過演算法模型技術的突破,實現具有通用效果優勢的大模型底座,才能支撐各行各業充分享受技術突破帶來的紅利,破解AI落地門檻高的困境。
文心大模型在此次IDC評估中獲得了演算法模型維度的唯一一個滿分,充分體現了百度在大模型核心技術上的領先優勢。百度自2019年開始深耕預訓練模型研發,先後發佈知識增強文心系列模型。前不久,百度正式發佈文心大模型3.5版本,進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新,新版本在各項能力上均有明顯提升。
多個公開測評顯示,文心大模型3.5版支援下的文心一言中文能力突出,甚至有超出GPT-4 的表現;綜合能力在評測中超過ChatGPT,遙遙領先於其他大模型。
文心大模型取得「第一」得益於百度「晶片-框架-模型-應用」四層技術棧優勢、知識增強的核心特色和繁榮的大模型生態三大優勢。
據報導,百度擁有自研的深度學習平臺飛槳有力支撐了大模型的高效訓練和推理。飛槳與文心的協同優化,讓文心大模型3.5最新版本的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。知識增強作為文心大模型的核心特色之一,實現了更高的效率、更好的效果、更強的可解釋性。
在大模型生態方面,百度文心已形成企業、教育、社區三位一體的生態體系。最新資料顯示,百度有超過750萬開發者基礎,20萬企業生態基礎,多層次開展大模型人才培訓、企業賦能、開發者運營。百度還設立了10億創投基金鼓勵大模型創意、繁榮大模型生態。
助企將大模型內化為生產力工具
AI大模型已經從拼參數發展到拼應用,進入大規模可複製的產業落地階段。百度文心大模型源於產業實踐,服務於產業實踐,業內首次提出了行業大模型的落地思路,聯合國家電網、浦發銀行、泰康、吉利、哈爾濱市、深圳燃氣、TCL、上海辭書出版社等企業單位,合作發佈了11個行業大模型,是業內最早和廣泛深入推動行業大模型的廠商。
IDC評估結果顯示,百度文心大模型在行業覆蓋上獲得滿分成績,在能源、金融、教育、醫療等領域已經實現廣泛業務佈局和落地場景探索。
據介紹,文心大模型已經擁有中國最大的產業應用規模,目前有15萬家企業申請接入文心一言測試。百度智慧雲與300多家生態夥伴,在超過400個場景中已取得相當不錯的測試效果。
以能源電力為例,百度為世界上最大的電網——國家電網提供大模型技術,用AI預測用電高峰波谷,為電網調度提供建議,用無人機加圖像識別巡檢線路,保障供電平穩。百度智慧雲聯手山西國峰煤電,基於大模型技術打造智慧運行方案,平均每年降低電廠運行成本600萬,減少1.06萬噸碳排放。
未來所有的企業都會強依賴大模型,所有的產品都會基於大模型來開發。對大模型技術廠商來說,建立一套完整的生態系統可以讓大型模型從「已用」、「可用」變為「易用」,進一步推動人工智慧的發展。百度文心大模型將助力千行百業的中國企業將大模型內化為自身的生產力工具,走上智慧化轉型升級的快車道,構建面向全球的強大競爭力。