百度現場演示:「文心千帆」如何可視化微調大模型

新產品 焦點新聞

大模型引發的AI再造產業趨勢已勢不可擋。但企業最大的難題是,如何高效、低成本獲取大模型能力,如何挑選到最合適的大模型服務。近日,百度智能雲在北京舉行文心大模型技術交流會,向在場的百家企業展示文心大模型在產品技術、場景研發、生態建設等領域的最新進展。

提供大模型服務、開發和應用

百度智能雲方面表示,正在內測的「文心千帆大模型平台」,是全球首個一站式的企業級大模型生產平台,不但提供包括文心一言在內的大模型服務及第三方大模型服務,還提供大模型開發和應用的整套工具鏈。

未來,文心千帆將提供兩種服務:第一,文心一言是目前中國市場最領先的大模型,未來,文心千帆將以文心一言為核心,提供大模型服務,幫助客戶改造產品和生產流程。第二,作為一個大模型生產平台,企業可以在文心千帆上基於任何開源或閉源的大模型,開發自己的專屬大模型。

百度集團副總裁侯震宇表示,大模型時代下,企業的創新要脫穎而出,不但需要智能的算力、靈活的框架平台、豐富的大模型體系以及優質的應用方案,還需要這四者之間端到端的適配與優化,這是一個「既要、又要、還要」的端到端創新工程。

百度集團副總裁侯震宇

現場,百度智能雲與聯想集團、用友、寶蘭德等14家文心千帆生態夥伴舉行簽約儀式。

用友網絡副總裁、用友研究院院長呂建偉表示,中國企業關注大模型的落地能力,一個簡單的智能問答背後有著非常複雜的加工過程。我們期望和百度智能雲一起,把微調、性能調優等工具簡化,推動大模型應用。

北京寶蘭德軟件董事長易存道表示,如何把大模型在垂直行業做好,是目前各個企業都要考慮的問題,多數企業無法像百度一樣有能力建設大模型。怎麼能夠把百度的大模型能力和企業業務有效結合起來,創造更強的價值,是企業非常好的彎道超車機會。

百度智能雲與14家文心千帆生態夥伴舉行簽約儀式。

百度工程師現場演示大模型微調全過程

事實上,目前企業應用大模型面臨諸多難點:模型體積大,訓練難度高;算力規模大,性能要求高;數據規模大,數據質量參差不齊。大模型產業化需要雲計算廠商將模型開發、訓練、調優、運營等複雜過程封裝起來,通過低門檻、高效率的企業級服務平台深入產業,為千行百業提供服務。

侯震宇表示,文心千帆大模型平台是全球首個一站式的企業級大模型平台。之所以稱為全球首個一站式平台,是因為它不但提供包括文心一言在內的大模型服務,還提供大模型開發和應用的整套工具鏈。此外,該平台還支持各類第三方大模型,未來將成為大模型生產和分發的集散地。

目前,文心千帆大模型平台提供公有雲服務、私有化部署兩大交付模式。

在公有雲服務方面,將提供:推理(直接調用大模型的推理能力)、微調(通過高質量精標業務數據,高效訓練出特定行業的大模型)、托管(將模型發佈在百度智能雲,以實現更加穩定高效的運行)三種服務,大幅降低企業部署大模型的門檻。

百度智能雲AI與大數據平台總經理忻舟在現場演示了如何微調大模型,這也是國內首次演示如何微調行業專屬大模型的全過程。文心千帆大模型平台提供了可視化開發工具鏈,提供了數據生成、標注、回流的數據閉環管理功能。客戶以少量數據即可發起模型微調,最快幾分鐘就可獲得自己的專屬大模型。

在私有化部署方面,文心千帆大模型平台支持軟件授權(提供在企業環境中運行的大模型服務)、軟硬一體(提供整套大模型服務及對應的硬件基礎設施),租賃服務(提供機器和平台的租賃滿足客戶低頻需求)三種方式。私有化部屬能夠滿足對數據監管有嚴格要求的企業客戶需求。

忻舟總結,文心千帆大模型平台有六大特點:更易用,開箱即用,節約客戶機會成本;更全面,提供覆蓋全生命週期的工具鏈;更高效,可以端到端的全流程優化;更安全;更開放;更集成,更多插件拓展模型能力邊界。

「快且收斂,是大模型應用訓練中一個非常重要的指標。」忻舟說,「只快不收斂,大模型的訓練是沒有用的。文心千帆在多機多卡訓練性能方面,可以更快達到收斂的狀態,在全球權威AI基準評測MLPerf榜單中排名世界第一。」

已有300余家生態夥伴參與文心一言內測

據瞭解,百度內部產品正在基於文心一言升級。

比如,在百度員工內部的智能工作平台「如流」上,很多程序員會就一些產品或技術難題詢問產品經理、研發同事,數量多,頻次高。過去獲得一個答案平均時間約5分鐘,現在如流有了一個文心千帆AI小助手,可以代替同事自動回答各種問題,平均5秒就可以解答一個難題,大幅提升了工作效率。

同時,百度智能雲的金融行業應用、政務行業應用、智能創作平台、智能客服、企業知識管理、數碼人直播平台等六大智能產品系列,將基於文心大模型全面升級,未來將在安全評估完成後上線。

此外, 文心千帆大模型平台面向首批企業客戶內測以來,正在與不同領域客戶聯合研發,在智能辦公、旅行服務、電商直播、政務服務、金融服務五大領域打造行業樣板間。

金山辦公助理總裁田然表示,金山辦公要跟中國優秀的大模型提供方站在一起,做好大模型應用方的角色,用更好的辦公軟件,為客戶提供更多的價值。文心千帆在安全合規、模型深度、迭代速度、推理性能等多個方面都有一定的優勢,在意圖理解、PPT大綱生成、範文書寫、生成待辦列表、文生圖等多模態生成的場景上,雙方的聯合開發已經取得了進展。金山辦公和文心千帆的合作,會進一步推動大模型在辦公領域的應用和快速落地。今天的合作只是剛剛開始,未來金山辦公與百度將在更多更有價值的功能和產品上持續探索。

百度還幫助長安汽車構建了人工智能基礎設施平台和數碼人平台。現在雙方基於百度文心大模型正在開發一款智能產品,賦能長安汽車的一款量產車型,打造創新性的用戶體驗和持續的研發動能。

百度集團副總裁袁佛玉表示:「截止目前,已有超過300家生態夥伴參與文心一言內測,在400多個企業內部場景取得測試成效。」

選擇大模型除了算力還要看三個指標

國內大公司紛紛推出大模型,對於企業來說,如何挑選一個合適的大模型成為新難題。

實際上,企業選擇大模型可以從三個標準評判:大模型本身的能力、大模型企業服務的能力、全棧技術積累程度。

侯震宇表示,百度是全球唯一在芯片、框架、模型和應用這四層進行全棧佈局的人工智能公司。正因為可以實現全棧端到端的優化,文心一言自3月啓動內測不到2個月,已完成4次技術版本升級,大模型推理成本降為原來的十分之一。

此外,大模型的大計算、大參數、高成本,也對大模型時代的AI基礎設施提出新的要求。基於四層框架優勢,百度智能雲打造了國內首個全棧自研的AI基礎設施「百度AI大底座」,面向企業AI開發提供端到端的解決方案。尤其是在框架層和模型層之間,AI大底座有很強的協同作用,可以幫助企業構建更高效的模型,持續調優性能,並顯著降低成本。

百度智能雲雲計算產品解決方案和運營部總經理宋飛舉例:「大家可能會覺得堆積算力、寫好代碼、然後進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天內不出問題。百度AI大底座可以為大模型提供高效、穩定的訓練和有效的收斂。千卡加速比達到90%,資源利用率70%,開發效率提升100%。這是AI大底座為大模型的開發和應用帶來的價值。」

百度AI大底座也在為合作夥伴提供幫助。百圖生科基於與百度智能雲聯合構建的生物超算平台,訓練出了全球首個、也是目前最大的生命科學領域的千億大模型「xTrimo」。 在地平線的智能駕駛解決方案全生命週期開發中,百度AI大底座為高性能數據儲存和模型訓練提供支持。