百度CTO王海峰:深度學習平台加大模型 加速數據與知識融合

企業動向 焦點新聞

由深度學習技術及應用國家工程研究中心主辦的Wave Summit+ 2022深度學習開發者峰會上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰發表題為《深度學習平臺加大模型,產業智慧化基座》,展示未來深度學習的大趨勢。

文心多個大模型將上線鵬城雲腦

鵬城實驗室主任、中國工程院高文院士指出,開發者是開源生態發展的核心力量,也是技術創新的骨幹力量。現階段,建設好我國自主創新的軟硬體基礎平臺至關重要。飛槳全面開源開放,凝聚眾多開發者,核心技術扎實,面向產業做了很多領先的工作,並積極探索與科學計算等基礎研究的結合。文心多個大模型將上線鵬城雲腦,並聯合發佈飛槳-鵬城雲腦發行版本。

深圳大學電子與資訊工程學院院長、深度學習技術及應用國家工程研究中心技術委員會副主任、中國工程院丁文華院士在致辭中表示,深度學習技術及應用國家工程研究中心,是國家科技創新體系的重要組成部分。飛槳平臺作為工程研究中心的核心研究成果,在保障國家資訊科技安全、推動人工智慧應用大規模落地方面發揮了重要作用。AI領域的底層核心技術,發展主動權必須掌握在自己手裡。具有自主智慧財產權的核心技術,是核心競爭力的源頭活水。

王海峰公佈了飛槳生態的最新進展:截至目前,飛槳已凝聚535萬開發者,服務20萬家企事業單位,基於飛槳創建了67萬個模型。開發者、科研院所、企事業單位、技術夥伴、硬體廠商等等,既是飛槳生態的建設者,也是受益者。飛槳構建了全方位的生態體系,產學研協同,共創、共生、共贏。

飛槳已凝聚535萬開發者,服務20萬家企事業單位,基於飛槳創建了67萬個模型。

當前,深度學習生態持續繁榮、AI技術進一步突破,產業應用亟需再上新臺階。對此,王海峰指出,深度學習平臺加上大模型,貫通從硬體適配、模型訓練、推理部署到場景應用的AI全產業鏈,夯實產業智慧化基座,將進一步加速智慧化升級。

大模型產業化夯實數實融合基座

深度學習平臺是基礎共性平臺,下接晶片,上承應用,起到承上啟下的作用,相當於智慧時代的作業系統,有力支撐產業智慧化升級。

大模型是近幾年人工智慧發展的重要方向,具有效果好、泛化性強、研發流程標準化的特點,為人工智慧的進一步發展帶來了新機遇。此外,大模型對深度學習模型的開發、訓練和推理部署提出了更高要求,牽引著深度學習平臺的發展方向。

但與此同時,大模型研發依賴演算法、算力和資料綜合支撐,在應用層面上也面臨一系列技術挑戰:首先是資料規模大,資料品質參差不齊;其次是模型體積大,演算法難度高;第三是算力規模大,性能要求高。

如何實現大模型產業化?王海峰認為,具有演算法、算力和資料綜合優勢的企業,可以將模型生產的複雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務,從而形成一條大模型產業化路徑。

這一產業化路徑已經在文心大模型的產業實踐中得到驗證。基於飛槳平臺,百度打造了文心產業級知識增強大模型,包括以鵬城-百度·文心為代表的通用大模型、跨模態大模型、生物計算大模型,聯合共建的行業大模型,以及適配場景應用的工具套件、大模型API、基於大模型的產品、探索生態共建的創意社區等。

百度打造了文心產業級知識增強大模型。

讓大模型的落地像流水線一樣高效

目前,文心大模型已大規模應用於搜索、資訊流、智慧音箱等互聯網產品,並通過飛槳開源開放平臺、百度智慧雲賦能製造、能源、金融、通信、媒體、城市、教育等各行各業。隨著應用場景的進一步擴大,文心大模型已聯合打造超過10個行業大模型,不斷從行業及企業的特有資料和知識中融合學習,模型能力進一步增強,助力企業降本增效,加快行業轉型升級。

在大模型迅猛發展的當下,支撐大模型開發、訓練和推理部署的飛槳深度學習平臺也在持續進化,優勢更加顯著:動靜統一的開發範式、自我調整分散式架構、異構設備負載均衡等,實現大模型的靈活開發和高效訓練;高併發彈性服務化部署、軟硬協同稀疏量化加速、自我調整蒸餾裁剪等,實現高效部署。

為了讓大模型產業落地更高效便捷,飛槳提供了全流程產業化工具與平臺,包括大模型開發套件、場景模型生產線等,極大降低應用門檻。王海峰指出,通過高效構建與快速反覆運算基於大模型的多樣化場景模型,讓大模型的落地像流水線一樣高效。

正如王海峰所言,飛槳平臺與文心大模型,「堅持技術上突破創新,生態上培育耕耘,夯實智慧化基座,讓每一位開發者、讓致力於科技創新和產業發展的社會各界,都能夠在自主的基礎底座上大展宏圖,努力實現高水準科技自立自強,推動經濟社會高品質發展。」