商湯發佈SenseTrust治理平台 促進生成式AI可信發展
商湯科技在早前舉行的2023世界人工智能大會 (WAIC) 期間推出全面升級的「商湯日日新SenseNova」大模型體系,同時發佈全新商湯可信AI基礎設施「SenseTrust」。「SenseTrust」包含一套完整覆蓋數據、模型、應用治理環節的可信AI治理工具,推動安全可信的人工智能產業生態的發展。
技術落地兩大關鍵條件
活動上,商湯副總裁、AI倫理與治理委員會主席張望表示:「技術規模化落地有兩點關鍵條件,一是成本低、應用廣的普惠性,二是要可靠、可信的安全性。以大算力為基礎的大模型及通用人工智能為加速了條件一的滿足,同時也帶來了技術濫用風險的規模化升級。如何保障人工智能系統的安全可信已經成為業界乃至全社會面臨的一項緊迫課題。為此,商湯針對新時期人工智能的風險特點,打造覆蓋數據處理、模型開發、應用部署等AI系統全生命週期的可信AI基礎設施SenseTrust,以助力打造可信的大模型。」
活動期間,商湯也正式發佈了由商湯智能產業研究院與上海交通大學計算法學與AI倫理研究中心,共同編制的人工智能倫理與治理的年度報告─《商湯大模型倫理原則與實踐白皮書》。白皮書以大模型發展為背景、生成式人工智能治理為主題,透過「商湯日日新SenseNova」大模型體系治理實踐作為案例,提出了生成式人工智能治理的核心原則和「三維對齊」科技倫理模式,呈現在AI治理領域的最新觀點。
打造大模型時代可信AI安全網
大模型時代下,以「基礎模型+微調」為主要特徵的生產模式,大大降低了開發成本和應用門檻。隨著AI應用場景更加開放、數據模態更加多元、應用領域更加廣泛,技術濫用及風險來源同時呈指數級增長,風險評估標準更加難以界定,潛在影響大規模擴散。在應用層面,例如「幻覺」現象、數據「投毒」、混淆攻擊、誘導攻擊等風險陸續顯現,引發全球對人工智能風險挑戰的高度關注。
作為行業領先的人工智能企業,商湯科技一直以來高度重視人工智能倫理與治理工作,技術創新與技術治理發展並重。早在2019年,商湯就同時啓動了兩項前瞻性的工作,一項是大模型研發,另一項就是AI倫理與治理。此前,商湯已建立了完善的人工智能倫理與治理組織結構、管理制度、審查機制、工具體系、倫理文化建設體系和外部生態網絡,並獲得行業廣泛認可。
新時代下技術加速創新,應用日新月異,治理手段亦需相應升級以適應飛速發展、無限拓展的治理需求。商湯整合長期倫理治理思考及技術能力,針對當下生成式人工智能的風險特點,打造可信AI基礎設施「SenseTrust」,包含數據治理、模型治理、應用治理等層面技術工具,並可提供數據處理、模型訓練、模型部署、推理服務等全方位的可信AI檢測與加固「工具箱」。
- 在數據層面,「SenseTrust」 能夠提供從數據脫敏、數據去毒、數據合規審查及偏見評估等治理工具。例如,在模型訓練數據的預處理環節,「SenseTrust」提供的數據去毒工具能夠檢測數據來源中是否包含帶有後門、擾亂的有毒數據,並提供去毒方案。針對顯式、隱式等不同形式的「毒素」檢測率逾95%,結合數據清洗與對抗防禦等方法,能夠有效去毒。目前,「SenseTrust」數據脫敏工具已應用於數據標注、城市管理,以及自動駕駛相關業務場景。
- 在模型層面,「SenseTrust」能夠針對傳統判別式模型和生成式模型的不同特點,提供標準化和定制化的模型評測能力。針對判別式模型,可就能夠面向活體識別、圖像分類、目標檢測等商業化需求提供一鍵式評測;針對生成式模型,商湯「SenseTrust」構建了百萬量級的測試數據集,覆蓋三十多類倫理和安全測評範疇,可對對抗安全、魯棒安全、後門安全、可解釋性和公平性評測。為進一步提升模型的風險防禦能力,商湯「SenseTrust」還能夠提供「AI防火牆」,從源頭過濾對抗樣本,綜合檢出率達到98%。
- 在應用層面,商湯在涉及數據保護、數字取證及偽造檢測等技術領域有著深厚經驗,並逐步開發了結合生成、鑒偽和溯源的綜合解決方案。例如,針對各方頗為關注的AIGC相關確權溯源和鑒偽問題,「SenseTrust」為此開發了數字水印解決方案,可將特定信息嵌入到數字載體中,不影響載體的使用價值,也不易被人察覺,只有通過特定的解碼器和專屬密鑰才能提取,能夠支持多模態數據。數字水印技術已於「商湯秒畫SenseMirage」、「商湯如影SenseAvatar」等多個產品上使用,以及已被內容創作、大數據等領域的客戶採用。
今年WAIC上,「商湯日日新SenseNova」大模型體系再度升級。針對體系內的一系列應用平台,商湯在傳統「判別式模型」治理經驗的基礎上,結合生成式人工智能的風險特點,利用「SenseTrust」工具體系進行了一系列測評,並開展持續的追蹤測試,不斷提升風險防禦能力。
與此同時,商湯也積極將大模型和生成式人工智能的治理實踐成果向外輸出。例如,商湯「SenseTrust」綜合鑒偽解決方案投入到十多家銀行的安全系統中,對各類攻擊攔截的成功率超行業同類產品20%以上,有效防範身份盜取、支付盜刷等網絡詐騙。此外,模型體檢、數字水印,以及主動投毒保護等相關技術,也已通過「商湯AI安全治理開放平台」對外開放。