提升人工智能安全水平 “前瞻安全基準”人工智能安全評估框架正式上線

由 圖片中國 發佈於 圖片

'26-02-28

2026-02-28 15:43

來源:中國網

鏈接已複製

字體:小大

近日,北京前瞻人工智能安全與治理研究院(Beijing-AISI)聯合人工智能安全與超級對齊北京市重點實驗室、中國科學院自動化研究所人工智能倫理與治理研究中心,提出併發布一套全面、多維的人工智能(AI)安全評估基準體系——“前瞻安全基準”(ForesightSafety Bench),對主流人工智能模型和廣泛應用進行全面風險與安全評估。

該基準以AI安全爲“第一性原理”指引,以基礎安全、拓展安全、產業安全三大類別爲支柱,共涵蓋7大基礎安全風險類別、5大拓展安全支柱以及8大產業安全關鍵領域,形成了總計94項精細化的風險維度,並已累積形成規模數萬條的結構化風險數據與測評結果,全面評估和應對包括智能體安全、具身智能安全、社會智能安全、失控與生存風險等新近安全風險在內的安全隱患,構建了層次化、系統化、覆蓋廣泛的人工智能安全評估與分析框架。

“前瞻安全基準”人工智能安全評估框架

前瞻人工智能安全基準發佈後引起廣泛關注。Anthropic聯合創始人、OpenAI前政策負責人Jack Clark於2026年2月23日在Important AI(https://jack-clark.net/)上圍繞“China’s big AI benchmark”對前瞻安全基準ForesightSafety Bench進行詳細分享與點評,他指出“ForesightSafety Bench展現了東西方在AI安全議題上令人驚訝的共識”。Jack Clark還強調了此項研究的重要意義,“AI政策存在一些共通工具:可測量性是大多數AI治理形式的基本前提。儘管地緣政治層面存在分歧,但各國的AI科學家都在面對共同的課題——如何從社會相關層面評估其系統的屬性。而更令人鼓舞的是,中國的研究者也在爲那些美國前沿實驗室同樣擔憂的生存性風險問題而思考與努力。”

該框架將持續迭代,爲人工智能的安全發展提供系統性指引,助力人工智能技術與系統安全發展,行穩致遠。

“前瞻安全基準”排行榜及模型系統安全卡可在以下鏈接獲取:

網站鏈接:

https://foresightsafety-bench.beijing-aisi.ac.cn/

GitHub鏈接:

https://github.com/Beijing-AISI/ForesightSafety-Bench

論文鏈接:

https://arxiv.org/pdf/2602.14135

Scroll to Top