中国信息安全测评中心:人工智能安全风险测评白皮书(2025年)
今天分享的是:中国信息安全测评中心:人工智能安全风险测评白皮书(2025年)
报告共计:115页
《人工智能安全风险测评(2025年)》白皮书核心总结
《人工智能安全风险测评(2025年)》白皮书由中国信息安全测评中心牵头编制,聚焦以大语言模型为核心的人工智能系统,构建了全生命周期、多维度的安全风险测评体系,为行业安全治理提供了系统性指引。
当前,生成式人工智能技术高速迭代,在模型架构、多模态能力与推理逻辑上实现突破,产业应用从消费端向生产端纵深渗透,赋能科研、制造、金融等多个领域。但技术发展同时带来多维复杂的安全风险,呈现动态性、对抗性与系统性特征,攻击面从单一模态向多模态扩展,风险传导效应显著。全球各国高度重视人工智能安全治理,形成了差异化的治理模式,均将安全测评作为保障技术安全可控的关键手段。
白皮书构建了“为何测、测什么、怎么测、测哪些”的核心框架,明确测评需覆盖系统规划设计、数据采集处理、模型训练优化、部署集成、运行监测及迭代退役全生命周期,聚焦供应链、数据、模型、伦理对齐、运行态系统五大安全重点。测评体系以“安全性、可靠性、可控性、公平性”为核心目标,细化为技术安全、内容安全、伦理安全、供应链安全等多维度测评内容,采用基于规则的基线测试、红队测试、量化评估等多元化技术路径,实现对设施层、数据层、模型层、应用层的全栈覆盖。
在测评技术方面,白皮书重点阐述了红队测试技术体系,涵盖输入层的越狱测试、提示词注入测试,训练层的数据投毒与后门攻击测试,模型层的窃取与篡改测试,输出层的输出操纵与幻觉检测,以及部署层的供应链测试与API滥用测试等关键技术,为实操提供了详细指引。
展望未来,人工智能安全测评将朝着自动化、全生命周期融合、跨模态化方向发展。国际测评标准将逐步走向协同共建,形成核心指标统一、区域差异兼容的框架。同时,行业需应对技术迭代滞后、系统黑箱特性、风险传导复杂等挑战,通过构建动态更新的测评知识库、发展可解释性测评技术、建立全栈全链路测评框架,推动人工智能在安全可控的前提下实现高质量发展。
以下为报告节选内容

展开全文





















评论