人工智能安全风险测评白皮书
公众号『AI行业星球』
报告共115页
导读:报告聚焦人工智能安全风险的全生命周期管控,构建系统化测评体系,为技术安全可控与创新发展动态平衡提供指引。人工智能技术高速迭代,生成式模型在多模态融合、逻辑推理等方面实现突破,但安全风险呈现动态性、对抗性、系统性特征。风险覆盖输入、训练、模型、输出、部署全链路,包括越狱攻击、数据投毒、模型窃取、幻觉生成等典型威胁,跨模态攻击、思维链劫持等新型风险持续涌现。白皮书构建 “目标设定 - 内容实施 - 方法技术 - 对象覆盖 - 风险度量 - 持续优化” 闭环测评体系,明确安全性、可靠性、可控性、公平性四大核心目标。测评内容涵盖供应链、数据、模型、伦理、运行态系统五大重点,采用规则基线测试、红队对抗测试等多元化方法,覆盖设施、数据、模型、应用全栈分层对象,将风险划分为红、橙、黄、绿四级。未来测评技术将向自动化、全生命周期融合、跨模态方向发展,需推动国际标准协同与产学研生态共建,应对技术迭代滞后、系统黑箱等挑战,筑牢人工智能安全防线。



展开全文









评论