先进人工智能安全评估系统和基础平台成为北京人工智能前沿成果_新京报

北京贝壳财经讯（记者罗一丹）2026年北京人工智能创新高地建设推进会于1月5日召开，八项人工智能前沿成果在北京亮相。其中，北京千山人工智能安全治理研究院公布的“面向未来的人工智能安全评估体系及基础平台”。作为北京在人工智能安全与治理方面的代表性创新成果，“前瞻人工智能基础平台及安全评估体系”探索了以安全为基础引导人工智能不断发展的途径。该体系打破了传统安全评估的一维局限性，形成了多层次领域的综合框架评估。从覆盖范围来看，以基础安全为基础，延伸到五个方面：体现智能安全、科学智能安全、社会安全、环境安全。安全风险、巨灾风险、生存风险等，涉及科学教育科研、医疗卫生、金融经济、信息传媒、产业基础设施、政府工作、人民生活等多个重点领域。在评估方法上，将进行系统的设计和评估，特别关注隐私和数据保护、滥用、身心伤害、错误信息的预防、自主人工智能的高级风险等核心点。前瞻研究院通过测试发现了重大问题。也就是说，近年来大型模型的安全性并没有明显改善，一些较新的模型的攻击成功率甚至更高。但同时，前瞻研究院也验证了一个重要结论：保卫AI模型并不一定需要模型再训练。通过在在线推理阶段引入护栏，可以显着提高安全级别你的模型的el。针对前瞻安全标杆的各类风险，前瞻研究院打造了“前瞻领域”AI安全攻防平台。为企业提供标准化的评估流程和全面、系统的安全分析，帮助企业识别模型的安全级别，并提供有针对性的防御方案和加固建议。此外，前瞻研究院还打造了人工智能伦理评价平台“前瞻令度”，专注于人工智能伦理评价的智能评价与价值调整。该平台对数百个大型模型进行实时动态监控和并行测试，可以跨六个维度和90个子类别评估道德合规性。它融合了中国价值观和中国核心价值观的大语料库，涵盖3个层次、12个核心价值观、50个衍生价值观、总计超过25万条规则。它包括200多个道德规范l 全球范围内的原则和规范，以及中英两国40余条国际法律法规和协议，提供精准的合规指导。我们可以在人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学品、核材料和自动驾驶等领域提供自动化伦理评估支持。前瞻研究院认为，人工智能的安全应成为“第一原则”，也是不可消除、不可违反的最终要求。建设安全治理能力基础是北京引领人工智能持续发展的基础。这将使我们更加自信、安全地将人工智能应用到现代建设中，与世界分享人工智能发展的机遇和成果。编辑：杨娟娟，审稿：陈迪彦

你可能也会喜欢...

发表评论 取消回复

发表评论取消回复