每日更新

先进人工智能安全评估系统和基础平台成为北京人工智能前沿成果_新京报

北京贝壳财经讯(记者罗一丹)2026年北京人工智能创新高地建设推进会于1月5日召开,八项人工智能前沿成果在北京亮相。其中,北京千山人工智能安全治理研究院公布的“面向未来的人工智能安全评估体系及基础平台”。作为北京在人工智能安全与治理方面的代表性创新成果,“前瞻人工智能基础平台及安全评估体系”探索了以安全为基础引导人工智能不断发展的途径。该体系打破了传统安全评估的一维局限性,形成了多层次领域的综合框架评估。从覆盖范围来看,以基础安全为基础,延伸到五个方面:体现智能安全、科学智能安全、社会安全、环境安全。安全风险、巨灾风险、生存风险等,涉及科学教育科研、医疗卫生、金融经济、信息传媒、产业基础设施、政府工作、人民生活等多个重点领域。在评估方法上,将进行系统的设计和评估,特别关注隐私和数据保护、滥用、身心伤害、错误信息的预防、自主人工智能的高级风险等核心点。前瞻研究院通过测试发现了重大问题。也就是说,近年来大型模型的安全性并没有明显改善,一些较新的模型的攻击成功率甚至更高。但同时,前瞻研究院也验证了一个重要结论:保卫AI模型并不一定需要模型再训练。通过在在线推理阶段引入护栏,可以显着提高安全级别你的模型的el。针对前瞻安全标杆的各类风险,前瞻研究院打造了“前瞻领域”AI安全攻防平台。为企业提供标准化的评估流程和全面、系统的安全分析,帮助企业识别模型的安全级别,并提供有针对性的防御方案和加固建议。此外,前瞻研究院还打造了人工智能伦理评价平台“前瞻令度”,专注于人工智能伦理评价的智能评价与价值调整。该平台对数百个大型模型进行实时动态监控和并行测试,可以跨六个维度和90个子类别评估道德合规性。它融合了中国价值观和中国核心价值观的大语料库,涵盖3个层次、12个核心价值观、50个衍生价值观、总计超过25万条规则。它包括200多个道德规范l 全球范围内的原则和规范,以及中英两国40余条国际法律法规和协议,提供精准的合规指导。我们可以在人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学品、核材料和自动驾驶等领域提供自动化伦理评估支持。前瞻研究院认为,人工智能的安全应成为“第一原则”,也是不可消除、不可违反的最终要求。建设安全治理能力基础是北京引领人工智能持续发展的基础。这将使我们更加自信、安全地将人工智能应用到现代建设中,与世界分享人工智能发展的机遇和成果。编辑:杨娟娟,审稿:陈迪彦

发表评论

邮箱地址不会被公开。 必填项已用*标注