2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

(相关资料图)

封面新闻记者孟梅欧阳宏宇

7月7日，2023世界人工智能大会（WAIC）“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行，蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、科技伦理三大类的数百种风险，覆盖表格、文本、图像等多种数据和任务类型，是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解，该产品还入选了本届大会的“镇馆之宝”。

AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为，“不能再将人工智能视为简单的技术工作，而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”

在该论坛上，蚂蚁集团同时宣布，“蚁鉴2.0”全面开放，面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具，可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

据了解，“蚁鉴2.0”的两项硬核能力，一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类，可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测，并会生成检测报告，帮助大模型更加有针对性地持续优化。

蚂蚁集团大安全事业群技术部总裁李俊奎表示，“生成式大模型是一种‘深黑盒’技术，‘蚁鉴2.0’通过智能博弈对抗技术，模拟黑产以及自动化生成海量测试集，可实现「生成式机器人」对「AIGC生成式模型」的诱导式检测计算，很像一个24小时不眠不休的‘安全黑客’在找茬大模型，从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测，也是教学相长。好比生成式考官考核生成式运动员，在对抗中双方能力互相提升，进一步提高整个行业的AI安全水位。”

另一项硬核能力是，“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识，通过可视化、逻辑推理、因果推断等技术，从完整性、准确性、稳定性等7个维度及20余项评估指标，对AI系统的解释质量量化分析，帮助用户更清晰验证与优化可解释方案。

据了解，“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利，支持零编码测评。开发者通过API接口，将AI模型接入蚁鉴，就可以一键识别和挖掘模型漏洞。

蚂蚁集团认为，人工智能的深度应用，不仅对数据、算法、算力提出了更高要求，也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下，才能让AI技术真正地释放应用价值。

此次论坛上，中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。该倡议得到数十家单位参与，围绕人工智能可能引发的经济、安全、隐私和数据治理等问题，提出构建AIGC可信发展的全球治理合作框架，采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力，最大限度确保生成式AI安全、透明、可释。

推荐内容

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

腾讯会议宣布限制免费会议数

火星古气候历史如何变化？中国“祝融号”火星车发现重要证据

知乎宣布将下线“匿名功能”

药补不如食补？宜源致养：3种天然“补药”，常吃或离健康更进一步

关键角色！高端数据中心背后的“电力卫士”

全球观热点：大拿带你逛康明斯 | Infant Care服务，这服务，走心了！

“匠心万里相伴，服务关爱相随”，2023中联重科工程起重机全球服务万里行正式开启！世界简讯

生肖牛9月运势：吉星照耀，大喜临门，但有些还是要多加注意！

7月好运上上签，正财偏财进账，发财如如猛虎的生肖，多有意外之喜

最喜欢被粘着的5大星座男

对爱情没信心，总爱胡思乱想的三大生肖

立秋之后，喜事不断，事业财源滚滚，添财添丁又添福的3大生肖！

打开任务管理器的快捷键是什么?Win7怎样结束指定的程序进程?-世界焦点

广州沥滘旧村首批复建房摇珠分房

深圳连发“四个办法” 加快完善住房保障体系世界视讯

中国中免：上半年实现归属股东净利润38.64亿元

杭州6岁女孩演唱五月天《知足》登上热搜，女孩妈妈：孩子刚幼儿园毕业，她觉得被认可了！

Twitter限流，出海游戏厂商加速解绑

港股停牌房企迎转机，20余家等上岸

后悔在院里挖鱼池了，真不如设计一面水景墙，潺潺流水，意境满满

事关“家运”，别不当回事！打扫干净这5个地方，日子越过越顺

广东印发优化营商环境三年行动方案

还在宜家怒买？帝都时髦家居店不完全指南 | 家居

阳台改书房，砌假墙打造2米收纳区还不够，嵌入抽屉柜，功能完善

龙虎榜｜方新侠砸盘润达医疗，金开大道、作手新一打板福达合金双双被埋

从校园到社区，他们带来了书香咖啡香

食品安全、市容环境、夜生活……上海回应设摊管理情况

梅一枝（福建）生物科技有限公司回应铁观音农药超标

英国今年夏季要警惕大白鲨“组团”来袭

推荐内容

2023 WAIC聚焦大模型时代AI安全：“产学研用”界共同发起AIGC可信倡议

腾讯会议宣布限制免费会议数

火星古气候历史如何变化？中国“祝融号”火星车发现重要证据

知乎宣布将下线“匿名功能”

药补不如食补？宜源致养：3种天然“补药”，常吃或离健康更进一步

关键角色！高端数据中心背后的“电力卫士”

全球观热点：大拿带你逛康明斯 | Infant Care服务，这服务，走心了！

“匠心万里相伴，服务关爱相随”，2023中联重科工程起重机全球服务万里行正式开启！ 世界简讯

生肖牛9月运势：吉星照耀，大喜临门，但有些还是要多加注意！

7月好运上上签，正财偏财进账，发财如如猛虎的生肖，多有意外之喜

最喜欢被粘着的5大星座男

对爱情没信心，总爱胡思乱想的三大生肖

立秋之后，喜事不断，事业财源滚滚，添财添丁又添福的3大生肖！

打开任务管理器的快捷键是什么?Win7怎样结束指定的程序进程?-世界焦点

广州沥滘旧村首批复建房摇珠分房

深圳连发“四个办法” 加快完善住房保障体系 世界视讯

中国中免：上半年实现归属股东净利润38.64亿元

杭州6岁女孩演唱五月天《知足》登上热搜，女孩妈妈：孩子刚幼儿园毕业，她觉得被认可了！

Twitter限流，出海游戏厂商加速解绑

港股停牌房企迎转机，20余家等上岸

后悔在院里挖鱼池了，真不如设计一面水景墙，潺潺流水，意境满满

事关“家运”，别不当回事！打扫干净这5个地方，日子越过越顺

广东印发优化营商环境三年行动方案

还在宜家怒买？帝都时髦家居店不完全指南 | 家居

阳台改书房，砌假墙打造2米收纳区还不够，嵌入抽屉柜，功能完善

龙虎榜｜方新侠砸盘润达医疗，金开大道、作手新一打板福达合金双双被埋

从校园到社区，他们带来了书香咖啡香

食品安全、市容环境、夜生活……上海回应设摊管理情况

梅一枝（福建）生物科技有限公司回应铁观音农药超标

英国今年夏季要警惕大白鲨“组团”来袭

“匠心万里相伴，服务关爱相随”，2023中联重科工程起重机全球服务万里行正式开启！世界简讯

深圳连发“四个办法” 加快完善住房保障体系世界视讯