AI打败AI!谷歌科学家用GPT-4 击败AI防篡改系统
(资料图)
编程客栈()8月1日 消息:Google 科学家进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。
具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能被操纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据了解,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。
虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
论文地址:https://arxiv.orandroidg/abs/2307.js15008
关键词:
相关阅读
-
AI打败AI!谷歌科学家用GPT-4 击败AI防篡改系统
编程客栈()8月1日消息:Google科学家进行一项实验研究,他们使用OpenA -
探寻不同城市美食故事,《中国有滋味》...
由湖南卫视和芒果TV共同制作的沉浸式美食轻推理真人秀《中国有滋味》近 -
凌雄科技发布2022年度ESG报告
7月31日,与京东深度融合的凌雄科技发布首份年度ESG(环境、社会及管治 -
未来的汽车什么样?零跑抢先迈出一步
“四叶草”中央集成式电子电气架构的一旦落地,意味着零跑在造车领... -
新车探秘丨哪吒AYA 将于8月3日上市,海...
哪吒AYA将于8月3日正式上市,作为哪吒V的换代车型,它进行了小幅升级, -
顾家家居(603816.SH):累计耗资7499.96...
格隆汇8月1日丨顾家家居(603816 SH)公布,2023年7月,公司通过集中竞价 -
残疾夫妻烈日下四处乞讨 东营救助送其回家
记者任小杰通讯员耿汝洋7月24日上午,东营市社会救助服务中心接到热线 -
产业观察:这朵“云”为自动驾驶量产提...
近年来,随着人工智能的快速发展,在一系列利好政策加持下,我国自动驾 -
两部门:紧急预拨1.1亿元 支持京津冀地...
人民网北京8月1日电(记者任妍)8月1日,记者从财政部获悉,针对近期京 -
新野县上港乡:黄金梨丰收,果农乐陶陶
8月1日上午,笔者游走在新野县上港乡的先锋渠上,嗅到的是水果的甜香, -
京津冀近百家图书库房被淹,从业人员:...
潮新闻客户端记者宋浩方涛北京天问求索文化发展有限公司工作人员:... -
YouTube再次测试拦截广告拦截器
早在5月份,YouTube就尝试过使用广告拦截器来阻止人们,现在该公司又开 -
小鹏汽车7月交付11008台,G6首月交付超3900台
今日,小鹏汽车公布最新交付成绩。2023年7月小鹏汽车共交付新车11008台 -
金花街开展禁毒宣传进社区活动
为进一步增强全民禁毒意识,加强社区居民对毒品的预防能力,近日,荔湾 -
重庆去凤凰古城怎么坐车_去凤凰古城怎么...
1、1、 你可以坐火车到吉首,再转汽车到凤凰;2、或者坐火车到怀化,再转 -
行业首次:吉利将发布全栈自研的全场景A...
吉利集团CEO淦家阅在公司内部经营工作大会上提到,吉利汽车将在今年下 -
FF宣布第二阶段共创交付正式启动 交付...
8月1日,FaradayFuture(FF)今天宣布公司第二阶段共创交付正式启动, -
降价两万!零跑下调两款热门车型价格
其中C11650智享版降价后价格为18 98万元,C11580四驱性能版降价后价格 -
刀郎《罗刹海市》80亿播放量破吉尼斯世...
8月1日,有媒体报道称,刀郎的《罗刹海市》全球网络播放量到达80亿次, -
站在国道看风景,还要收费?!
站在国道上看风景还要收费?最近,在西藏日喀则市江孜县的卡若拉冰川景