当前位置: 首页 > 情怀
为了避免人工智能可能带来的灾难,我们要向核安全学习
来源:DeepTech深科技     时间:2023-06-09 20:15:40
在过去的几周里,围绕人工智能的讨论一直被一群声音很大的专家所主导。他们认为,我们很有可能开发出一种人工智能系统,有朝一日它会变得极其强大,以至于可以消灭人类。

最近,一群科技公司领导者和人工智能专家发布了另一封公开信,他们宣称,降低人工智能导致人类灭绝的风险,应该与预防流行病和核战争一样,成为全球的优先事项。第一份呼吁暂停人工智能开发的请愿书已经有 3 万多人签名,其中包括许多人工智能领域的杰出人士。

那么,科技企业该做什么才能让人类避免被人工智能毁灭呢 ? 最新的一个建议来自牛津大学、剑桥大学、多伦多大学、蒙特利尔大学、谷歌 DeepMind、OpenAI、Anthropic、几家人工智能研究非营利组织和图灵奖得主约书亚 · 本希奥(Yoshua Bengio)的研究人员的一篇新论文。


(相关资料图)

他们建议,人工智能开发人员应该在开发的早期阶段,甚至在开始任何训练之前,评估模型造成 " 极端风险 " 的潜力。这些风险包括人工智能模型操纵和欺骗人类、获取武器或发现可利用的网络安全漏洞的可能性。

这个评估过程可以帮助开发人员决定是否继续使用这个模型。如果风险被认为太高,该组织建议暂停开发,直到风险得到缓解。

该论文的主要作者、DeepMind 的研究科学家托比舍夫兰(Toby Shevlane)表示:" 正在推进前沿领域的领先人工智能公司有责任关注新出现的问题,并尽早发现它们,以便我们能够尽快解决这些问题。"

舍夫兰说,人工智能开发人员应该进行技术测试,以探索模型的危险能力,并确定它是否有使用这些能力的倾向。

测试人工智能语言模型是否可以操纵人的一种方法是通过一个名为 " 让我说(make me say)" 的游戏。在游戏中,模型会尝试让人类输入一个特定的单词,比如 " 长颈鹿 ",而人类事先并不知道这个单词。然后,研究人员测量该模型成功的频率。

人们可以为不同的、更危险的能力创建类似的任务。舍夫兰说,希望开发人员能够建立一个详细的、描述模型运行情况的总览,这将使研究人员能够评估模型在错误的人手中会做出什么。

下一阶段是让外部审计人员和研究人员评估人工智能模型部署前后的风险。虽然科技公司开始认识到外部审计和研究是必要的,但对于外部人员完成这项工作到底需要多大程度的访问权限,存在不同的观点。

舍夫兰并没有建议人工智能公司让外部研究人员完全访问数据和算法,但他表示,人工智能模型需要尽可能多的审查。

网络安全研究和咨询公司 Trail of Bits 负责机器学习保障的工程总监海蒂赫拉夫(Heidi Khlaaf)表示,即使是这些方法也 " 不成熟 ",远远不够严谨且无法解决问题。在此之前,她的工作是评估和核实核电站的安全性。

赫拉夫说,人工智能部门从 80 多年来关于核武器的安全研究和风险缓解中学习经验会更有帮助。她说,这些严格的检测制度不是由利润驱动的,而是由一种非常现实的生存威胁驱动的。

她说,在人工智能领域,有很多将其与核战争、核电站和核安全相提并论的文章,但这些论文中没有一篇提到核法规或如何为核系统构建软件。

(来源:STEPHANIE ARNETT/MITTR | ENVATO)

人工智能社区可以从核风险中学到的最重要一件事是可追溯性:将每一个动作和组成部分放在放大镜下进行细致的分析和记录。

例如,核电厂有数千页的文件来证明该系统不会对任何人造成伤害,赫拉夫说。在人工智能开发中,开发人员才刚刚开始将详细描述模型表现的段落拼凑在一起。

" 你需要有一种系统的方式来应对风险。你不能抱着一种心态:‘哦,这可能会发生,让我把它写下来。’ " 她说。

舍夫兰说,这些是可以共存的。" 我们的目标是,该领域将有许多涵盖广泛风险的、优秀的模型评估方法……模型评估是良好治理的核心(但远不是唯一)工具。"

目前,人工智能公司甚至没有全面了解训练其算法的数据集,他们也没有完全理解人工智能语言模型是如何产生结果的。舍夫兰认为,这种情况应该改变。

" 帮助我们更好地理解特定模型的研究,可能会帮助我们更好地应对一系列不同的风险," 他说。

专注于极端风险,而忽视这些基本面和看似较小的问题,可能会产生复合效应,从而导致更大的危害。赫拉夫说:" 我们是在连爬都不会的情况下试图学会跑步。"

支持:Ren

运营 / 排版:何晨龙

标签:

上一篇:祖考|当前信息

下一篇:最后一页

最新推荐

广告

X 关闭

广告

X 关闭

户外

英媒:调查显示,欧洲年轻一代危险网络行为成常态

英媒:调查显示,欧洲年轻一代危险网络行为成常态

(相关资料图)【环球时报综合报道】据英国《卫报》5日报道,近日,一项针对英国、法国、西班牙等9个欧洲...

“网红AI”写作技巧惊人?英媒:大学生用其完成考试答题能拿满分

“网红AI”写作技巧惊人?英媒:大学生用其完成考试答题能拿满分

(资料图)【环球时报综合报道】人工智能研究机构OpenAI日前发布的全新聊天机器人模型ChatGPT,不仅会自动...

【环球报资讯】威尔士两高官公款看世界杯,被批“浪费纳税人的钱财”

【环球报资讯】威尔士两高官公款看世界杯,被批“浪费纳税人的钱财”

(相关资料图)【环球时报综合报道】因被指在卡塔尔公款旅游,英国威尔士首席部长马克·德雷克福德和经济...

新华全媒+丨年内第二次降准落地 释放长期资金约5000亿元

新华全媒+丨年内第二次降准落地 释放长期资金约5000亿元

【资料图】新华社北京12月5日电(记者吴雨)年内第二次降准12月5日正式落地,释放长期资金约5000亿元。...

我国将依托“832平台”深入推进政府采购脱贫地区农副产品

我国将依托“832平台”深入推进政府采购脱贫地区农副产品

【资料图】新华社北京12月5日电(记者申铖)记者5日从财政部了解到,财政部、农业农村部、国家乡村振兴...

全国快递日均业务量复苏提速 重回3亿件以上

全国快递日均业务量复苏提速 重回3亿件以上

(相关资料图)新华社北京12月5日电(记者戴小河)国家邮政局监测数据显示,11月27日以来,全国快递日均业...

环球热点评!报告显示中国已成世界上空气质量改善最快的国家

环球热点评!报告显示中国已成世界上空气质量改善最快的国家

(相关资料图)中国网 中国发展门户网讯 11月29日,亚洲清洁空气中心在2022中国蓝天观察论坛上发布了最...

【天天新视野】北京:完善义务教育交流轮岗激励机制

【天天新视野】北京:完善义务教育交流轮岗激励机制

(资料图)新华社北京12月3日电(记者罗鑫、赵琬微)北京市教委等十部门日前发布的《北京市新时代基础教育...

天天动态:​空间站第三批空间科学实验样品顺利返回并交付实验科学家

天天动态:​空间站第三批空间科学实验样品顺利返回并交付实验科学家

(资料图)中国网 中国发展门户网讯北京时间2022年12月4日20时09分,神舟十四号载人飞船返回舱在东风着陆...

世界速看:我国在国际上首次完成了水稻从种子到种子全生命周期空间培养实验

世界速看:我国在国际上首次完成了水稻从种子到种子全生命周期空间培养实验

中国网 中国发展门户网讯北京时间2022年12月4日20时09分,神舟十四号载人飞船返回舱在东风着陆场成功着...

露营