开云·体育世界杯(中国)官方网站 为什么全球央行接连预警Anthropic最新大模子

21世纪经济报说念记者肖潇
欧洲央行(ECB)通常举办按时会议,但就一个问题临时开会的情况很稀有。当地时间5月26日,欧洲央行迫切召开了一场汇集安全会议,告戒各大银行:最新大模子Mythos正在威逼金融系统,银行需要大幅加速安全破绽的树立。
不单欧洲,自Mythos本年4月发布以来,全球监管层一直在忙着发出警报。先是好意思国财政部长和好意思联储主席迫切召开闭门会议,随后英国、日本、加拿大、德国等监管部门也运行把AI汇集安全列入金融贯通议题。
Mythos被视为AnthropicClaude家具线迄今材干最强的模子,在发现和行使软件破绽上的弘扬显耀飞升。Anthropic告戒其仍是“发现澌灭了几十年的高危破绽,包括通盘主流操作系统和浏览器”,与此同期,“这种破绽可能对经济、全球安全和国度安全酿成严重后果”。
不少东说念主把Mythos描写为汇集安全领域的“奥本海默时刻”。出于安全探究,Anthropic第一次浪漫模子公开,而是启动了名为玻璃之翼(ProjectGlasswing)的款式——仅向微软、苹果、摩根大通等12家好意思国巨头提供走访权,提早检测要道身手的破绽,先把防火墙码高。
但这也让莫得走访权的地区产生了新的狂暴。“欧洲银行无法使用Mythos模子,好意思国银行应该尽快与欧元区共享训戒。”欧洲央行监管委员会高层在媒体采访中催促说念。
发展和安全再次成为牢牢贴合的硬币两面:一面是猛涨的AI风险,另一面是越来越深切的技巧差距,全球金融机构启航点感受到压力。
不外,由于大多数东说念主没法斗殴Mythos的真的情况,咫尺还不成详情汇集安全到底会被如何颠覆。英国东说念主工智能安全计划所(AISI)以为,咫尺不成断言AI立地就会击垮互联网,但不错坚信的是,东说念主们不成再把关系风险视为“几年后的问题”了,当下恰是一个要道着重窗口期。
有哪些告戒?
4月7日,Mythos官宣问世今日,好意思国华盛顿倏得召开了一场闭门会议,参会的有好意思国财政部长贝森特、好意思联储主席鲍威尔,以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。
多家外媒随后败露,这场会议的议题即是评估Mythos对银行系统治来的冲击,以及金融机构需要启动里面大模子测试。
近似的迫切会议,在接下来两个月席卷全球政府高层:
4月12日,英国央行、英国金融阛阓步履监管局和国度汇集安全中心临时召开圆桌会议,核查Mythos可能暴露的要道信息系统破绽,条目各机构以“10倍紧迫性”吸收行径加强汇集着重。
4月17日,加拿大央行两次主抓金融贯通会议,将Mythos等AI驱动的汇集挫折列为要点议题。
4月末,日本财务大臣和日本三大银行会面,通凯旋立相关专组来应付金融风险,并但愿能在两周内取得Mythos的使用权。
新加坡汇集安全局致函本国所关联键信息基础身手机构的高层,条目它们从头评估AI汇集挫折对现存安全体系的影响。
多种作风显现了一个信号:AI汇集挫折正在成为远大的金融风险。银行不仅因为资金都集而容易成为汇集挫折的期望处所,也因为底层的交游系统、计帐系统、客户数据库、身份考证模块,通常建立在弘大的第三方软件生态之上,其中不少中枢架构仍是运行了数十年。
“如若某家大型软件供应商发布了一个补丁,那么挫折者很有可能在短短30分钟内,就通过逆向工程找出这个补丁蓝本要树立的破绽。是以补丁一朝发布,银行必须建立一套进程,确保比现时阛阓快得多的速率树立破绽。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中默示。
在他看来,当务之急是提高破绽的修补速率。尤其关于大都依赖传统IT架构运行的金融机构,是一次安全大考。
为什么是Mythos?
不同于面向平素花费者的聊天大模子,Mythos专长于编程,是Claude家具线的最新升级,也被视为最强Claude模子。
技巧论说炫耀,在软件工程测试SWE-benchVerified上,Mythos得分93.9%,上一代模子Opus4.6是80.8%;在汇集安全材干评估CyberGym测试中,Mythos得分83.1%,也远高于Opus4.6的66.6%。
Anthropic在博客中强调,公司并莫得特意纯熟Mythos的汇集安全用途,但当模子的编程、推理和自主实行材干同步增强后,它当然会取得更强的破绽发现与行使材干。换句话说,安全风险捕捉是模子材干全体提高的副家具。
这种材干对汇集安全到底意味着什么?Anthropic在自我论说中提到,Mythos在以前几周发现了数千个零日破绽——零日破绽指极其危机的残障,开发东说念主员必须在零日内树立。这些破绽粉饰简直通盘主流操作系统和浏览器。
其中一个最受情切的案例来自操作系统OpenBSD。Anthropic称,Mythos发现了一个仍是潜伏27年的破绽。自1998年发布以来,OpenBSD一直被视为业内安全加固进度最高的操作系统之一,亦然全球大都防火墙和要道身手的地基。
更值得担忧的是,Mythos找到破绽后,开云·体育世界杯(中国)官方网站能进一步实行挫折。Anthropic里面测试写说念,Mythos生成破绽行使代码的生效力达到72.4%,前一代Opus4.6的生效力简直为零。
汇集安全是攻防两边的均衡术,成心于挫折者的技巧,也成心于着重者。“咱们信赖,刚劲的技巧材干最终会使着重方比挫折方受益更多。但如若前沿现实室发布这些模子不够严慎,短期内挫折方就可能会占据上风——尤其是过渡期,场合会很庞杂。”Anthropic写说念。
玻璃之翼(ProjectGlasswing)的计谋正建立在这种判断上:Anthropic最终决定,Mythos不径直面向公众绽开,而是优先向一部分大型机构提供走访权。在材干全面扩散前,先让着重方抢跑一步。
但这种作念法激励了新的担忧,如若启航点进的技巧材干只向少数东说念主绽开,技巧差距也会成为一种安全风险。
首批取得Mythos权限的有12家中枢配结伴伴和40多家要道基础身手机构,简直全由好意思国科技与金融巨头组成,包括亚马逊、苹果、谷歌、英伟达、念念科、摩根大通、Linux基金会等。除了好意思国,英国事咫尺唯独阐述取得Mythos预览版的政府,其渠说念来自计划机构英国东说念主工智能安全计划所(AISI)。
欧洲央行和监管机构尤其感到艰苦,因为他们被间隔使用Mythos。欧洲央行监管着欧元区约111家最大的银行,摩根大通等华尔街大型银行的子公司仍是取得了Mythos的测试版块,但欧洲监管方却无法径直斗殴。
“通盘关系机构都应该取得此类技巧,幸免竞争污蔑。”德国央行行长只可在4月的公开演讲中命令。
需要垂危吗?
由于大多数东说念主于今无法径直斗殴Mythos,外界关于它真的材干的判断,以及AI到底会不会颠覆汇集安全,莫得东说念主能够给出明确谜底。
皇冠体育(CrownSports)官网不少东说念主把Mythos描写为汇集安全领域的“奥本海默时刻”,值得垂危的外部案例如实不少。
比如一家汇集安全公司Calif的计划东说念主员,行使Mythos的早期版块,在macOS中发现两个此前未被记载的破绽。这两个破绽可被串联行使形成挫折旅途,进而获取权限,不错绕过苹果启航点进的内存竣工性保护机制;如若再衔尾其他挫折技能,致使可能澈底限制一台Mac开拓。
英国东说念主工智能安全计划所(AISI)同期拿到了Mythos和GPT5.5模子,其最新测试论说炫耀,Mythos之后,ChatGPT5.5仍是成为第二个具备全自动汇集挫折材干的大模子。
论说里有一个要道策画叫“CyberTimeHorizon(汇集挫折时间跨度)”,用来预计AI能贯穿、自主完成多万古期的东说念主类责任,时间跨度越长,意味着AI离真的的全自动黑客越近。2025年11月,团队臆测这个策画每8个月会翻倍一次;到了本年2月,数字仍是裁减到4.7个月;Mythos出现后,进化周期又压缩了。

但另一种怀疑声相似存在:Mythos的风险被夸大了,它很可能是AI行业常见的炒作营销。
开源器具curl的首创东说念主丹尼尔·斯坦伯格就公开抒发过质疑。通过Linux基金会,curl蜿蜒取得了Mythos对curl代码库的分析终端。论说宣称发现五个破绽,但斯坦伯格后续核查发现,只好一个是真的破绽;三个是API文档早已诠释的问题,另一个则仅仅平素Bug。
在斯坦伯格看来,AI的材干如着实提高,但距离鼎新性冲突仍有距离。
近似判断也出咫尺Mozilla的测试中。Mozilla以前永恒使用GPT-4和Sonnet3.5对Firefox进行安全分析,但一直受困于高误报率,很难真方正限制参加使用。比拟之下Mythos的材干提高是深切的,其一次性识别出了271个潜在破绽。
但Mozilla同期强调,这离真的的汇集挫折还有一定距离,因为大多数情况下,单个破绽并不及以攻破复杂的着重架构。更远大的是,Mythos并莫得发现东说念主类看穿不了的安全破绽,仅仅速率和后果大大提高了。
一个细节也能诠释问题。Mozilla团队会让Mythos生成补丁提议行为参考,但最终完成树立责任的仍然是东说念主类工程师,团队还莫得发现能够澈底自动化惩处的措施。
AISI对此的最终判断是:AI正在快速接近自主实行复杂挫折进程的规模,而这种进化速率,深切快于传统安全行业的合乎速率,留给退缩方的缓冲时间不会太长。
这粗略才是激励颤抖的根源,当下恰是一个要道窗口期,谁能更快建立着重体系,谁就能在畴昔拉开差距。
进一步说,谜底不仅仅谁能着重Mythos,更是谁有材干造出下一个Mythos。在第三方模子评估榜单ArtificialAnalysis中,编程模子榜单的前十名被Claude、Cursor、ChatGPT轮替承包开云·体育世界杯(中国)官方网站,国内智谱的GLM-5.1为第十六名,KimiK2.6、DeepSeekV4也在前二十名。一些分析以为,中好意思之间前沿大模子的技巧差距正在减弱。