
作 者 | 张云迪(九卦金融圈专栏作家)
来 源 | 九卦金融圈
?
华尔街弥留闭门会背后:一个尚未公开拓布的 AI 模子,为何让好意思国财长和好意思联储坐不住了?
2026年4月10日,彭博社的一则独家报说念让扫数这个词金融圈绷紧了神经。
据知情东说念主士自大,好意思国财长贝森特与好意思联储主席鲍威尔周二在华盛顿财政部总部,弥留召集了花旗、摩根士丹利、好意思国银行、富国银行和高盛等扫数系统枢纽性银行的 CEO。据悉,由于这次未公开流露的会议系短时候内仓促安排,摩根大通掌门杰米·戴蒙未能腾出时候参会。
监管层径直对话最高解决层,而非时期或合规层面——中枢议题唯惟一个:Anthropic 的最新 AI 模子,Mythos。
张开剩余87%Anthropic在测试中发现,预览版的“听说”大模子仍是具备顶级收罗安全大众的水准,仍是在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危过错”。
报说念指出,扫数被召集参会的银行皆被主要监管机构列为“系统枢纽性银行”,这意味着它们的认识性对大众金融体系至关枢纽。针对这一音尘,好意思国财政部发言东说念主未立即复兴置评央求,好意思联储发言东说念主则远离发表指摘。
01
Mythos 到底有多强?
Mythos 是一个通用 AI 模子,里面代号“Capybara”,定位在 Anthropic 最强的 Opus 系列之上。
表面上,扫数软件皆可能存在过错,但Mythos在发现和欺诈过错方面的能力远超东说念主类。据Anthropic的博文先容,Mythos已在操作系统、收罗浏览器等软件中发现了数千个要紧过错,包括OpenBSD中一个存在27年的残障,以及FFmpeg中一个历经500万次自动测试仍未被发现的16年留恋过错。
从各项基准测试来看,Mythos 的进展大幅率先 Anthropic 面前公开的最强模子 Claude Opus 4.6。在泰斗编程测试 SWE-bench Verified 中,Opus 4.6的准确率为80.8%,而 Mythos 达到93.9%;在难度更高的 SWE-bench Pro 上,两者辞别为53.4%和77.8%,差距接近25个百分点。推理能力方面,Mythos 在 GPQA Diamond 上取得94.6%,在带用具版块的 Humanity's Last Exam 中达到64.7%,均显赫高于 Opus 4.6。电脑操控测试 BrowseComp 中,Mythos 以86.9%略高于 Opus 4.6的83.7%,但更枢纽的是 Mythos 破钞的 token 仅为后者的五分之一,作念到了成果与性能的双重晋升。
最猛烈的是,它莫得过程挑升的收罗安全考验,但凭借极致的代码和推理能力,竟在测试中孤独发现了数千个零日过错,消亡扫数主流操作系统和浏览器。
说几个让安全工程师后背发凉的案例:
在公认最难攻破的 OpenBSD 操作系统中,Mythos 发现了一个躲闪了27年的而已崩溃过错——抨击者只需收罗衔接,就能让指标机器瘫痪。在 FFmpeg 多媒体框架里,它找到了一个存在16年的过错,这个过错汗漫到传统自动化用具扫描了500万次皆没能触发。而在 Linux 内核中,它更是串联了多个不起眼的低微过错,构建出一条从等闲用户权限到透顶斥逐机器的齐全抨击链。
如若只是是发现过错,偶然还不至于让华尔街如斯焦灼。竟然可怕的是它的过错欺诈能力——在复现测试中,Mythos 一次性写出可用抨击代码的奏凯率高达83.1%,而前代模子唯独66.6%。在 Firefox 的专项测试中,这一数字更是飙升至72.4%。这意味着,只消有东说念主给它辅导,它不祥率能径直攻陷一台就业器。
测试中还发生了一件让规划员后背发凉的事。规划东说念主员让 Mythos 尝试逃离“沙盒”环境,并发送奏凯奉告。收尾它冲突了顽固,得回了互联网造访权限,主动给正在公园吃三明治的规划员发了一封邮件,还把抨击细节发布到了多个时期网站上。它不仅会推行辅导,还会“自主行径”来解说我方奏凯了。
02
为什么惊动华尔街?
银行系统高度依赖数字基础方法运行。一朝中枢系统被渗入,来回中断、客户数据涌现乃至系统性四百四病,皆不是科幻片里的情节。
但监管层看到的远不啻于此。CrowdStrike 首席时期官指出一个狠毒的实际:过错被发现到被欺诈的时候窗口,仍是从几个月压缩到了几分钟。昔日银行靠打补丁的时候差来精致,但当 AI 找过错的速率比东说念主类修补快几个数目级时,扫数这个词精致逻辑就必须重写了。一朝 Mythos 的能力落入坏心步履者手中,任何一家银行皆可能成为抨击指标,而精致者根柢莫得充足的时候反应。
市集的反应也很敦厚。音尘曝出后,收罗安全龙头 CrowdStrike 和 Palo Alto Networks 辞别单日拉升6.2%和4.9%。业内仍是启动商议:当抨击能力已毕代际跃升时,精致参加也需成倍增长,银行 IT 安全预算会不会从5%径直翻到10%以上?
更值得警惕的是,这不是一家公司的问题。知情东说念主士自大,OpenAI 也在准备具备相同能力的模子。一个“AI 枢纽时期”正在到来,而金融系统首当其冲。
03
精致者正在作念什么?
Mythos 咫尺不向公众敞开。Anthropic 发起了一个名为“Project Glasswing”的精致性神气,将预览版仅敞开给过程审核的机构,用于扫描自家居品中的过错。参与方包括亚马逊、苹果、微软、谷歌、英伟达、想科、Linux 基金会,以及摩根大通。Anthropic 为该神气提供了1亿好意思元的模子调用额度。
Anthropic 说,咫尺不会公开拓布 Mythos 这个 AI 模子,而是会字据反馈,制定安全法例。他们牵挂,强大的 AI 可能被坏东说念主用来找软件过错、抨击收罗系统。事实上,仍是有黑客用 AI 用具发动了抨击,比如入侵了墨西哥政府的系统。
他们的敌手 OpenAI 也在晋升 AI 的收罗安万能力,并推出试点神气,让精致方优先使用。
Anthropic 的收罗安全崇敬东说念主牛顿・程说,这不单是他们一家的问题,扫数这个词行业皆要和政府互助移交。他们但愿让精致方提前作念好准备。
Anthropic 已和好意思国政府机构如 CISA、NIST 互助,但没自大具体交流细节。他们对野心的参与者也有严格造访斥逐,但出于安全原因,不自大更多细节。
对此,想科首席安全官的话很直白:“AI 能力仍是超越了一个临界点,莫得回头路可走。用这些模子不错在昔日难以设想的速率和领域上发现并耕种过错。旧的系统加固方式仍是不够了。”
摩根大通也已加入该神气,其首席信息安全官暗示将以“严格、孤独的方式”评估这一用具在金融枢纽基础方法精致中的应用价值。
关于银行 IT 从业者而言,这个事件开释了三个明确的信号。第一,认识需要更新——AI 驱动的收罗抨击不再是科幻观点,仍是从考证酿成了实际威迫。昔日十年景立的安举座系,在 AI 驱动的新抨击面前可能不再灵验。第二,精致需要升级——从“被迫打补丁”转向“主动找过错”,欺诈 AI 作念主动安全扫描仍是成为行业共鸣。第三,监管行将落地——这次财长和好意思联储主席躬行召集中议,诠释 AI 收罗安全风险已进入最高监管议程,针对银行 AI 安全精致能力的新条目可能很快出台。
Mythos 的出现是一个分水岭。AI 在收罗安全领域正从“援手用具”酿成了“攻防中枢”。关于金融行业而言泰安股票配资综合门户网站_配资资讯学习与行情说明,与其蹙悚,不如行径——当今是时候重新凝视我方的安全精致体系了。
发布于:四川省泰安股票配资综合门户网站_配资资讯学习与行情说明提示:本文来自互联网,不代表本网站观点。