世界杯全球运动用品供应平台 公开版Mythos上线, Claude最强模子运转分层发售

Anthropic终于把Mythos推向了公开市集,但分层发售。
凌晨,Anthropic郑重发布Claude Fable 5和Claude Mythos 5。前者面向泛泛用户绽开,后者则不竭为止在“受信任的安全合营伙伴”范围内。

新模子的定名不错说很合适Claude一贯的作风。
从Haiku(俳句)到Sonnet(十四行诗)再到Opus(艺术巨著),Anthropic一直在用体裁和艺术认识给模子分层,到了Mythos,名字照旧从体裁作品推广到“外传”自己。
Fable来自拉丁语fabula,真义是“被阐扬之物”,和希腊语mythos同源,直译过来的话一般被称为“寓言”。这个名字正如新模子的定位,一个“Mythos级”的模子,一个“公开的外传”。
按照Anthropic的形色,Fable 5和Mythos 5分享肃清个底层模子,仅仅被装进了更得当公开分发的安全壳里。在官方给出的模子才智上,它们两个被放在肃清个位置。

但跑分归跑分,要是Fable和Mythos的弘扬实足一样,我思应该也无须分红两个名字了。
01
被改写的“外传”
外传被改写、被压缩、被加上西宾之后,造成了寓言。
按照官方文档,Fable 5是公开版块。它面向泛泛用户和开发者绽开,但在收集安全、生物、化学以及模子蒸馏等高风险领域,会由罕见的安全分类器介入。一朝系统判断申请可能波及这些明锐标的,恢复就不会由Fable 5不竭完成,而是自动回退到Claude Opus 4.8。
Mythos 5基于相似的底层模子,但在部分领域铲除了Fable 5的护栏。Anthropic称,Project Glasswing里的收集安全合营伙伴不错使用“满血版”Mythos 5;将来,部分人命科学商讨者也可能通过受信任打听方针,使用铲除生物和化学为止的版块。
用不到的Mythos咱们暂时不提,先看点委果的东西。
当先是订价,一个字,贵。
Fable 5的订价是输入10好意思元/百万token,输出50好意思元/百万token。开发者当今就不错通过Claude API调用claude-fable-5(模子名)。
这个价钱刚好是Opus 4.8的两倍,和Opus 4.8的fast mode琢磨,Anthropic赫然把它放在了比Opus更高一档的价钱层级里。
不外Anthropic称,这一价钱不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公开API模子,官方并未给露面向公众的圭臬价,这句话也无从考证。
Anthropic在官方说明中提到,6月23日以后,即使用户照旧订阅Claude,Fable 5也可能根据算力情况按量提供,不一定会径直包含在基础订阅职业中。
这公司越来越爱惜了,不外好赖还留了小半个月试用期。官方也留了极少余步:要是6月23日以后算力资源浪费,Anthropic会尽量把Fable 5不竭包含在Pro、Max等订阅职业里。

订价高自己并指责以交融,但它最佳保证它的才智配得上它的价钱。
从跑分上看,Fable 5/Mythos 5基本是Anthropic咫尺公开内外最强的一档。
不外官方表格有一个说明,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除了带星号的收集安全、生物关连测试),是以内外裸露的是两者更高的分数。这极少很难不让东谈主思要吐槽。

Anthropic把Fable 5的要点放在几个标的:软件工程、学问责任、视觉、长迤逦文挂念和人命科学商讨。
软件工程是最隆起的场景之一,根据表格,Fable/Mythos 5在SWE-Bench Pro上达到80.3%,彰着高于Opus 4.8的69.2%;在更难的FrontierCode Diamond上,它拿到29.3%,而Opus 4.8独一13.4%,GPT-5.5独一5.7%。


学问责任和视觉任务上,Anthropic给出了两类凭证。
一类是圭臬化benchmark。官方表格裸露,Fable/Mythos 5在GDPval-AA上得分1932,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf这种带视觉交融的文档任务上,它达到29.8%,也进步其他主要模子。
另一类是早期客户测试。Anthropic称,Fable 5在Hebbia的高等金融推理基准上得到最高分,上风麇集在文档推理、图表和表格交融、问题求解;IMC也响应,它在交游分析评估中简直全面通过。
为了展示Fable 5的视觉才智,Anthropic举的例子是:此前Claude模子需要复杂赞助用具才能玩《宝可梦 火红》,而Fable 5只靠视觉输入就不错通关。

长任务和挂念才智上,Anthropic称,Fable 5不错在数百万token的永久任务中保捏专注,并诈骗我方的札记改变输出。
在《夷戮尖塔》这类需要联接有瞎想和永久政策的游戏里,要是给Fable 5接入捏久文献挂念,让它能纪录前边的经受和履历,它的弘扬会彰着擢升。擢升幅度是Opus 4.8的三倍,到达最终关卡的次数也提高了三倍。
趁机一提,Fable亦然一款经典RPG游戏的名字,华文译作《神鬼寓言》——好像某天咱们能看到Fable玩《Fable》。
另外,2026FIFA世界杯下单平台官网收集安全才智方面,Fable/Mythos 5在ExploitBench Cap%上达到78.0%,进步Claude Mythos Preview的69.0%,接近Opus 4.8的两倍。
这里用的应该是Mythos 5的得分,因为Fable 5在高风险申请上会回退到Opus 4.8。
02
庞大的模子必须分层
Anthropic此次把模子才智的直不雅展示放到了一个雷同”作品集“的滑页里,何况每个demo只给了一小段可贵。

比如,Fable 5写了一个太阳系模拟,从物理第一性道理推导行星轨谈认识,并用它瞻望日食。

又比如,它不错自主玩《异星工场》。这是一款工程师很爱的工场自动化游戏,玩家要辘集资源、计较坐褥线、搭建物流和动力系统。
Anthropic用这个例子说明,Fable 5不错在一个绽开环境里制定政策,并捏续股东一个复杂系统的拓荒。

在另一个demo里,Fable 5先作念了一个基于浏览器的CAD剪辑器,然后又使用这个由我方开发的CAD用具,瞎想了一个不错3D打印的完满模子。这个剪辑器里还内置了AI copilot,用来赞助建模。
这个demo的要点在于Fable 5完成了一个闭环:先创造用具,再使用用具,终末完成一个实体瞎想任务。

终末一个demo,Anthropic展示了一个由Fable 5写出来的流体模拟,认识节拍和一段古典音乐EDM remix同步。官方还挑升提到,音乐亦然Fable 5用代码生成的。

这些案例看起来挺花哨,但真义是一样的:Fable 5很擅长把代码、视觉、物理、瞎想和永久计较混在一谈作念任务。
要是说这部分展示的照旧Fable 5在开发者手里能作念到什么进度,背面的部分说的等于Mythos 5在商讨者手里能作念什么——以及Anthropic为什么要把Fable和Mythos分开。
Anthropic称,在里面卵白瞎想大师的评估中,Mythos 5把药物瞎想经由中的部分身手加快了简短10倍。其中一个案例里,Mythos 5接入卵白瞎想和生物信息学用具、莫得东谈主类匡助,就不错匹配以致进步纯属东谈主类操作员。
在该任务中,Mythos 5作念的不是简便问答,而是完成一整套科学责任流:经受蚁合位点,经受并运行卵白瞎想用具,在失败后我方还原。官方称,在这项商讨的14个卵白靶点中,有9个产生了强候选分子,咫尺正在进一步商讨。

Anthropic还提到,Mythos 5不错踏实建议新颖、有劝诱力的分子生物学假定。在和Opus级模子的盲测对比中,里面科学家简短80%的时候更偏好Mythos建议的假定,其中一些照旧插足实验评估。
与此同期,Mythos 5的一个对于大肠杆菌卵白的新机制的假定,在另一家独处商讨肃清问题的实验室的商讨中得到了说明。
它以致还作念了一项基因组学商讨。
Anthropic称,Mythos 5在一周多的时期里,简直自主完成了一项新的基因组学商讨。它整理了横跨138种动物、数百万个细胞的单细胞数据,并瞎想、覆按了一个定制机器学习模子,用来识别不同物种中推行琢磨扮装的细胞。
更夸张的是,Anthropic称,Mythos 5覆按出的模子性能进步了近期发表在《Science》上的一个模子,尽管它的规模独一后者的百分之一。Anthropic默示,方针在将来几个月发表这些效果。
固然,这部分还需要恭候论文和外部复核。但要是只看Anthropic官方给出的信息,Mythos 5在人命科学里展示的才智照旧接近科研Agent:能读问题、用用具、管理数据、覆按模子、建议假定,并把一项商讨股东到不错发表的进度。
而一朝模子不错在药物瞎想、病毒载体、卵白瞎想、基因组学商讨这些标的里简直股东任务,它就自然具备双重用途。
不错合计,人命科学这部分不是Fable 5的泛泛功能演示,而是Mythos 5的才智上限展示。
但它被展示出来,是为了说明Anthropic手里的这套底层模子,照旧强到了必须通过受信任打听来分发。
有真义的是,已往的模子发布更像是一件工夫家具的事:参数、跑分、价钱、迤逦文长度、API称号。强等于强,发布等于发布。
但到了Mythos这里,事情运滚动得复杂。肃清个底层模子被分为两个版块,泛泛用户拿到的是Fable 5,安全商讨者和部分人命科学商讨者拿到的是Mythos 5;前者被装进更严格的护栏里,后者则需要受信任打听。
模子才智不再独一迤逦之分,也运转有权限、场景和株连之分。
某种道理上来讲,不错看作前沿模子生意化插足新阶段的信号——越强的模子,越不可能径直扔给所有东谈主。它们会被拆成不同版块,放进不同安全规模,再交给不同类型的用户。
Anthropic先这样作念了,因为它们的模子“强到不可实足公开”。将来其它思要讲故事的公司,思要说明注解我方的模子也很强世界杯全球运动用品供应平台,好像也会效仿这种方式。(作家/袁心玥)
