
用满 200 刀订阅能吃掉1. 4 万刀算力?大模型巨头正面临严峻的成本风暴
行业分析机构SemiAnalysis 最新 对OpenAI与Anthropic的订阅方案进行了实测。结果显示,在看似平价的固定月费背后,隐藏着由大模型厂商自行承担的巨额算力补贴缺口。 测试人员通过购买两家公司的各类订阅计划,并持续运行长周期编程和智能体等重型任务,直至触及每周的使用上限。随后按照公开的API价格折算出这些实际使用量对应的理论费用,数字令人震惊
行业分析机构SemiAnalysis 最新 对OpenAI与Anthropic的订阅方案进行了实测。结果显示,在看似平价的固定月费背后,隐藏着由大模型厂商自行承担的巨额算力补贴缺口。
测试人员通过购买两家公司的各类订阅计划,并持续运行长周期编程和智能体等重型任务,直至触及每周的使用上限。随后按照公开的API价格折算出这些实际使用量对应的理论费用,数字令人震惊。
极限使用拉满算力补贴
测算结果显示,如果用户完全用满OpenAI价格为 200 美元的“ChatGPT Pro 20x”订阅,其对应的API计费 最高 可达到约1. 4 万美元。而以同样价格定价的Anthropic “Claude Max 20x”方案,在极限使用情况下,理论Token成本也可逼近 8000 美元。
这意味着一小部分重度用户就足以吞噬掉订阅模式下原本有限的利润空间,让厂商陷入严重亏损。对于ChatGPT Plus这类 20 美元的入门订阅,一旦用户利用率超过11.4%,OpenAI就开始在该用户身上亏本。
企业精细化分流成新趋势
在此背景下,以多步、自主调用工具为代表的智能体系统正在推高成本压力,其Token消耗可达到传统单轮对话的千倍级。包括微软、Meta、亚马逊在内的大型企业,已对此前鼓励员工大规模试用AI的做法有所收缩,以控制内部快速膨胀的账单。
为了应对高昂的算力开支,越来越多企业开始采用将复杂问题交由 顶级 模型、常规办公下放给便宜或开源模型的精细化分流策略。这种任务路由方式 最高 可将整体AI成本削减95%,同时也迫使大模型服务商在用户体验与高昂的基础设施投入之间艰难寻找平衡。
相关推荐

巴西AI黑马Rio 3. 5 翻车:被指套壳缝合两款国产大模型
近日,由巴西里约热内卢市政府旗下IT公司推出的开源大模型Rio 3.5 397B在AI圈引发广泛关注。该模型号称在多项基准测试中斩获SOTA,成功杀入全球大模型 第一 梯队,一时间风头无两。 核心权重遭数学起底 然而,这款黑马模型发布不足 24 小时便遭遇反转。AI智能体开源项目联盟Nex-AGI发布声明,直指Rio 3. 5 实际上是一款套壳缝合模型。 N

顾客用AI伪造病历“碰瓷”餐厅,多店连续受害终难逃法网
日前,上海市杨浦区人民法院公开审理并当庭宣判了一起利用AI技术进行敲诈勒索的案件。被告人杨某通过AI软件伪造医院诊断证明及收费单据,以在餐厅就餐导致生病为由实施诈骗。 AI技术沦为犯罪工具 今年上半年,当地一家烤肉店向警方报警,称有顾客以“吃坏肚子”为由恶意索赔。该顾客出示了AI生成的就诊记录和医疗发票,迫使店家赔付了 2000 元。 随后,烤肉店店长在与同

越狱风波引发全球封杀,顶尖AI模型Claude Fable5 遭遇“光速下架”
近日,Anthropic公司发布了号称史上 最强 的Mythos级大模型Claude Fable5,凭借在编程与复杂任务处理上的碾压级表现,该模型迅速成为技术圈的焦点。然而,仅仅72小时后,这款备受瞩目的AI产品便遭遇了美国政府的“全球封杀令”,被迫全线停服。 此次禁令的力度 史无前例 。美国政府以国家安全为由,不仅禁止美国境外的个人与机构访问该模型,甚至明

智商不减、成本砍掉四分之三!百度通用智能体DuMate完成关键进化
6月15日,百度旗下企业级通用智能体产品“百度搭子DuMate”宣布完成核心引擎升级,国内通用智能体 首次 通过Harness引擎及工程优化实现了任务消耗的大幅下降。 此次升级在保障Agent智能能力与任务执行效果不受影响的前提下,通过Harness引擎以及多项工程层面的持续调优,成功将任务执行过程中的Token消耗显著降低了75%,对应用户的积分消耗也同步
LangChain 系列 之 Short-term Memory:当前会话内如何保存状态?
1. 短期记忆到底是什么? Short-term Memory = 当前 thread 内的状态保存。它让 Agent 在同一段会话里记住前面发生过什么。 LangChain 官方把短期记忆叫做 thread-level persisten
PyTorch 系列 之 nn.Module:所有模型的骨架
开篇:Module 不是“普通父类” 写 PyTorch 模型,最终都会回到 nn.Module。 它不是一个空壳父类。它是模型的总管:管参数、管子模块、管状态、管调用、管保存加载。 你写的 forward 只是计算逻辑。真正让模型“像模型
阅读补充
一句话看懂
行业分析机构SemiAnalysis 最新 对OpenAI与Anthropic的订阅方案进行了实测。结果显示,在看似平价
事件背景
这篇内容围绕“用满”展开,热闻岛基于公开信息整理事件背景、主要进展与可继续关注的方向。
事件时间线
发布
相关信息进入公开传播
更新
热闻岛对内容进行整理与补充。
看点
- · 用满的最新进展是什么
- · 相关信息对用户或行业会带来哪些影响
- · 后续是否会有新的回应或处理结果
后续关注
- · 后续官方回应或权威通报
- · 相关主体的进一步说明
- · 事件对普通用户和平台传播的持续影响
免责声明:本文仅代表作者观点,不构成投资建议、法律建议、医疗建议。财经类内容尤其需要注意风险;爆料类信息请以权威通报为准。
评论 (0)
登录后即可发表评论
去登录