风险提示:防范以"数字货币""区块链"名义进行非法集资的风险
作者:Frank Fu,IOSG

全球三大交易所之一,注册领50U数币盲盒,币圈常用的交易平台!

币安是世界领先的数字货币交易平台,注册领100U。
说实话,2023年那个「2000亿美元问题」,我还记得挺清楚的。当时Sequoia的David Cahn提出来:每花1美元买GPU,数据中心供电就得再砸1美元。这账算下来,每年的GPU资本支出,最后得产生约2000亿美元收入才能回本。
即便你对AI收入做最乐观的假设,投入和终端付费之间,依然有个1250亿美元以上的窟窿。
结果一年过去了,缺口没缩小,反而变成了「6000亿美元问题」。看空逻辑大家都熟:过度建设导致供给过剩,过剩烧毁资本。
但答案从来没在「训练」侧出现过。它在推理(Inference)侧。市场只是最近几周,才开始把这个事实计入定价。
一、Cerebras IPO:市场终于醒了
周四Cerebras上市,获20倍超额申购。定价接近周三最终加价的两倍。
华尔街兴奋的不是「下一个Nvidia杀手」,而是更简单的事:AI真正的瓶颈是推理,不是训练。
Cerebras的看家本领,是让推理极快的芯片架构。推理市场是经常性的,随使用量扩张。每一次Claude回答问题、每一个Agent执行任务,都在消耗算力。
训练只发生一次,推理永不停止。J.P. Morgan估算,推理市场规模是训练的10到50倍。
二、Nvidia重画版图:推理成为头条
如果说Cerebras是市场的觉醒,Nvidia最新财报就是产业链顶端的确认。
Jensen Huang挑明了心照不宣的话:AI需求呈抛物线增长。因为Agentic AI来了。主流AI已从一次性推理,过渡到逻辑推理,再到会自己调用工具的Agent阶段。
「Tokens现在是有利可图的。」
Nvidia把财报口径拆成两个平台:数据中心与边缘计算。数据中心当季约750亿美元,同比增92%。全新的一条线是边缘计算:64亿美元,同比增29%。
边缘目前占总收入不到8%,但Nvidia已把它提升到与数据中心并列的「第二平台」。信号很明确:推理正在分裂为云端和端点两条战线。
三、挤压已经到来:Anthropic的信号
Anthropic是煤矿里的金丝雀。使用量远超产能,Claude被「脑叶切除」的抱怨刷屏。
解法赤裸裸:算力。2026年5月,Anthropic从SpaceX手中接管Colossus 1数据中心,22万张Nvidia GPU,专门用于推理。
随后的一系列限额变动,都是信号。6月15日起,Anthropic把Agentic使用从扁平订阅中切出,放入独立计量的Credit池。
这一步浓缩了论点:Agent消耗推理的速度,远超扁平订阅的设计承受能力。
训练是一次性资本支出。推理是经常性运营成本,随新用户、新Agent复利累积。
四、Hyperbolic:唯一横跨三层的玩家
每个AI应用,都坐落在从TSMC晶圆厂到API端点的供应链上。


大多数公司只拥有其中一层。Nvidia拥有硅,CoreWeave拥有裸金属,Together AI拥有推理优化,OpenRouter拥有模型API路由。
只有一家除外。
Hyperbolic于2025年6月推出按需GPU市场。最初几个月,开发者突破20万。覆盖前沿AI实验室、搜索,以及大型消费级平台。
有意思的是它的架构:Hyperbolic自己一张GPU都不持有。
每一张卡来自Neocloud、CoreWeave、Lambda Labs等。这听起来像弱点,实则是护城河。
通过坐在供给方与消费方之间,Hyperbolic能看到别人看不到的实时数据。它在供给过剩公开化之前就看到它,在需求飙升冲击市场之前就看到它。
五、Venice这面镜子
Venice是推理经济在应用层的体现,也是与Hyperbolic的对照。
Venice是隐私优先的推理应用。它把请求路由到约75个模型上,其中三分之二是开源或自托管模型。它真正的成本是推理算力,而非SaaS托管。
Venice卖的是隐私。给商品化的推理裹上一层保证:不留存数据、不拿去训练、请求匿名化。
但最强的隐私只覆盖开源部分。对Claude、GPT这类闭源模型,只是「匿名」而非「真机密」。
如果说Venice是加油站,Hyperbolic就是炼油厂。Venice从受限供给中购买算力;Hyperbolic把碎片化供给聚合、标准化,再卖给Venice。
六、为什么此刻重要
Nvidia重组财务,Cerebras IPO证明市场明白推理是瓶颈,Anthropic为产能奔走证明这是真实问题。
Agentic与Physical AI将把需求放大几个数量级。
Cahn的看空逻辑,即过度建设最终导致过剩,很可能会被验证。但过剩恰恰是轻资产聚合方的最优行情。
当GPU价格下行、供给碎片化,那个不持有任何硬件、把负载路由到最便宜可用卡上的玩家,会赚取价差。
Hyperbolic是做多过剩,而非做空它。最终胜出的,不会是拥有最多GPU的公司,而是能告诉你哪些GPU在哪里、以什么价格可用,并路由到最低成本的那一家。
FAQ
AI算力的瓶颈现在在哪里?
目前AI算力的瓶颈已从训练转向推理(Inference)。随着Agentic AI的发展,推理需求呈指数级增长,成为限制行业发展的关键因素。
Hyperbolic的核心商业模式是什么?
Hyperbolic不持有GPU硬件,而是通过聚合来自多家云服务商的碎片化算力,提供标准化的按需GPU市场,横跨GPU租赁、部署与模型API三层。
为什么推理市场比训练市场更具经常性收入特征?
训练模型是一次性资本支出,而推理是运行模型时的经常性运营成本。每一次用户交互或Agent任务执行都会产生推理成本,随使用量复利累积。
温馨提示:仅提供区块链&数字货币平台信息分享服务,所有产品及展示信息均来源于发行方或者互联网。炒币属于投资行为,不等同于银行存款。市场有风险,投资需谨慎。投资虚拟货币有极大的风险,本网站提供的任何信息都不构成投资建议、财务咨询、交易咨询,或任何其他建议的依据,领域OK并不推荐您购买、售出或持有任何虚拟货币。在做出任何投资决定前,请先充分衡量风险。如有损失,请自行承担后果。






