推理成瓶颈:Hyperbolic如何横跨三层捕获AI算力价值

网友贡献5小时前发布 领域OK
2 0 0

 风险提示:防范以"数字货币""区块链"名义进行非法集资的风险

作者:Frank Fu,IOSG

欧易
欧易(OKX)

全球三大交易所之一,注册领50U数币盲盒,币圈常用的交易平台!

币安
币安(Binance)

币安是世界领先的数字货币交易平台,注册领100U。

说实话,2023年那个「2000亿美元问题」,我还记得挺清楚的。当时Sequoia的David Cahn提出来:每花1美元买GPU,数据中心供电就得再砸1美元。这账算下来,每年的GPU资本支出,最后得产生约2000亿美元收入才能回本。

即便你对AI收入做最乐观的假设,投入和终端付费之间,依然有个1250亿美元以上的窟窿。

结果一年过去了,缺口没缩小,反而变成了「6000亿美元问题」。看空逻辑大家都熟:过度建设导致供给过剩,过剩烧毁资本。

但答案从来没在「训练」侧出现过。它在推理(Inference)侧。市场只是最近几周,才开始把这个事实计入定价。

一、Cerebras IPO:市场终于醒了

周四Cerebras上市,获20倍超额申购。定价接近周三最终加价的两倍。

华尔街兴奋的不是「下一个Nvidia杀手」,而是更简单的事:AI真正的瓶颈是推理,不是训练。

Cerebras的看家本领,是让推理极快的芯片架构。推理市场是经常性的,随使用量扩张。每一次Claude回答问题、每一个Agent执行任务,都在消耗算力。

训练只发生一次,推理永不停止。J.P. Morgan估算,推理市场规模是训练的10到50倍。

二、Nvidia重画版图:推理成为头条

如果说Cerebras是市场的觉醒,Nvidia最新财报就是产业链顶端的确认。

Jensen Huang挑明了心照不宣的话:AI需求呈抛物线增长。因为Agentic AI来了。主流AI已从一次性推理,过渡到逻辑推理,再到会自己调用工具的Agent阶段。

「Tokens现在是有利可图的。」

Nvidia把财报口径拆成两个平台:数据中心与边缘计算。数据中心当季约750亿美元,同比增92%。全新的一条线是边缘计算:64亿美元,同比增29%。

边缘目前占总收入不到8%,但Nvidia已把它提升到与数据中心并列的「第二平台」。信号很明确:推理正在分裂为云端和端点两条战线。

三、挤压已经到来:Anthropic的信号

Anthropic是煤矿里的金丝雀。使用量远超产能,Claude被「脑叶切除」的抱怨刷屏。

解法赤裸裸:算力。2026年5月,Anthropic从SpaceX手中接管Colossus 1数据中心,22万张Nvidia GPU,专门用于推理。

随后的一系列限额变动,都是信号。6月15日起,Anthropic把Agentic使用从扁平订阅中切出,放入独立计量的Credit池。

这一步浓缩了论点:Agent消耗推理的速度,远超扁平订阅的设计承受能力。

训练是一次性资本支出。推理是经常性运营成本,随新用户、新Agent复利累积。

四、Hyperbolic:唯一横跨三层的玩家

每个AI应用,都坐落在从TSMC晶圆厂到API端点的供应链上。

推理成瓶颈:Hyperbolic如何横跨三层捕获AI算力价值

推理成瓶颈:Hyperbolic如何横跨三层捕获AI算力价值

大多数公司只拥有其中一层。Nvidia拥有硅,CoreWeave拥有裸金属,Together AI拥有推理优化,OpenRouter拥有模型API路由。

只有一家除外。

Hyperbolic于2025年6月推出按需GPU市场。最初几个月,开发者突破20万。覆盖前沿AI实验室、搜索,以及大型消费级平台。

有意思的是它的架构:Hyperbolic自己一张GPU都不持有。

每一张卡来自Neocloud、CoreWeave、Lambda Labs等。这听起来像弱点,实则是护城河。

通过坐在供给方与消费方之间,Hyperbolic能看到别人看不到的实时数据。它在供给过剩公开化之前就看到它,在需求飙升冲击市场之前就看到它。

五、Venice这面镜子

Venice是推理经济在应用层的体现,也是与Hyperbolic的对照。

Venice是隐私优先的推理应用。它把请求路由到约75个模型上,其中三分之二是开源或自托管模型。它真正的成本是推理算力,而非SaaS托管。

Venice卖的是隐私。给商品化的推理裹上一层保证:不留存数据、不拿去训练、请求匿名化。

但最强的隐私只覆盖开源部分。对Claude、GPT这类闭源模型,只是「匿名」而非「真机密」。

如果说Venice是加油站,Hyperbolic就是炼油厂。Venice从受限供给中购买算力;Hyperbolic把碎片化供给聚合、标准化,再卖给Venice。

六、为什么此刻重要

Nvidia重组财务,Cerebras IPO证明市场明白推理是瓶颈,Anthropic为产能奔走证明这是真实问题。

Agentic与Physical AI将把需求放大几个数量级。

Cahn的看空逻辑,即过度建设最终导致过剩,很可能会被验证。但过剩恰恰是轻资产聚合方的最优行情。

当GPU价格下行、供给碎片化,那个不持有任何硬件、把负载路由到最便宜可用卡上的玩家,会赚取价差。

Hyperbolic是做多过剩,而非做空它。最终胜出的,不会是拥有最多GPU的公司,而是能告诉你哪些GPU在哪里、以什么价格可用,并路由到最低成本的那一家。

FAQ

AI算力的瓶颈现在在哪里?

目前AI算力的瓶颈已从训练转向推理(Inference)。随着Agentic AI的发展,推理需求呈指数级增长,成为限制行业发展的关键因素。

Hyperbolic的核心商业模式是什么?

Hyperbolic不持有GPU硬件,而是通过聚合来自多家云服务商的碎片化算力,提供标准化的按需GPU市场,横跨GPU租赁、部署与模型API三层。

为什么推理市场比训练市场更具经常性收入特征?

训练模型是一次性资本支出,而推理是运行模型时的经常性运营成本。每一次用户交互或Agent任务执行都会产生推理成本,随使用量复利累积。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...