首页 > 基础资料 博客日记
硅基流动 vs OpenRouter——两种AI Infra模式的取舍
2026-05-14 19:30:02基础资料围观1次
企业管理 #AI #商业模式 #对比分析 #商业画布
本文内容都来源于网络,数据均标注来源,如有不对。是来源信息的错,不是我的!
这两家公司表面都是"模型聚合平台",本质却是完全不同的生意。硅基流动是"工厂+经销商",自己造引擎、自己租GPU、自己跑推理;OpenRouter是"纯经销商",不碰算力,只收过路费。两种模式的成本结构、风险敞口、天花板,完全不同。
一、两家公司到底在卖什么
硅基流动:让别人的大模型跑得更快、更便宜
硅基流动成立于2023年8月(来源),创始人袁进辉是OneFlow的原作者。2025年6月获阿里领投数亿元A轮融资(来源),平台注册用户超900万,上线模型150+(2025年12月数据)(来源)。
它的业务分三层。
第一层是自研推理引擎SiliconEngine。通过编译优化、量化压缩(FP16→INT8→INT4)、并行调度、投机解码,把同样一块GPU的推理效率提上去。这是它和纯API聚合平台最大的区别:有真技术,不是单纯做路由转发。
第二层是SiliconCloud API平台。聚合DeepSeek、Qwen、Llama等150+模型(来源),提供统一接口。开发者一行代码切换模型,不用管底层部署。
第三层是企业私有化部署。给金融、政企这类对数据安全敏感的客户,提供本地化大模型服务平台。
三层里面,API调用费占收入60-70%,是现金奶牛。企业订阅和私有化部署占剩下30%左右,客单价高但量小。硅基流动没公开过财报,这个结构是我根据行业信息和它的产品形态估的,不一定准。
OpenRouter:纯渠道聚合,不做算力不做优化
OpenRouter不碰算力,不碰优化。它做的事更简单:对接上游模型厂商的API,在自己的平台上做统一路由、负载均衡、故障转移,然后加价卖给终端用户。成本主要是平台开发和运营,毛利率高得多。赚的是"渠道聚合"的钱:让用户不用对接十几家模型厂商,一站式搞定。

二、硅基流动的商业画布:九块拼图
客户细分:谁在买单
硅基流动的客户分四层,每层的需求和付费能力差异很大。
AI创业公司是最大的人群,量大但ARPU低。它们需要低成本快速接入大模型能力,对价格敏感,忠诚度低,哪家便宜用哪家。
独立开发者是生态培养层。学习实验、小项目为主,付费意愿弱,但未来可能转化为付费客户或口碑传播者。
中小企业增长最快。需要大模型降本增效,但无力自建基础设施。这个群体的付费能力和留存率都比开发者好。
大型企业是高价值客户。数据安全要求高,需要私有化部署,客单价高,但获客周期长,需要销售团队跟进。
硅基流动900万注册用户里,真正贡献收入的可能是那1万家企业客户,而不是个人开发者。免费额度拉新,企业订阅变现——这个漏斗模型和云厂商基本一致。
价值主张:为什么选它
硅基流动的价值主张可以概括为四个词:便宜、快、中立、灵活。
便宜来自推理优化。自研SiliconEngine通过编译优化、量化压缩、并行调度,把同样GPU的推理效率提上去。在DeepSeek引发的价格战中,这是它还能参与竞争的底牌。
快不只是推理速度快,还包括接入速度快。一行代码切换模型,不用关心底层部署细节。对开发者来说,时间成本比API调用费更贵。
中立是关键差异化。硅基流动不绑定自研模型,支持DeepSeek、Qwen、Llama等多种开源模型。客户选择灵活,不用担心被单一厂商锁定。这和阿里云百炼(主推通义千问)、百度千帆(主推文心一言)形成对比。
灵活体现在部署方式。公有云API、私有化部署、混合云,满足不同安全等级需求。
但这里有个trade-off:中立意味着没有自研模型的溢价能力。云厂商可以用自研模型+算力捆绑销售,硅基流动只能拼性价比。
渠道通路:怎么触达客户
硅基流动的获客渠道很"开发者友好":
官网和API文档是主阵地。文档质量直接影响开发者转化率,硅基流动在这方面投入不少。
开发者社区是口碑传播场。GitHub、知乎、CSDN上的技术文章和教程,比广告投放更有效。一个被忽视的数据:硅基流动最早接住DeepSeek流量,不是靠营销,是靠技术团队快速适配+社区口碑。
技术会议和行业展会是品牌曝光渠道。对大企业客户的获客有帮助。
阿里生态是A轮融资后的新增渠道。阿里云的企业客户资源、联合解决方案、品牌背书,都是独立创业公司自己建不起来的。
客户关系:怎么留住客户
对开发者和中小企业,关系是自助服务+社区运营。靠产品体验和产品文档降低支持成本,靠免费额度和价格优势留住用户。
对大型企业,关系是技术支持+定制化服务。私有化部署、模型微调、场景优化,需要专人跟进。
一个潜在风险:API平台的切换成本很低。统一接口标准(OpenAI-compatible)让开发者可以低成本迁移到竞品。硅基流动的留存靠什么?一是价格,二是性能,三是生态锁定(比如BizyAir这类垂直工具)。但价格和性能都是变量,生态锁定目前还不深。
收入来源:钱从哪来
| 收入类型 | 占比估算 | 特点 |
|---|---|---|
| API调用费 | 60-70% | 量大、现金流稳定、单价低 |
| 企业订阅 | 15-20% | ARPU高、预付款、粘性强 |
| 私有化部署 | 10-15% | 项目制、高客单价、周期长 |
| 技术服务 | ~5% | 非标准化、利润率波动 |
(此收入占比为基于公开信息的行业估算,硅基流动未公开财报)
定价策略的核心是低价获客+规模效应。新用户送免费token,阶梯定价量越大越便宜,不同模型差异化定价。这和云厂商的策略一致,但硅基流动的成本结构里没有云厂商的算力资源优势,所以价格战的可持续性是个问号。
核心资源:凭什么做这件事
硅基流动的核心资源不是钱,是人。
袁进辉和OneFlow原班人马,在深度学习框架、编译器、分布式系统领域有十年积累。这种技术基因不是招几个工程师就能复制的。
阿里投资带来的云生态资源是第二大资源。算力采购成本、企业客户渠道、品牌背书,都是独立创业公司最缺的东西。
开源社区是第三大资源。BizyAir在ComfyUI生态中有一定影响力,开发者口碑是低成本获客的关键。
关键活动:每天都在忙什么
三件事:
推理引擎研发。这是护城河,也是最大的人力投入。编译优化、量化算法、国产芯片适配,需要持续投入。
模型适配与平台运营。新模型出来要快速接入,平台稳定性要保障,定价策略要动态调整。
企业客户拓展。私有化部署、定制化方案、销售跟进,这是收入增长的关键。
关键合作伙伴:靠谁活着
| 合作伙伴 | 关系 | 重要性 |
|---|---|---|
| 阿里巴巴 | A轮领投方,云生态合作 | ★★★★★ 战略级 |
| DeepSeek | 模型合作,流量互惠 | ★★★★☆ 关键模型源 |
| 华为云 | 昇腾芯片联合推理服务 | ★★★★ 国产芯片适配 |
| 开源模型社区 | Qwen、Llama、ChatGLM等 | ★★★★ 模型供给 |
| GPU供应商 | 英伟达、AMD | ★★★☆ 算力基础 |
| 国产GPU厂商 | 华为昇腾、寒武纪等 | ★★★ 政策红利 |
阿里是最重要的变量。它既是投资方,又是潜在的竞争对手(阿里云百炼)。硅基流动在阿里生态里的角色,决定了它未来的天花板。
成本结构对比

硅基流动近一半的钱烧在GPU上,OpenRouter没有这笔开支。这是两者毛利率差距的根本原因。
三、OpenRouter的商业画布:九块拼图
客户细分:谁在买单
OpenRouter的客户分三层,和硅基流动有重叠但重心不同。
独立开发者(indie hackers)是最大的用户群。250万+开发者(来源)中,大量是个人开发者,他们需要在多个模型之间实验和切换,不想分别注册十几家模型厂商的账号。付费意愿弱,但活跃度高,是平台生态的基础。
产品团队是核心付费层。需要稳定的API服务、自动故障转移、统一计费。它们的痛点不是"用哪个模型",而是"怎么用一个接口搞定所有模型"。Cline等热门AI编程工具直接集成OpenRouter(来源),这类B2B2C模式带来了稳定的推理量。
大型企业是增长最快的高价值客户。需要组织级别的用量管控、合规过滤(只路由到满足特定隐私标准的提供商)、集中计费和分析。OpenRouter为此推出了Organization管理功能和BYOK(Bring Your Own Key)方案(来源)。
价值主张:为什么选它
OpenRouter的价值主张也可以用四个词概括:一站、透明、智能、轻量。
一站是核心卖点。一个API密钥访问400+模型(来源),统一请求格式(OpenAI-compatible),统一响应格式,统一计费。开发者不用对接60+提供商(来源)的API,一个入口解决所有问题。
透明体现在公开的模型排行榜。OpenRouter基于真实使用数据发布LLM排行榜,Andrej Karpathy在YC AI Startup School演讲中引用该排行榜作为"通用LLM评估标准"(来源)。这个数据资产反过来又强化了平台价值。
智能体现在路由优化。自动选择最优端点(基于价格、延迟、吞吐量),自动故障转移,25毫秒级额外延迟(来源)。开发者可以用:nitro(最快)、:floor(最便宜)、:online(搜索增强)等变体指定偏好。还有Response Healing功能,自动修复格式错误的JSON响应,将结构化输出缺陷率降低80-99.8%(来源)。
轻量体现在零运维。开发者不需要管理基础设施,不需要关心模型部署,甚至不需要自己注册各个模型厂商的API密钥。BYOK模式下每月还提供100万次免费请求(来源)。
渠道通路:怎么触达客户
OpenRouter的获客渠道以开发者社区为核心:
GitHub和开源生态是主阵地。OpenRouter的OpenAI-compatible API格式让它天然适配各种开源工具和框架。Cline等热门AI编程工具的原生集成(来源),带来了大量被动获客。
Andrej Karpathy等KOL背书。Karpathy在X平台和YC Startup School演讲中多次提及OpenRouter排行榜(来源),这种行业标杆级人物的免费宣传比任何广告都有效。
YC生态是早期启动的杠杆。Alex Atallah作为OpenSea联合创始人的个人品牌,加上YC网络,让OpenRouter在硅谷开发者社区快速建立了认知度。
企业直销是增长引擎。随着年化推理支出从1000万美元增长到1亿美元(来源),企业客户成为收入增长的主要驱动力。
客户关系:怎么留住客户
对独立开发者,关系是自助服务+社区互动。完善的API文档、Discord社区、GitHub issue跟踪。切换成本低(OpenAI-compatible格式),留存主要靠习惯和生态集成。
对产品团队和企业客户,关系是API SLA+组织管理。统一计费、实时用量分析、组织级策略管控、数据合规过滤。BYOK模式降低了企业的采用门槛——企业可以继续用已有的API密钥,同时获得OpenRouter的路由和分析能力。
一个关键差异:OpenRouter的留存机制比硅基流动多了一层"数据飞轮"。处理100万亿+token/年的使用数据3,持续优化路由算法,排行榜本身也变成了行业标准参考。这种数据资产越用越值钱,形成正反馈。

收入来源:钱从哪来
| 收入类型 | 占比估算 | 特点 |
|---|---|---|
| API交易加价 | ~80% | 按5-5.5%加价,量大利薄 |
| 企业方案 | ~15% | BYOK、组织管理、合规过滤 |
| 订阅服务 | ~5% | 未来方向,目前以按量付费为主 |
定价机制(来源):
- 非加密支付:订单金额的5.5%,最低$0.80
- 加密货币支付:固定5.0%,无最低消费
- BYOK模式:每月100万次免费请求,超出部分按标准费率
关键数据:年化收入约5000万美元(2026年初),从2025年5月的500万美元、10月的1000万美元快速增长(来源)。年化推理支出超1亿美元(来源)。
这个加价模式的精妙之处:OpenRouter声称按提供商原价收费(来源),实际通过提供商的批量折扣或返佣赚取差价,而非直接向用户加价。这降低了用户的比价心理障碍。
核心资源:凭什么做这件事
路由数据和算法是最大的无形资产。100万亿+token的处理数据(来源),全球最大的真实LLM使用数据集,持续喂养路由优化算法。这个数据护城河是纯技术无法复制的。
Alex Atallah的个人品牌。OpenSea联合创始人的身份,自带创业圈影响力和媒体关注度。他的"第二次创业"叙事本身就自带传播力。
开发者生态。250万+开发者(来源)的使用习惯和集成粘性。Cline、VSCode插件等原生集成,让替换OpenRouter的成本高于替换硅基流动。
边缘计算架构。在全球多个PoP节点运行路由逻辑,靠近用户和提供商,延迟仅25毫秒(来源)。这种基础设施虽然轻资产,但需要持续优化。
关键活动:每天都在忙什么
路由算法优化。基于实时吞吐量、工具调用遥测、基准测试分数,每5分钟重新评估提供商排名(来源)。Auto Exacto功能自动为工具调用请求选择最佳提供商。
新模型和新提供商接入。保持400+模型的覆盖优势。OpenRouter是OpenAI首个编程模型GPT 4.1的独家发布合作伙伴(以Quasar Alpha名义)(来源)。
企业功能开发。组织管理、数据合规过滤、BYOK支持、集中计费分析,这些是拉高ARPU的关键。
数据产品和排行榜维护。与a16z联合发布"State of AI"报告,基于100万亿+token的分析(来源)。排行榜本身成为行业标准,间接为平台引流。
关键合作伙伴:靠谁活着
| 合作伙伴 | 关系 | 重要性 |
|---|---|---|
| OpenAI | 核心提供商,曾独家首发GPT 4.1 | ★★★★★ 流量基石 |
| Anthropic | 核心提供商,Menlo Ventures也是其投资方 | ★★★★★ 模型供给 |
| Google DeepMind | 核心提供商,Gemini图像生成合作 | ★★★★ 多模态拓展 |
| a16z / Menlo / Sequoia | 投资方,也是生态背书 | ★★★★ 资金+品牌 |
| DeepSeek / Qwen | 中国模型,占平台token消费36%(来源) | ★★★★ 价格竞争力 |
| Cline等AI工具 | 原生集成,B2B2C获客渠道 | ★★★☆ 分发杠杆 |
一个有趣的生态关系:Menlo Ventures同时投资了Anthropic和OpenRouter(来源)。这意味着OpenRouter在获取Anthropic模型接入方面有天然优势。
但最大的风险也来自合作伙伴:如果OpenAI或Anthropic限制第三方API访问,OpenRouter的核心供给就会断裂。中国模型占平台36%的token消费(来源),美国出口管制或制裁政策也可能影响这部分供给。
四、团队、融资与市场格局
团队差异
硅基流动的核心团队来自OneFlow原班人马。袁进辉在深度学习框架和编译器领域做了十年,这种技术基因不是招几个工程师能复制的。2024年张实和曾华加入管商业化,说明团队也意识到:光会做技术不够,得有人能把技术卖出去。
OpenRouter的创始人Alex Atallah是OpenSea联合创始人,OpenSea巅峰估值140亿美元。他的价值不是技术,是创业圈的品牌和融资能力。COO Chris Clark管日常运营(来源)。
两种团队配置对应两种打法:硅基流动先技术后商业,OpenRouter先品牌后生态。
融资对比
硅基流动融的钱烧在GPU上,OpenRouter融的钱花在平台上。
硅基流动四轮下来,累计数亿人民币(来源) (来源) (来源)。最新一轮是2025年6月阿里领投的A轮,金额"数亿元"——在AIinfra赛道不算多。阿里投它,要的是生态入场券:算力资源、企业客户渠道、品牌背书。但阿里自己有通义千问和百炼,硅基流动在阿里生态里是"补充"还是"备胎",取决于阿里的战略耐心。这事儿我没法替阿里回答,但作为一个在阿里云上花过钱的人,我的观察是:阿里对"补充型"合作伙伴的耐心通常不超过两年。
OpenRouter 2025年6月拿了a16z和Menlo Ventures共4000万美元(来源),正在谈1.2亿美元新轮,估值约13亿美元。13亿美元 vs 硅基流动的未公开估值,差距不是一点半点。但OpenRouter的收入也更高:年化约5000万美元(来源),推理支出超1亿美元。它的商业模式决定了收入规模可以做得更大,因为不碰算力,没有GPU采购的现金流压力。
市场格局
中国大模型API市场,云厂商占70%以上。阿里云百炼、百度千帆、火山引擎、腾讯云,四家就把盘子分完了。硅基流动在"独立第三方"赛道是头部,但整个赛道加起来可能不到10%。它的真正对手不是OpenRouter,是云厂商。
OpenRouter没有中国市场的问题,因为它主攻欧美。但有个数据值得注意:中国模型(DeepSeek、Qwen)占它平台token消费的36%(来源)。这意味着OpenRouter的竞争力,很大程度上依赖中国模型的低价供给。如果美国出口管制升级,这36%的供给可能出问题。
五、地域分割
硅基流动主攻中国,OpenRouter主攻全球(欧美为主)。两者在地域上几乎没有正面交锋。
硅基流动的本地化优势:国内CDN低延迟、支付宝/微信支付、符合中国数据安全法和算法备案要求、国产模型(DeepSeek、Qwen)优化更深。这些对国内企业客户是刚需。
OpenRouter的全球化优势:GPT-4、Claude等海外闭源模型接入更直接,OpenAI-compatible API生态更成熟,YC品牌在海外开发者中有认知度。
一个有趣的观察:OpenRouter也接入了DeepSeek、Qwen等国产模型,但国内用户访问openrouter.ai不稳定。这意味着OpenRouter在中国市场的用户,主要是两类人——有出海需求的开发者,以及愿意折腾的技术爱好者。mainstream企业客户不会选它。
反过来,硅基流动的国际站(siliconflow.com)2025年6月上线(来源),全球化刚刚起步。它能不能在海外和OpenRouter正面竞争,取决于阿里愿不愿意把海外云资源导给它。
六、核心风险
硅基流动的风险
如果云厂商把推理当附赠品。阿里云买服务器送通义千问API,火山引擎买算力送豆包——这种捆绑打法下,独立第三方的付费API还有多少生存空间?硅基流动的答案是"靠技术优化做出性价比",但这个答案的前提是云厂商的优化能力追不上来。
如果DeepSeek们自建推理服务。DeepSeek已经证明了低成本高性能的可能性,如果它自己把推理API做得足够好用,硅基流动作为中间层的价值就会被压缩。
如果端侧推理成熟。手机、PC上跑大模型的能力越来越强,云端API的需求会下降。这不是短期威胁,但三到五年后可能改变整个赛道的逻辑。
OpenRouter的风险
上游模型厂商提高批发价或限制接入。OpenRouter的利润来自加价(5-5.5%(来源)),如果OpenAI或Anthropic限制第三方API访问,核心供给就会断裂。
地缘政治风险。中国模型(DeepSeek、Qwen)占平台token消费的36%(来源),美国出口管制或制裁政策可能影响这部分供给,且替代来源有限。
商品化压力。开源路由框架(LiteLLM)让企业可以自建路由基础设施,云厂商(AWS Bedrock、Azure OpenAI)也在捆绑类似功能。如果AI行业最终整合为少数几个主导模型,多提供商的复杂性需求下降,OpenRouter的价值主张就会弱化。
七、一个关键判断
这两种模式没有绝对的好坏,只有适合的场景。
如果你相信大模型推理的成本优化还有长期技术红利——比如新的量化算法、新的并行策略、国产芯片适配——那硅基流动的重资产模式更有价值。技术壁垒一旦建立,云厂商也很难短期复制。
如果你相信模型API会标准化、同质化,最终比拼的是渠道效率——那OpenRouter的轻资产模式更灵活。网络效应和用户体验是护城河,技术不是。
我的判断是:短期看OpenRouter更舒服,长期看硅基流动更值钱,但差距没有之前想象的那么大。
OpenRouter的数据飞轮(100万亿+token/年的处理数据(来源))正在构建一种新型壁垒:不是技术壁垒,而是信息壁垒。当你的排行榜成为Karpathy和YC引用的行业标准,当你的路由算法基于全球最大的真实LLM使用数据集持续优化,这个护城河比纯技术优化更难复制。
硅基流动的优势仍然在技术深度和国产芯片适配,但这需要持续的高强度研发投入。阿里能给它多少耐心和资源,决定了这条路的终点。最理想的出路:把推理优化技术做成云厂商的"必选项"——不是和云厂商竞争,而是成为云厂商的技术供应商。
八、对比速查表
| 维度 | 硅基流动 | OpenRouter |
|---|---|---|
| 总部 | 北京 | 美国旧金山 |
| 成立 | 2023年8月(来源) | 2023年(来源) |
| 创始人 | 袁进辉(OneFlow) | Alex Atallah(OpenSea联合创始人) |
| 背景 | 独立创业,后获阿里投资 | OpenSea创始人二次创业 |
| 核心模式 | 自研推理引擎+自建算力 | 纯模型路由聚合 |
| 资产模式 | 重资产 | 轻资产 |
| 成本结构 | GPU 40-50%,研发25-30%(来源) | 平台研发+边缘计算(来源) |
| 毛利率 | 较低 | 较高(加价5-5.5%(来源)) |
| 技术壁垒 | 高(编译优化、量化压缩) | 中(路由算法、数据飞轮) |
| 模型数量 | 150+(来源) | 400+,60+提供商(来源) |
| 注册用户 | 900万+(来源) | 250万+开发者(来源) |
| 年化收入 | 未公开 | ~5000万美元(来源) |
| 主力市场 | 中国 | 全球(欧美) |
| 官网语言 | 中文+英文 | 英文 |
| 支付方式 | 支付宝/微信/银行卡 | 信用卡/加密货币 |
| 国内访问 | 流畅 | 不稳定,需代理 |
| 国产模型优化 | 深度优化 | 基础接入(占平台token消费36%(来源)) |
| 海外闭源模型 | 通过代理/合作 | 原生支持(GPT 4.1独家首发(来源)) |
| 累计融资 | 数亿元人民币 | ~4000万美元+正在谈1.2亿美元(来源) |
| 最新轮次 | A轮(阿里领投)(来源) | Series A(a16z+Menlo Ventures)(来源) |
| 估值 | 未公开 | ~13亿美元(谈判中)(来源) |
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- 洛谷-P7998 [WFOI - 01] 猜数 题解
- AI 相关概念之(基础层级):AI、ANI、AGI、ASI
- 深度解读 AEC-Q100 Rev-J:为什么先进制程芯片的 ESD 电压降低?车规标准“放水”了?
- 硅基流动 vs OpenRouter——两种AI Infra模式的取舍
- Vector 选型与实战:vs OTel / Logstash / Fluentd 全维对比,及统一日志与指标管道的 AWS ECS 落地
- "MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders" 论文笔记
- 开源分享|用MicroPython 做了个 AI 小鸡,它会长大,还记得我所有的情绪
- HEIC图片转换器(HEIC转JPG/PNG/WEBP/BMP/TIFF/ICO)
- 5 分钟上手 AgentRun:从注册到第一个 Agent 运行
- transformer进阶之路:#4 attention从如何「工作」到「为何」如此高效

