封面图片: 网络服务器和线缆。照片来自 Piotr Cichosz(Pexels,免费使用)。

互联网本该是伟大的平等器——一个去中心化、无需许可的网络,任何人都可以自由发布、连接和创造。在1990年代到21世纪初的短暂时刻,它确实如此。随后平台崛起,算法接管一切,开放网络退缩到数字生活的一个日益狭小的角落。

如今,同样的剧本正在人工智能领域重演——只是这次的速度更快,规模之大让平台时代看起来像是一场预演。

2026年的AI产业由不到十二家企业控制,其中四家公司——英伟达(NVIDIA)、亚马逊(Amazon)、谷歌(Google)和微软(Microsoft)——拥有整个堆栈每个关键层面的基础设施。芯片、云计算、基础模型和训练数据:每一个环节都被一两个玩家主导。其结果是科技行业历史上最为集中的市场。

这不是必然的。这不是技术上的必要。这是一个选择——我们仍有时间做出不同的选择。

2026年的AI中心化现状

硬件瓶颈

从物理层开始。每一个AI模型——每一个聊天机器人、每一个图像生成器、每一个智能体——都在GPU上运行。而一家公司生产的GPU驱动着几乎所有模型。

根据英国竞争与市场管理局(CMA)2025年9月发布的AI基础模型更新报告,英伟达在2026年初控制着约92%的AI芯片市场。没有第二个同等规模的可替代来源。AMD的MI系列加速器只占市场份额的一小部分。Cerebras、Groq、SambaNova、Tenstorrent等初创公司生产专业替代芯片,但它们的总产量与英伟达相比微不足道。

这不仅仅是一个市场份额数据。这意味着每一家想要训练或部署AI的公司、研究机构、政府都必须通过英伟达。该公司决定谁能获得最新芯片的配额、以什么价格、在什么条件下。当需求超过供应时——自2023年以来一直是常态——客户需要等待数月才能拿到已经付过款的硬件。

CMA的分析指出,“AI价值链的集中化推动了现有企业的垂直整合,可能限制竞争并抑制自下而上的创新。”

算力收费站

即使你有了芯片,还需要一个地方来运行它们。承载AI工作负载的云计算市场由三家公司控制:亚马逊云服务(AWS,31%)、微软Azure(26%)和谷歌云(11%),数据来自Synergy Research Group 2026年第一季度的报告。这三家合计占全球云基础设施支出的68%。

在AI领域,集中度更为极端。微软通过与OpenAI的深度合作,成为部署最广泛的基础模型的主要算力提供商。谷歌在自己的云上运行自己的模型。亚马逊提供英伟达硬件与其专有的Trainium和Inferentia芯片组合。

如果你是一个正在构建AI产品的初创公司,你的云提供商可能成为你最大的风险。竞争对手同时也是你的客户?你的定价可能一夜之间改变。你依赖的一个功能?它可能在数周的通知期内被废弃。

据彭博社估计,四大科技公司——英伟达、亚马逊、谷歌和微软——在2023年至2026年间合计投资了6500亿美元用于AI基础设施的资本支出。这是任何其他人都无法匹配的投资。大型科技公司的算力能力与其他所有机构之间的差距不是一道鸿沟——而是一座峡谷。

数据护城河

数据是AI的原材料。但最丰富的数据源由控制算力的同一批公司掌控。

谷歌拥有搜索数据、YouTube转录和Google Docs。Meta拥有Facebook和Instagram。微软拥有LinkedIn和GitHub。亚马逊拥有购物数据和AWS使用遥测数据。这些不仅仅是大型数据集——它们是专有的、不断更新的、受法律保护的。

新进入者面临结构性劣势。OpenAI的GPT模型基于网络数据训练——其中大部分来自公开的Common Crawl语料库。但高质量数据越来越多地被锁定在付费墙和服务条款限制之后。

据路透社研究所数据,2025年79%的美国主要新闻网站屏蔽了OpenAI的网络爬虫。曾经免费用于训练的Reddit数据现在仅通过付费协议授权使用。《华尔街日报》母公司道琼斯于2025年10月起诉Perplexity AI侵犯版权,认为"未经许可不能大规模摄取信息"。训练数据的法律环境正从开放转向专有——拥有现有数据护城河的现有企业从中受益最多。

哈佛大学肯尼迪学院贝尔弗中心在2026年1月的分析中指出,“生成式AI市场通常被描述为由少数大玩家主导的赢家通吃环境。虽然这种说法有一定道理,但实际动态更为复杂。这个领域的竞争可能比头条新闻所暗示的更加激烈。“但即使这个更为细致的评估也承认,基础层——算力和数据——仍然高度集中。

模型双头垄断

在这些层之上是模型层。在专有前沿模型领域,两个名字占据主导:OpenAI和Google DeepMind。Anthropic稳居第三,但差距明显。

训练前沿模型的成本本身已成为进入壁垒。GPT-4的估计训练成本在1亿到1.5亿美元之间。Google DeepMind的Gemini Ultra据报道耗资约6.5亿美元。到2027年,一些估计表明下一代模型的训练成本可能超过每轮8亿美元。进入前沿模型竞赛的成本已不再是一个商业决策——这是一个国家级投资决策。

开源模型在一定程度上抵消了这种集中化。Meta的Llama 3被广泛使用。Mistral的模型在特定基准上可与GPT-4竞争。DeepSeek-V3据报道仅以560万美元的训练成本,证明了前沿级别的模型可以在大型科技公司支出的一小部分下构建。但开放模型仍然依赖相同的硬件和云基础设施。一个运行在AWS租赁的英伟达硬件上的开放模型,在软件层是自由的,但在其下的每一层都是被俘获的。

为什么中心化限制了进步

AI的中心化不仅仅是一个市场结构问题。它对AI能做什么、谁能从中受益以及技术如何演变有着直接的影响。

创新的瓶颈。 当一家公司控制GPU供应时,AI研究的步伐就取决于该公司的生产能力和分配优先级。当三个云提供商控制算力接入时,AI应用的多样性受限于这些提供商选择支持的范围。CMA关于"抑制自下而上的创新"的担忧并非理论性的——它描述了一个基础设施守门人决定谁能参与的市场。

单点故障。 在单一生态系统的数据上训练的模型会继承该生态系统的偏见和盲点。如果谷歌的模型占主导地位,AI系统中嵌入的世界观将是谷歌的世界观。如果英伟达的CUDA平台是GPU计算的唯一可行路径,整个行业的软件堆栈就取决于一家公司对CUDA兼容性的持续投资。这些是任何公司治理都无法完全缓解的结构性风险。

没有问责的权力。 控制AI基础设施的公司不向民主机制负责。它们不受公共机构所面临的透明度要求约束。英伟达不公布其GPU分配标准。OpenAI不披露其安全测试方法。谷歌不透露其模型训练数据的过滤方式。这些都是产生公共后果的私人决策——而公众没有参与的机制。

牛津大学的Rest of World项目在2026年1月的报告中将这种动态描述为"硅谷主权者”(silicon sovereigns)的崛起——这些私营公司对AI基础设施的决策实际上对世界其他地区起到了治理功能。没有自己AI供应链的国家越来越依赖于它们无法影响的企业路线图。

为什么简单的解决方案行不通

对中心化的本能反应是"让它去中心化”。但去中心化不是一个可以勾选的选项——它是一种必须在堆栈的每一层都加以实现的设计理念。许多善意的尝试之所以失败,是因为它们只解决了某一层的问题,而让其他层仍然保持集中。

AI计算资源的区块链代币模型。 有几个项目试图创建去中心化的算力市场,让GPU所有者可以出租闲置容量。Akash Network、Render Network等提供分布式算力的市场。理论上这听起来像是一个解决方案。实际上,这些网络处理的算力需求微乎其微。分布式GPU网络的延迟、可靠性和一致性在训练负载方面无法与集中式数据中心匹敌。在推理方面,这些网络表现更好,但仍然是小众应用。

没有开放基础设施的开放权重模型。 将模型的权重作为开源发布是有价值的——但这并不能使系统去中心化。一个在AWS上运行的开放权重模型仍然被AWS俘获。真正的去中心化要求每一层——硬件、算力、数据、软件——都是独立可控的。

联邦学习和设备端AI。 苹果、谷歌等公司已经投入设备端AI,在本地处理数据。这种架构本质上比基于云的AI更加去中心化。但设备端模型的能力有限,而且这些模型的训练仍然在集中式基础设施上进行。用户的设备只是一个推理端点,而不是模型开发的参与者。

这些方法并没有错——它们只是不完整。不能解决硬件和算力层的去中心化方案,留下的是最关键、最未改变的依赖关系。

以互联网为蓝本

最初的互联网作为一个去中心化系统取得了成功,因为它具备当前AI堆栈所缺乏的四个特性:

无需许可的创新。 任何人都可以开发新的协议、服务或应用程序,无需向中央机构请求批准。网络、电子邮件和VoIP都是这样诞生的。今天的AI在每一层都需要许可——云提供商批准、GPU分配、API访问、数据许可。

模块化架构与开放标准。 TCP/IP、HTTP、SMTP、DNS——这些开放标准创建了一个模块化系统,每一层都可以独立发展。AI在基础设施层没有TCP/IP的等价物。CUDA是专有的。领先的模型架构是专有的。即使是竞争服务使用的API也没有标准协议。

资源的分布式所有权。 在互联网模式中,用户拥有自己的计算机,他们的ISP是独立的,他们的数据保存在自己控制的服务器上。在AI模式中,用户什么都不拥有——既没有运行推理的硬件,也没有模型权重,也没有塑造模型行为的训练数据。

基于公地的基础资源开发。 互联网的关键协议由开放社区——IETF、W3C、ICANN——开发,而不是由单个公司。AI中最接近的对应物——开源模型社区——仍然在模型以下的每一层依赖专有基础设施。

互联网的去中心化并非偶然。它是工程师和研究人员深思熟虑的设计选择的结果,他们明白基础设施控制权的集中会导致对该基础设施所赋能的一切的集中控制。AI没有以同样的理念构建,其后果在它的市场结构中清晰可见。

去中心化的逆流

有一些真正的努力在试图逆转集中化趋势,值得认真对待。

开放权重前沿模型。 Meta的Llama 3、DeepSeek-V3和Mistral Large已经证明,开放权重模型可以在许多基准上与专有替代方案竞争。DeepSeek的突破——以560万美元的训练成本实现GPT-4级别的性能——尤其重要,因为它表明前沿AI的资本壁垒并非绝对。

去中心化微调平台。 Chutes和FedML提供平台,开发者可以在去中心化的算力基础设施上微调模型。虽然仍处于早期阶段,这些平台代表了一种模式,即模型定制——可以说将是AI为商业创造大部分价值的领域——不需要集中式基础设施。

点对点AI推理。 Exo、Ollama等工具使得在消费级硬件上运行模型成为可能。一台MacBook Pro现在可以在可用速度下运行一个700亿参数的模型。这对生产级工作负载来说无法与云端推理竞争,但它为不依赖任何提供商API的AI使用创造了一条路径。

数据合作社。 Data Provenance Initiative和Common Corpus等项目正在构建公开治理的数据集,无需向现有企业购买许可。其理念是,训练数据应该像互联网协议一样,成为一个公地——由贡献的社区治理,而不是由摄取数据的公司控制。

去中心化AI研究。 Nous Research和EleutherAI是去中心化、社区驱动的AI研究组织的例子。这些团体在企业研发结构之外开发模型、基准和技术。它们的输出——包括Open LLM Leaderboard和Pile数据集——已成为更广泛的开源AI社区的基础设施。

真正的去中心化需要什么

如果我们希望AI走的路径更接近最初的互联网而不是平台时代,有几件事情需要发生——而且需要在堆栈的特定层面发生。

硬件层面的竞争。 英伟达在AI芯片市场92%的份额是整个AI堆栈中最集中的单一点。可行替代方案的出现——AMD的MI系列、Groq和Cerebras等初创公司,以及云提供商可能推出的专用推理芯片——是最重要的长期变革。即使实现70-30而非92-5的有意义的竞争,也将极大地改变市场动态。

GPU替代品的开放编译器和软件栈。 英伟达的主导地位由其专有软件平台CUDA加固,该平台将开发者锁定在英伟达硬件上。OpenCL和SYCL等开放替代方案存在,但缺乏CUDA的生态系统成熟度。一个由多家硬件供应商支持、真正开放的GPU编程标准将降低转换成本,促进硬件层面的竞争。来自LLVM的开放标准MLIR框架是一个有前景的方向,但需要更广泛的行业采纳。

数据作为公地,而非护城河。 训练AI的数据由我们所有人共同创造——每一篇发布的网页、每一条评论、每一张上传的图片。将这些数据视为抓取它们的公司的专有财产是一个政策选择,而非技术必然。数据合作社、公共训练数据集以及承认训练数据集体所有权的法律框架可以改变权力平衡。欧盟的《数据治理法案》和拟议的AI责任指令通过创建数据共享和算法问责框架,正在朝这个方向迈出步伐。

基础设施层面的监管干预。 CMA关于AI基础模型的报告之所以引人注目,正是因为它明确指出了AI价值链中垂直整合的风险。将AI基础设施——芯片、云计算、训练数据——视为受接入要求约束的公用事业或必要设施的监管框架,将是现行政策的重大突破。欧盟的《数字市场法案》将某些平台指定为受特定义务约束的"守门人",为这种方法提供了一个部分模型。

自下而上的基础设施投资。 大型科技公司在2023年至2026年间6500亿美元的AI基础设施支出没有相应的公共投资。国家AI研究云、大学的公共GPU集群以及政府资助的开放模型开发将创建不受任何单一公司控制的基础设施。美国国家AI研究资源(NAIRR)试点项目朝这个方向迈出了一步,但其3000万美元的预算与企业支出相比微不足道。韩国计划到2027年投资9.4万亿韩元(约70亿美元)建设AI基础设施,提供了一个更为匹配的模式。

去中心化意味着什么,不意味着什么

需要精确理解AI去中心化的含义——以及它不意味着什么。

去中心化并不意味着每个AI应用都必须在本地硬件上运行。由于规模、效率和能力的考虑,云端AI将继续占主导地位。目标不是消除集中式基础设施,而是确保在堆栈的每一层都有多个独立的选项——没有任何一个提供商能够成为守门人。

去中心化并不意味着所有模型都必须是开源的。专有模型将与开放模型共存,两种模型都可以成为健康生态系统的一部分。目标是确保AI发展的默认状态是无需许可的创新,而不是被守门人管控的访问。

去中心化确实意味着AI的基础设施——芯片、云、数据——应该以分散控制而非集中控制的方式组织。这不是一个反企业的立场。这是一个支持创新的立场。历史上最具活力的技术生态系统——互联网、个人电脑、网络——都建立在分布式控制结构之上。技术领域最集中的市场——大型机时代、移动应用双头垄断——产生了更慢的创新和更高的进入壁垒。

结论:岔路口

2026年的AI产业正处于一条岔路口,与互联网产业在2000年代中期所面临的相似。一条道路通向进一步的中心化——AI的全栈由少数企业控制,创新需要许可,技术的利益根据市场力量而非公共价值分配。另一条道路通向更加分布式的架构——多个提供商在每一层竞争,开放标准实现互操作性,AI的基础是公地而非企业护城河的集合。

第一条道路是阻力最小的道路。如果不采取任何有意的行动,这就是默认结果。它不需要政策制定者、技术专家或公众做任何事情。

第二条道路需要工作。它需要将AI基础设施视为基本资源的监管框架。它需要公共投资建设开放基础设施。它需要对开源硬件和软件栈的技术贡献。它需要企业选择互操作性而非锁定效应——即使锁定更有利可图。

但第二条道路通向一个服务于更广泛人类需求的AI产业——而不仅仅是为控制堆栈的那些公司的需求服务。

问题不在于2026年的AI会是中心化的还是去中心化的。问题在于,在窗口关闭之前,谁将致力于建设替代方案。

参考文献