图片来源:Unsplash
企业关系的紧张可能导致不愉快的分道扬镳。但微软与OpenAI 正引领着联盟关系的新时代——这种模式允许 OpenAI 自由与其他云服务提供商展开合作。
过去三年间,当OpenAI 从一个小型研究实验室膨胀为全球最具价值的初创公司时,有一家企业几乎包揽了其每年高达数十亿美元的人工智能服务器开支:微软。
然而近几个月,OpenAI 接连宣布与多家微软竞争对手达成巨额协议,这些交易表明 ChatGPT 创造者所需的计算能力已远远超出其昔日独家云合作伙伴所能提供的规模。
据一位知情OpenAI 员工透露,这些协议规模之大,使得 OpenAI 计划从现在到 2030 年底向甲骨文等主要竞争对手租用服务器的支出,将超过其向微软本身的采购金额。OpenAI 已为截至 2030 年的服务器支出编列了惊人的 4500 亿美元预算 。
到2030 年,OpenAI 在 Oracle 服务器上的支出或将超过微软。
OpenAI 不断增长的计算需求导致其与微软独家协议走向终结。
微软高管曾对数据中心过度建设的后果感到担忧。
这些预测仍存在诸多变数。由于对这家初创企业130 亿美元的投资,微软拥有优先满足 OpenAI 算力需求的权利——未来几年若同意提供更多算力支持,可能重塑 OpenAI 的支出计划。而 Oracle 也可能无法如期兑现其对 OpenAI 的承诺。
微软与OpenAI 的合作关系曾一度是人工智能时代最具影响力的联盟,它既为微软的 Azure 云业务注入了强劲动力,也助推了 OpenAI 的爆发式增长。虽然最初协议规定微软是 OpenAI 的独家云服务提供商,但随着这家初创公司高管们日益将这一安排视为其蓬勃 AI 野心的潜在桎梏,过去一年间双方围绕合作条款展开了多次艰难谈判。
一位参与微软与OpenAI 谈判的人士承认,两家公司内部对这一合作都存在复杂情绪,但强调双方已找到继续推进的解决方案。
"两家公司内部都有人厌恶这种合作。微软内部存在反对声音,"该人士表示,"OpenAI 内部同样存在异议者。他们有不喜欢的各种理由...但持反对意见的人往往比知情者更远离核心决策层。"
“谈话中当然会有紧张时刻,”他们表示,“这很正常,但最终你们还是会坐下来解决问题。”
就像多数婚姻摩擦的故事都有两面性,OpenAI 的挫败感源于这家初创公司似乎永无止境的计算需求,这些需求每月都在成倍增长。过去一年里,OpenAI 首席执行官萨姆·奥尔特曼频频敦促微软加快扩容步伐以满足需求。
而微软方面,高管们向奥尔特曼解释,由于数据中心建设并网等基础性限制,公司无法按他期望的速度提供算力。据参与讨论的人士透露,首席财务官艾米·胡德及其团队曾向同事表示,过度迎合 OpenAI 的需求可能导致服务器过度建设,恐将造成投资回报风险。
最终,两家公司达成了一项解决方案。据知情人士透露,2024 年夏季,奥特曼与微软 CEO 萨提亚·纳德拉达成共识:鉴于 OpenAI 近期的迅猛发展,微软已不可能继续作为该初创企业唯一的云服务提供商。因此,微软开始允许 OpenAI 与其他云服务商达成合作协议。
开放合作关系
微软已经从承担OpenAI 全部算力需求,转变为允许这家初创公司向竞争对手租用服务器。
其中规模最大的协议是与甲骨文签订的,OpenAI 计划耗资数千亿美元与之合作直至下个十年初期。
这家初创公司还透露已与 CoreWeave 签订了 224 亿美元的云服务合同,另与谷歌达成单独协议,并同意接受英伟达最高 1000 亿美元投资用于自建数据中心融资。
一些微软股东表示,鉴于OpenAI 近期签署的云服务协议规模之大,他们更希望 OpenAI 继续由微软独家满足其计算需求。"坦白说,如果 OpenAI 完全依托 Azure 平台会更好,"Equity Armor Investments 的投资组合经理乔·蒂加伊表示。他管理着两支总价值超过 6000 万美元的基金,其中微软股票占比 2.8%。
尽管如此,微软高管们仍认为允许OpenAI 将部分云业务分流至其他平台是正确决策。根据双方更广泛的合作协议,微软持续从这家初创企业激增的营收中获取 20%的分成 ,并享有免费复用 OpenAI 模型的权限——例如应用于微软 Copilot 软件。尽管 OpenAI 正在使用其他云厂商的服务器,微软仍是唯一为其提供模型训练专用超级计算机的云合作伙伴,这对其计算工作具有至关重要的意义。
与此同时,据两位知情人士透露,部分微软高管认为甲骨文在2032 年前为 OpenAI 额外提供 45 亿瓦数据中心容量的方案在操作上难以实现。高管们还质疑这笔交易最终可能超支,因为英伟达尚未确定其下一代芯片的定价。近几周来,科技行业分析师和投资者群体也公开表达了类似的疑虑。
一些投资者认为,微软在新建数据中心方面的投入策略比甲骨文更为审慎。
"这让微软能够更好地管理人工智能需求的波动,我们可以预见未来会出现起伏,"加贝利基金的投资组合经理亨迪·苏桑托表示。该基金同时持有微软和甲骨文的股份。"微软和甲骨文都是成熟的大型软件公司,因此自由现金流是它们业绩的主要驱动力。在我看来,微软拥有更优的资本支出策略。"
命运多舛
当微软在2023 年初向 OpenAI 投资 100 亿美元时,这家初创公司与如今的巨头形象相去甚远。当时的 OpenAI 仅有一款产品——ChatGPT 的"研究预览版",且尚未从中获得任何收入。
但据直接了解谈判内情的人士透露,这款聊天机器人的用户增长速度远超OpenAI 和微软的预期,迫使双方重新调整微软为这家初创企业提供的算力规模。该知情人士表示,当时 OpenAI 仍在使用微软投资款支付服务器费用。
据曾与高管们交流的前任经理透露,在2023 年达成重磅合作协议后,多位微软高层曾向同事表示,他们认为 OpenAI 的商业模式终将失败——即便其技术足够出色。
双方关系的转折点出现在2023 年 11 月,OpenAI 董事会突然以阿尔特曼在与董事会的部分沟通中"不够坦诚"为由将其解雇。这一消息令微软措手不及。据知情人士透露,即便在董事会火速让阿尔特曼复职后,微软高管们仍开始讨论是否该将 OpenAI 视作普通 Azure 客户而非 VIP 合作伙伴。
“谈话中有紧张的时刻吗?当然有。这种情况在所难免,但你们还是得继续沟通,找到解决办法。”
但最终,OpenAI 仍是微软最重要的客户之一。在随后的一年里,微软投入了前所未有的资金为 OpenAI 建造超级计算机。
据两位参与该项目的知情人士透露,2024 年初,OpenAI 与微软 Azure 部门的高管讨论了为这家初创公司建造巨型数据中心的计划。在 OpenAI 内部,高管们将该计划称为"星际之门"——这个代号后来被用于其与甲骨文和软银联合宣布的数据中心项目。
而微软方面则使用了另一个代号 :"水星"。
当时,微软已在菲尼克斯等地的数据中心为OpenAI 提供了数百兆瓦的计算能力,并刚刚在威斯康星州普莱森特山动工建设新数据中心。这座威斯康星数据中心代号"Fairwater",计划部署专供 OpenAI 使用的超级计算机,耗资数十亿美元,电力需求接近千兆瓦——相当于一个小型城市的用电量。微软原计划在 2026 年前使该数据中心与亚特兰大另一处设施投入运营,而威斯康星的第二座数据中心拟于 2028 年启用。
但阿尔特曼当时已预见到这些数据中心仍不够用。
除了已租用的微软服务器和在建数据中心外,阿尔特曼告知微软:到2030年前,这家初创企业还需要额外数千兆瓦的计算容量。两家公司预估,构建这些设施将使微软再投入数百亿美元,其中大部分成本将用于采购英伟达芯片和数据中心运营所需电力。
微软的萨提亚·纳德拉(左)与 OpenAI 的山姆·奥特曼在五月微软 Build 大会上的合影。图片由法新社通过盖蒂图片社提供。
随着2024 年的推进,威斯康星州数据中心的问题开始考验 OpenAI 的耐心。
据一位项目参与者透露,微软开始遭遇施工延误,导致项目投产时间推迟数月。尽管OpenAI 尚未正式签署租用该数据中心服务器的合同,这家初创公司仍计划使用部分容量,并迫切期待其投入运营。
在2024年年中的一次会议上,阿尔特曼向负责微软数据中心建设的诺埃尔·沃尔施施压,质问为何不能缩短工期。据与会人士透露,沃尔施回应称施工受阻的因素大多超出微软控制范围,例如承包商浇筑混凝土不平整,不得不返工重浇。
另一位与会者表示,阿尔特曼询问是否应该绕过沃尔施,直接向纳德拉反映他的担忧。
微软已采取权宜之计,通过从CoreWeave 等云初创公司租赁服务器来支援 OpenAI。但据参与讨论的人士透露,奥特曼对微软在满足其公司需求方面缺乏紧迫感愈发不满,他与 OpenAI 其他高管多次直接向微软领导层抱怨这一状况。
据亲耳听闻者所述,当时奥特曼向另一位AI 研究员表示,微软拒绝快速新建数据中心是阻碍 OpenAI 成功开发人工通用智能(与人类智能相当的 AI)的最大障碍。
激增的千兆瓦需求
在奥特曼不断催促微软提供更多算力的同时,他开始寻求修改OpenAI 与微软的协议条款,以解除独家合作关系。
2024年初夏,据三位知情人士透露,阿尔特曼向微软提出请求,希望获准与其他云服务商洽谈服务器租赁事宜。一位项目参与者透露,当时威斯康星州首座数据中心的施工问题已导致其启用推迟逾半年。(另一位参与讨论的人士则表示,阿尔特曼寻求与其他云厂商合作的诉求与他对施工延误的抱怨并无关联。)
据当时与纳德拉交谈的人士透露,他对于外界认为微软阻碍OpenAI 发展的看法十分敏感。当时,其公司正面临美国联邦贸易委员会和欧盟监管机构对其投资 OpenAI 的调查。
那年夏天,微软放弃了在OpenAI 董事会中的观察员席位,以避免部分审查。而像埃隆·马斯克这样的 OpenAI 批评者曾公开指责微软"控制"了 OpenAI。
在纳德拉的指示下,2024 年初夏,胡德部门的微软高管与 OpenAI 首席财务官莎拉·弗里亚尔达成协议,允许该公司使用其他云服务提供商。据三位知情人士透露,根据该协议,微软仍对 OpenAI 的云业务拥有优先拒绝权,这意味着微软可以选择为这家初创公司提供额外计算能力,或允许其从别处寻求这些资源。
OpenAI 迅速找到了另一家云服务合作伙伴。2024 年 7 月,该公司与甲骨文达成协议 ,将在德克萨斯州新建一座容量达 1 吉瓦的数据中心。
OpenAI 在微软之外寻求的服务器租赁规模很快将超越这个惊人数字。据参与讨论的人士透露,2024 年底,OpenAI 再次向微软表明,除了从微软获得以及预期从甲骨文获取的容量外,未来几年还需要额外增加数吉瓦的算力资源。
但在内部讨论中,微软Azure 高管们认为——包括微软自己在内——没有任何公司能在如此短时间内实现 OpenAI 所要求的算力规模,两位参与会谈的人士透露。
微软高管在跟OpenAI 的对话中告诫这家初创公司,甲骨文从未应允过 OpenAI 现在提出的这类要求。
据知情人士透露,在一次会议上,微软高管乔恩·廷特向阿尔特曼等人发问:如果 OpenAI 决定需要数百吉瓦规模的数据中心——这个看似天方夜谭的目标需耗费数万亿美元才能实现——微软该如何应对。
该人士称,OpenAI 团队严肃回应道:微软要么选择建设这种规模的基础设施,要么让位给愿意这么做的云服务商。
不过微软仍承诺部分满足OpenAI 对额外算力的诉求。2024 年 12 月,微软同意在威斯康星州为 OpenAI 提供更多容量,该公司计划在当地斥资超 40 亿美元建造第二座数据中心。
当月,微软还同意开放人工智能与甲骨文进行另一项合作谈判以增加算力。七个月后,双方宣布达成4.5吉瓦算力规模的合作协议,其耗电量相当于两座胡佛水坝的发电总量。
2025 年全年,OpenAI 持续与其他公司敲定协议以满足其算力需求。今年早些时候,该公司开始租用谷歌云服务器 。3 月,OpenAI 宣布斥资 120 亿美元租用 CoreWeave 的服务器。上月,该公司公布了迄今最大胆的计划——利用英伟达的 1000 亿美元投资自建数据中心。
在投资者眼中,甲骨文是与OpenAI 合作协议中转型最为惊人的微软竞争对手。这家曾被视作云计算领域陪跑者的公司,其股价在 9 月初飙升 36%,原因是宣布云业务部门未来四年将通过服务器租赁创造惊人的 4000 亿美元收入——这很大程度上得益于与 OpenAI 的合作协议。
尽管如此,微软仍可能从OpenAI 获得巨额收入。这家初创公司今年早些时候告知投资者,计划到 2030 年前花费约 1350 亿美元向微软租赁服务器 ,不过这些预测可能会发生变化。
“这笔交易中涉及到的每一个数字,如今都比我们当初设想的要大,”一位参与微软与 OpenAI 谈判的人士谈及 2023 年双方签约时表示。“现在我们必须思考如何调整它,因为世界变化得太快了。”
与此同时,OpenAI 对囤积算力的野心愈发膨胀。奥特曼近期向同事透露,公司计划到 2033 年实现 250 吉瓦的数据中心算力规模——相当于美国当前峰值用电量的三分之一。
参考资料
https://www.theinformation.com/articles/microsoft-let-openai-play-field?rc=p2bxcy
编译:ChatGPT