十亿用户、32万亿条日处理量:LinkedIn为何弃用了Kafka?
创始人
2026-02-09 10:22:02
0

你听说过Apache Kafka吧?就是那个几乎所有财富 500 强企业都在使用的传奇分布式事件流平台?好吧,现在事情变得更复杂了。Kafka的发源地和“骄傲的父母” LinkedIn已经开始转向其他平台了。这就像看着一位名厨突然对自己的招牌菜失去了兴趣,转而点外卖一样。

等等!不是点外卖!LinkedIn他们直接打造了一家名为Northguard的崭新餐厅。

Kafka死了吗?我们都活在谎言中吗?让我们(温和地)剖析一下现状,看看背后究竟发生了什么。

起源故事:卡夫卡还是个“金童”的时候

2010年,LinkedIn遇到了一个难题。他们拥有9000万用户(还记得当时的用户数量吗?),数据量庞大,不堪重负。他们需要一种方法来实时传输日志和事件。于是,Kafka应运而生。

它具有革命性意义,速度极快,是 Apache 软件基金会的“宠儿”。快进到 2026 年,LinkedIn 如今拥有12 亿用户,每天处理超过32 万亿条记录。

基本上,孩子长大了,但房子却没变大。LinkedIn需要的不仅仅是一栋更大的房子;他们需要的是一套全新的架构。

裂缝为何开始显现

Kafka固然出色,但在LinkedIn这种“行星级”规模下,它开始像个喜怒无常的青少年一样胡闹。这就是工程师们开始寻找替代方案的原因:

  • 元数据噩梦:想象一下,你要管理 150 个集群,每个集群有 40 万个主题。Kafka 的中央“控制器”会成为巨大的瓶颈。这就像只有一个经理管理 1 万名员工一样。所有人都在等待签名,导致所有工作都无法完成。
  • “暂停世界”式的重新平衡:在 Kafka 中添加一个新的经纪商就像搬进新公寓,但你必须把整栋楼里的所有家具都搬走,才能放下一把椅子。这既缓慢又痛苦,而且风险极高。
  • 资源倾斜:某些分区“过热”,而另一些分区则“过冷”。这会导致磁盘使用率不均,让工程师们在凌晨三点抓耳挠腮。

Northguard登场:新王者降临

LinkedIn 不仅仅是修补了 Kafka,他们还构建了Northguard。这不仅仅是“Kafka 2.0”,而是一次根本性的重新设计。以下是它获胜原因的简要概述:

1、日志分块(秘诀)

Northguard 不采用整体式分区,而是将日志分割成1GB 的小块。这就像用一堆轻便的小背包代替一个笨重的大行李箱。它使负载均衡变得自动且无缝。

2、去中心化元数据

不再受单控制器瓶颈的限制。Northguard 使用基于 Raft 的状态机将元数据分片分布在整个集群中。它采用高科技、分布式架构,这意味着系统没有可能出现故障的“核心”。

3、Xinfra:神奇的迁移层

你不可能简单地一键切换32万亿条每日记录。LinkedIn 构建了Xinfra,一个虚拟化的发布/订阅层。它就像一个万能遥控器,允许应用程序同时与 Kafka 和 Northguard 通信。

Kafka vs Northguard:巅峰对决

卡夫卡对我们其他人来说已经过时了吗?

答案是否定的。

LinkedIn是个例外。我们大多数人在午饭前都不会处理PB级的数据,对于 99% 的公司而言,Kafka(尤其是像 Confluent 这样的托管版本)仍然是黄金标准。

这就像 LinkedIn 为了追求 200 英里/小时的速度而打造了一辆一级方程式赛车一样。你可能只需要一辆可靠的 SUV 就能上班。除非你今天也迎来了十亿用户,否则别因为 LinkedIn 的一篇工程博客文章就重写你的整个技术栈。

常见问题

1)今天可以下载 Northguard 吗?

不,目前是LinkedIn内部使用的功能。他们暗示过以后会开源,但就目前而言,这是他们的“秘密武器”。

2)我应该停止学习 Kafka 吗?

绝对不是。Kafka 是这个行业的“面包和黄油”,Northguard 是“鱼子酱”。你需要面包才能生存。

3)迁移有多难?

借助 Xinfra 这样的工具,LinkedIn 让 DevOps 看起来轻而易举(他们 90% 的应用都已经基于 Xinfra 了!)。但对我们其他人来说,DevOps 本身就已经够让人困惑了,所以或许应该先从基础知识入手。

结语

LinkedIn 取代 Kafka 是工程史上一个重要的里程碑。它表明,即使是最成功的工具,在被推向极限时也会有其局限性。

Northguard 会不会成为下一个我们所有人都要在三年内学习的大型开源项目?也许会。但就目前而言,我们不妨先赞叹一下这家公司惊人的工程“灵活性”:仅仅因为速度不够快,就替换掉了自己曾经改变世界的发明。

作者丨Cloud With AzeemC 编译丨dbaplus社群

来源丨网址:https://cloudwithazeem.medium.com/linkedin-kafka-replacement-new-streaming-system-76e56073eb97

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn

相关内容

宣讲家评论:数智浪潮下,A...
编者按:当前,人工智能正以前所未有的力量,为中国式现代化注入强劲动...
2026-02-09 16:41:04
原创 ...
本文章中,涉及的所有患者及家属姓名等信息,均已作隐私保护处理 本文...
2026-02-09 15:00:49
新春走基层·大国工程新春看...
新华社兰州2月8日电 题:青春正当燃!兰张高铁的“数智脊梁”新华社...
2026-02-09 10:41:06
十亿用户、32万亿条日处理...
你听说过Apache Kafka吧?就是那个几乎所有财富 500 ...
2026-02-09 10:22:02
原创 ...
最近一段时间,互联网巨头开始密集布局养老产业。 1月中旬,拥有较强...
2026-02-09 07:21:03

热门资讯

孕妈检测出胎儿没有“胎心”究竟... 原标题:孕妈检测出胎儿没有“胎心”究竟为何?多半是这4种原因,预防下 昨天小樱...
原创 如... 肺是人体非常重要的器官,空气中的很多灰尘和垃圾都会随空气进入肺部,所以肺部的清洁是非常重要的。我们可...
耳聋耳背知识分享-----耳朵... 耳朵听力下降恢复方法首先要找出听力下降的病因,其次针对病因进行对症治疗。 耳朵听力下降,如何恢复听...
激光术后护理指南:如何科学恢复... 二氧化碳激光是一种常用于去除瘢痕、色素沉着、皱纹和其他皮肤问题的治疗方法。它通过发射高能量的二氧化碳...
如何有效应对低血压问题,提升生... 血压低,这个问题在生活中并不罕见。很多人可能会觉得,血压低就像是个小毛病,不用太在意。但实际上,低血...
孩子自控力差?家长如何引导培养 孩子自控力差?家长如何引导培养 在孩子的成长过程中,自控力是一项至关重要的能力。它关乎孩子的学业表现...
原创 婴... 在宝宝的成长过程中,奶粉作为重要的营养来源,其选择至关重要。那么,什么样的婴儿奶粉比较好呢?奶粉的营...
存款利息怎么算?湖南农商行存款... 导读湖南农商行存款利息怎么算?湖南农商行作为湖南最大的股份制银行,它是一家地方性、集约化、国际化、股...
宝宝不吸奶瓶的问题如何解决 原标题:宝宝不吸奶瓶的问题如何解决 宝宝出生后不久,有些妈妈因为要上班而不得不...
郑州银行大额存单利率:1、活期... 导读2022郑州银行大额存单利率一、存款利率:1、活期存款:0.3%2、整存整取:三个月1.60%,...