当大模型竞争从参数规模转向落地成效,微博下场了。
11月18日,微博发布其首个自研开源大模型“VibeThinker”,模型规模仅15亿参数,训练成本被控制在约7800美元。
在大模型成本与资源壁垒不断被拉高之际,为何微博选择在此时入场?其选择的轻量化技术路径是否意味着大模型竞争已出现新的分叉?
11月19日,微博AI(人工智能)研发负责人在接受《每日经济新闻》记者(以下简称“每经记者”)采访时表示,微博并不是要和行业头部比拼算力,而是回到微博的核心场景,把真正有效的能力沉淀下来。他认为,大模型不必一味追求规模增大,而应围绕内容理解、用户兴趣分层、文本生成等关键场景进行针对性训练。
在用户增长趋稳、信息流分发效率成为竞争焦点的背景下,自研模型既是技术选择,也是一种商业变量。更关键的问题在于:微博的轻量化路线能否真正带来平台体验或商业化效率的改善?
押注小模型:VibeThinker背负成本优化期待
当前,通过增加参数量来提升模型能力依旧是大模型厂商们的主流选择,部分前沿模型的参数规模已超过万亿级,埃隆·马斯克旗下的xAI计划明年初发布的Grok 5预计会把模型参数规模推高到6万亿左右。
微博AI研发负责人对每经记者表示,无论是从模型制作成本、AI应用成本、技术开放性等方面,这种模式都是不可持续的。
站在推动AI应用普惠的角度,已有厂商在大模型技术“摸高”的同时,开始将目光转向小模型。
上述研发负责人指出,业界普遍认为小模型在解决复杂任务和逻辑推理方面存在天生劣势,这也是阻碍其广泛应用的核心障碍。但他进一步解释道,小模型在实际应用中具有天然优势:模型规模较小意味着服务响应更快、计算成本更低,同时更易于在特定场景下进行优化。
“我们在实际AI应用中发现,模型规模过大导致服务慢、成本高、用户体验差等,这促使我们探究小模型复杂逻辑能力的问题⋯⋯经过一些针对性的探索和技术改进,小模型经过行业特有数据和合理训练方法,也可以具备强大的逻辑推理能力。”微博AI研发负责人表示。
记者注意到,在整体业绩增速放缓的背景下,微博正通过AI应用寻找新的增长路径。
财报显示,微博三季度净收入为4.42亿美元,同比下降5%,归属于公司股东的净利润达到2.21亿美元,高于去年同期的1.31亿美元。
数据背后,AI应用正在发挥越来越重要的作用:三季度,微博智搜MAU突破7000万,DAU和检索量环比增长超过50%,搜索总检索量环比提升20%。AI技术正在成为微博推动搜索生态增长、增强平台活跃度的重要工具。
“评论罗伯特”成小模型实验场
VibeThinker未来在微博的首要落地场景,很可能是其最为出圈的官方评论机器人“评论罗伯特”。
2023年底,微博推出“评论罗伯特”,目标是在用户发帖后自动生成评论,以活跃社交氛围为核心。它自称是“天生的捧哏”“有趣的灵魂”“不知疲倦的显眼包”,被网友戏称为“赛博街溜子”。
微博用户“张俊林say”(微博AI研发人员)在其微博中提到,团队在研发评论工具“罗伯特”过程中,充分挖掘了微博丰富的心理学领域数据,增强了模型在心理指导和情感抚慰上的能力。今年初,随着DeepSeek-R1开源论文中强化学习方法的公布,团队进一步制作了针对评论场景的深度思考训练数据,并训练Reward模型,推出深度思考版本的罗伯特。
然而,基座模型体量庞大,深度思考过程耗时且成本高昂。这也正是VibeThinker诞生的初衷:探索一种逻辑推理能力同样出色、但规模更小的模型,替代大模型,使每条评论都能经过深度思考。换言之,VibeThinker并非直接作为评论罗伯特的底层模型,但其研发起点源于优化评论应用的实际需求。
尽管VibeThinker已对外开源,但上述微博AI研发负责人在接受每经记者采访时强调,VibeThinker仍处于实验阶段,尚未在实际产品中大规模应用。当前开源版本主要侧重展示模型在逻辑推理、竞赛数学和编程能力方面的潜力。“有些人会认为这是一种垂直领域的能力增强,这是一种误解,逻辑推理能力目前是大模型最关键的能力,而这种能力的提升会带动模型解决现实场景的复杂问题。”
同时,上述负责人表示,未来,VibeThinker将计划在To C产品中首先应用,尤其是在“评论罗伯特”这种能体现出微博数据优势和特色的应用中采用,利用在微博中挖掘的优质领域数据来调整VibeThinker,然后考虑逐步扩展到搜索、推荐等大量消耗算力的场景。
每日经济新闻