视频生成模型如何降本?火山引擎发布大模型训练视频预处理方案
创始人
2024-12-16 17:02:21
0

新京报贝壳财经讯(记者 白金蕾)10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,该方案能解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

会上,抖音集团视频架构负责人王悦还透露了字节自研视频编解码芯片的最新进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,成本节省了95%以上,还在2024MSU世界编码器大赛中一举夺得最佳ASIC编码器。

对训练视频进行预处理是保障大模型训练效果的重要前提。王悦表示,对大模型厂商而言,预处理过程中面临着诸多挑战。“首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

火山引擎此次发布的大模型训练视频预处理方案依托自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

Bytedance Research负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了支撑。豆包视频生成模型PixelDance于今年9月发布,解决了多主体运动的复杂交互、多镜头切换的内容一致性难题。

此次活动中,火山引擎还发布了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案等,从视频的生产端、交互端到消费端,全链路融入了AI的能力。

编辑 岳彩周

校对 穆祥桐

相关内容

珠海直饮水项目获奖,它将如...
拧开水龙头,清冽甘甜的直饮水潺潺流出,可直接饮用——这不再是高端社...
2025-12-26 23:41:18
苹果(AAPL.US)股价...
尽管在2025年上半年表现逊于“科技七巨头”同行及大盘,苹果(AA...
2025-12-26 22:20:15
超越 SEO:AI 引擎优...
指导网络营销工作超过二十年的搜索引擎优化学科,如今正被生成式人工智...
2025-12-26 17:20:52
AI时代,如何培养创新人才...
12月18日下午,在深圳市福田区核心地段,“鲲鹏少年院”的第一个校...
2025-12-26 11:21:07
AI时代,中国AI如何下好...
文 | 佘宗明 “AI的下一轮变革,是以AI工厂重构生产力逻辑,以...
2025-12-26 10:00:31
如果这个动作坚持不到10秒...
闭上双眼单腿站立你能站多久? 如果你尝试过单腿站立,就会发现保持平...
2025-12-26 09:01:52

热门资讯

孕妈检测出胎儿没有“胎心”究竟... 原标题:孕妈检测出胎儿没有“胎心”究竟为何?多半是这4种原因,预防下 昨天小樱...
耳聋耳背知识分享-----耳朵... 耳朵听力下降恢复方法首先要找出听力下降的病因,其次针对病因进行对症治疗。 耳朵听力下降,如何恢复听...
原创 如... 肺是人体非常重要的器官,空气中的很多灰尘和垃圾都会随空气进入肺部,所以肺部的清洁是非常重要的。我们可...
激光术后护理指南:如何科学恢复... 二氧化碳激光是一种常用于去除瘢痕、色素沉着、皱纹和其他皮肤问题的治疗方法。它通过发射高能量的二氧化碳...
如何有效应对低血压问题,提升生... 血压低,这个问题在生活中并不罕见。很多人可能会觉得,血压低就像是个小毛病,不用太在意。但实际上,低血...
孩子自控力差?家长如何引导培养 孩子自控力差?家长如何引导培养 在孩子的成长过程中,自控力是一项至关重要的能力。它关乎孩子的学业表现...
原创 婴... 在宝宝的成长过程中,奶粉作为重要的营养来源,其选择至关重要。那么,什么样的婴儿奶粉比较好呢?奶粉的营...
存款利息怎么算?湖南农商行存款... 导读湖南农商行存款利息怎么算?湖南农商行作为湖南最大的股份制银行,它是一家地方性、集约化、国际化、股...
宝宝不吸奶瓶的问题如何解决 原标题:宝宝不吸奶瓶的问题如何解决 宝宝出生后不久,有些妈妈因为要上班而不得不...
科普|秋季“花粉过敏”症状有哪... 不少人在秋冬来临之际,会出现反复打喷嚏、流鼻涕、鼻塞、眼睛发痒、呼吸不畅等症状,这有可能是遭遇了“花...