如何在AI赋能中平衡创新与挑战?巢文涵:从训练和创造AI走向调用和激发AI潜力
创始人
2024-05-21 09:08:23
0

原标题:如何在AI赋能中平衡创新与挑战?巢文涵:从训练和创造AI走向调用和激发AI潜力

每经记者:王郁彪 每经编辑:文多

北京航空航天大学计算机学院副教授巢文涵进行主旨演讲 图片来源:每经记者 韩阳 摄

AI大潮汹涌,真实与虚拟,正在被无限模糊。2024开年,OpenAI用它的首个视频生成模型Sora宣告了一个AI新阶段的到来——仅凭简单的文字描述,便可深度模拟真实物理世界,生成最长60秒的拟真视频。

如果把AI比作刚出生的婴儿,大语言模型的诞生则意味着它开口讲话,Sora的面世相当于他/她睁开了双眼,并把自己观察到的一切转化为画面与声音。

随着AI技术的不断发展与应用,在AI赋能的过程中,该如何平衡其中的创新与挑战?

3月15日,由工业和信息化部工业文化发展中心牵头成立的AI应用工作组主办,每日经济新闻承办、数智未来场景实验室协办的“Sora的启示:AI应用再飞跃”主题沙龙活动在京成功举办。

北京航空航天大学计算机学院副教授巢文涵在主旨演讲环节表示:生成式AI的迭代速度降低了用户端的再训练必要性,因此,想要在生成式AI的应用中寻求进一步突破,应该从训练和创造AI,逐渐走向调用和激发AI潜力。

重新认识Sora——“世界模拟器”

当其他AI视频工具还在突破几秒内的连贯性时,Sora已经可以快速制作最长1分钟、准确反映用户提示、可一镜到底的视频。

对于Sora在技术上的突破,巢文涵认为,Sora实际上是一个“Diffusion+Transformer模型”(Diffusion、Transformer分别为模型名称),是二者组合成的强大信息提取器。

此外,他还表示,Sora继承了Dall-E3(OpenAI开发的最新文本到图像转换工具)的画质和遵循指令的能力,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。

因其根据静态图像生成视频的能力,Sora在动图制作、广告设计等领域具有不小的应用前景。不过,巢文涵还补充说,Sora能够获取现有视频并对其进行扩展或填充缺失的帧,这一功能在视频编辑、电影特效等领域也将有不俗的应用表现。

值得一提的是,用户还可以使用Sora连接两个输入视频,在完全不同的主题和场景组成的视频间,实现无缝过渡。

Sora在技术上的突破及其未来广阔的应用前景,使得AI又上升到了一个全新的维度。“Sora虽被定义为一款人工智能文生视频大模型,但其实,OpenAI并未将其单纯视为视频模型,而是作为‘世界模拟器’。”巢文涵如此表示。

北京航空航天大学计算机学院副教授巢文涵 图片来源:每经记者 韩阳 摄

从训练和创造AI,走向调用和激发AI潜力

从时尚展示到动漫制作,从心理治疗到建筑规划,Sora可以为多个相关领域进行全新的创造、再创造。不过,巢文涵认为,Sora同样拥有诸多局限性。

比如,Sora在处理复杂场景时对物理规则的应用不一致,因此出现无法准确模拟出因果关系的特定情况。这也可以解释,为什么在Sora生成的视频里,时常能看到变形的椅子飞向天空的画面。

巢文涵进一步补充说,在人机交互、充分理解空间和时间的复杂性以及使用限制上,Sora还有非常多的局限性。

那么,如何在AI技术不断突破的过程中,继续逐点击破AI赋能和应用的难点,平衡创新与挑战?巢文涵表示,生成式AI应用,应该从训练和创造AI,走向调用和激发AI潜力。

“生成式AI的迭代速度降低了用户端的再训练必要性,关键是用户怎么调用这些生成式AI。同时,大模型本身外部检索、多模态能力都非常强,本身是一个好的搜索入口。”他接着补充说,“应该进一步去App化,提供更多维度的综合应用交互方式。”

在巢文涵看来,大模型本身具备生态插件及融合能力,其自身会调用服务接口,不需要打开App,而是需要设计合理的API(应用程序编程接口)接口。此外,还需打破传统AI应用中语音、文字、图片等不同格式内容的界限,提供更多维度的综合应用交互方式。

从技术层面考量,Sora也面临着一系列挑战,包括可扩展性和计算资源、隐私和伦理问题以及就业和社会变革等。这些挑战中,巢文涵特别提到了深度伪造。他注意到,不法分子会利用机器的深度学习技术,进行图像、声音、视频的篡改、伪造和自动生成,产生高度逼真且难以甄别的内容。

巢文涵认为,Sora对社会生产力和产业发展的促进作用毋庸置疑,但同时,Sora创造的大量虚拟视频会污染现存的图像数据,引发一系列问题。

因此,他建议,应该建立法律和监管框架,同时提供政策支持,增强创新意识,加强数据保护与安全。

每日经济新闻

相关内容

全球首个!中国发布多模态地...
中新网北京9月19日电 (记者 孙自法)由中国科研团队成功研发的全...
2024-09-19 23:02:37
中国发布全球首个多模态地理...
中新网北京9月19日电 (记者 孙自法)中国科学院地理科学与资源研...
2024-09-19 12:52:01
农村小额贷款人数突破人占全...
导读农村小额贷款人数已经成为中国第一大银行之一,农业银行、邮储银行...
2024-09-18 07:42:54
重大突破!我国首个深水油田...
今天(9月17日),记者从中国海油获悉,随着亚洲首艘圆筒型海上油气...
2024-09-17 16:02:56
维e起什么作用 维尔奇斯模...
维e可以帮助维持身体正常运转,促进健康。1. 维e是一种重要的抗氧...
2024-09-12 11:11:33
渤海油田渤南油田群累产油气...
新华社天津9月11日电(记者戴小河、梁姊)记者11日从中国海油天津...
2024-09-12 09:22:48

热门资讯

存款利息怎么算?湖南农商行存款... 导读湖南农商行存款利息怎么算?湖南农商行作为湖南最大的股份制银行,它是一家地方性、集约化、国际化、股...
上海发布:紧挨着城区的六个村为... 原标题:上海发布:紧挨着城区的六个村为何一定要保留?来看闵行的城乡融合发展之路 ...
茫崖市有多孤独?方圆百里荒无人... 原标题:茫崖市有多孤独?方圆百里荒无人烟,我国为何要建在戈壁之中? 这是中国最...
使命:林荫不做市公安局局长,为... 原标题:使命:林荫不做市公安局局长,为何副局长牛明也不可能接任 林荫从白山地区...
为何这些户外电源内置双向同步升... 原标题:为何这些户外电源内置双向同步升降压芯片?这篇文章给你答案 前言 目...
杨虎城去世后,他的子女结局如何... 原标题:杨虎城去世后,他的子女结局如何? 1936年12月12日,著名爱国将领...
金三角李国辉,率领三千残部打败... 原标题:金三角李国辉,率领三千残部打败泰国政府军,到台湾后结局如何? 解放战争...
哈以战争为何爆发?美国掌握军权... 原标题:哈以战争为何爆发?美国掌握军权的盎撒集团要收回犹太集团所控制的经济权利 ...
“水中恶霸”田鳖,吃青蛙能捕蛇... 原标题:“水中恶霸”田鳖,吃青蛙能捕蛇,还爱咬人脚趾,为何很少见了? 世界上存...
入伍时间决定军考时间吗?如何进... 原标题:入伍时间决定军考时间吗?如何进行计算? 后台很多战友及兵爸兵妈咨询提到...