Sora视频生成模型亮相:技术惊艳但仍有挑战


近日,OpenAI展示了其新型视频生成模型Sora,这一模型在文本转视频技术上取得了显著进步。然而,在彭博社进行的测试中,Sora的表现并不完美,出现了一些不符合现实场景的动作,如鹦鹉飞过猴子时翅膀扭曲,以及猴子身上出现鹦鹉尾巴等。
这些问题反映了Sora在理解和呈现物体物理特性方面的局限性。OpenAI科学家Bill Peebles也承认了这一点,他表示:“确实会在片段中找到一些奇怪的动作。”
Sora采用Diffusion transformer技术,将视频内容分解成一系列patch,并通过去噪技术预测出清晰的原始图像信息。虽然这种方法优化了视频生成效果,但Sora仍面临一系列挑战和局限性。
这些挑战包括物理交互的准确性、对象状态变化的一致性、长期样本的连贯性、物体的自发出现、手部和身体部位的处理、计算资源的需求、模型的泛化能力以及视频编辑和扩展的能力。在复杂场景中,Sora可能会出现不符合现实场景的动作,如篮球穿过篮筐侧面、狗在走路时相互穿过等。
尽管Sora在某些特定场景下表现出色,但OpenAI表示,该模型仍有很长的路要走,需要解决许多技术挑战。随着技术的不断进步,我们有理由相信Sora的未来会更加出色。
相关推荐
-
IDC:预计今年中国智能眼镜出货275万台,同比将大增107%
IT之家 2 月 27 日消息,国际数据公司 IDC 今日发布《2025 年中国智能眼镜市场十大洞察》提出,在软硬件技术革新、AI 大模型快速发展、交互技术进一步融合的共同推动下,…
-
Linus Torvalds顶住压力:Linux 6.8-rc1如期发布
在遭遇冬季风暴导致断电断网的困境下,Linus Torvalds依然坚守岗位,如期发布了Linux 6.8-rc1版本。这一消息无疑给全球的 Linux 社区带来了巨大的惊喜和鼓舞…
-
NVIDIA RTX 5070 12GB性能首曝!光追性能比4070 Ti S高5-10%
快科技10月15日消息,Moore’s Law Is Dead在视频中透露,NVIDIA即将推出的RTX 5070 12GB显卡,在光栅化性能上将比RTX 4070 T…
-
新增三种胶片风格滤镜,一加 Ace 2 手机获 ColorOS 15.0.0.400 升级
IT之家 1 月 19 日消息,一加 Ace 2 系列手机现获 ColorOS 15.0.0.400 升级,该版本新增流体云支持显示充电信息、照片模式 / 人像模式三种胶片风格滤镜…
-
“天玑变骁龙”!iQOO Neo9S Pro入网
快科技4月13日消息,iQOO Neo9S Pro已经获得了入网许可,其型号为V2339FA,支持120W有线闪充。 相较于上一代的iQOO Neo9 Pro,iQOO Neo9S…
-
vivo X300系列手机推出全新“AI电影分镜”功能
IT之家 9 月 28 日消息,vivo 官方今日宣布,vivo X300 系列手机推出全新「AI 电影分镜」功能,可实现超高像素“一图多裁”。 根据官方介绍,「AI 电影分镜」功…
-
摩托罗拉 Edge 50 Fusion 手机官方渲染图曝光,搭载骁龙 6 Gen 1 处理器
IT之家 3 月 26 日消息,除了此前预热即将于 4 月 3 日在印度发布的 Edge 50 Pro,据悉摩托罗拉当天还将发布另一款机型 Edge 50 Fusion。本月初,E…
-
《复活邪神SaGa RS》国际版3.5周年活动盛大开幕,全新功能与模式引爆热潮!
Square Enix与曉数码(Akatsuki)合作的RPG手游《复活邪神 Romancing SaGa Re;univerSe》(简称:复活邪神SaGa RS)国际版迎来了3….
-
安卓旗舰越来越贵!高通骁龙8历代芯片价格曝光 10年翻了近5倍
快科技5月10日消息,近日,有博主整理了2016年之后的高通骁龙8系处理器价格信息,差不多10年价格翻了近5倍。 从整理的信息来看,2016年的高通骁龙835价格为300元左右,2…
-
拼多多跨境电商Temu日本火爆 用户增速惊人
拼多多旗下跨境电商平台Temu自2023年7月1日正式进军日本市场以来,凭借其独特的商业模式和价格优势,迅速在日本市场崭露头角。据媒体报道,Temu在日本上线短短半年内,每月用户人…
