Sora视频生成模型亮相:技术惊艳但仍有挑战


近日,OpenAI展示了其新型视频生成模型Sora,这一模型在文本转视频技术上取得了显著进步。然而,在彭博社进行的测试中,Sora的表现并不完美,出现了一些不符合现实场景的动作,如鹦鹉飞过猴子时翅膀扭曲,以及猴子身上出现鹦鹉尾巴等。
这些问题反映了Sora在理解和呈现物体物理特性方面的局限性。OpenAI科学家Bill Peebles也承认了这一点,他表示:“确实会在片段中找到一些奇怪的动作。”
Sora采用Diffusion transformer技术,将视频内容分解成一系列patch,并通过去噪技术预测出清晰的原始图像信息。虽然这种方法优化了视频生成效果,但Sora仍面临一系列挑战和局限性。
这些挑战包括物理交互的准确性、对象状态变化的一致性、长期样本的连贯性、物体的自发出现、手部和身体部位的处理、计算资源的需求、模型的泛化能力以及视频编辑和扩展的能力。在复杂场景中,Sora可能会出现不符合现实场景的动作,如篮球穿过篮筐侧面、狗在走路时相互穿过等。
尽管Sora在某些特定场景下表现出色,但OpenAI表示,该模型仍有很长的路要走,需要解决许多技术挑战。随着技术的不断进步,我们有理由相信Sora的未来会更加出色。
相关推荐
-
Counterpoint 发布 2024Q3 全球手机销量 TOP5:三星领衔、小米增长强劲、vivo 成双料冠军
IT之家 10 月 16 日消息,市场调查机构 Counterpoint Research 昨日(10 月 15 日)发布博文,报告称 2024 年第 3 季度全球智能手机销量同比…
-
马斯克透露人形机器人将有租赁和销售两种选择 租赁服务先于销售推出
近日消息,特斯拉多年来一直在研发人形机器人 Optimus,并每月分享该项目的最新进展。埃隆・马斯克近期宣布,特斯拉不仅计划销售 Optimus 并将其用于自有工厂,还将提供该机器…
-
基思·吉尔回归社交媒体,GameStop和AMC股价飙升
在社交媒体沉寂近三年之后,知名散户投资者基思·吉尔(Keith Gill,社交媒体昵称“Roaring Kitty”)周日晚的突然回归引发了市场的一波强烈反应。周一,GameSto…
-
微软Microsoft Surface Pro 9 13英寸512GB在美国百思买可以省400美元,仅售1499.99美元!
微软Microsoft Surface Pro 9 13英寸512GB是一款卓越的二合一平板电脑,其折扣非常大,目前美国百思买正在开展一项优惠活动,您可以以1499.99美元的价格…
-
雷军称去年全球每卖 7 部手机就有 1 部小米
IT之家 3 月 5 日消息,全国人大代表、小米创办人兼董事长兼 CEO、金山软件董事长雷军今日在十四届全国人大三次会议首场“代表通道”接受记者提问。 雷军介绍了小米成绩单:“5 …
-
消息称三星 Galaxy S25 基础款手机配 6.36 英寸屏幕
感谢IT之家网友 华南吴彦祖、软媒新友1933769 的线索投递! IT之家 3 月 19 日消息,消息源 yeux1122 近日发布博文,表示三星 Galaxy S25 系列的整…
-
消息称小米 REDMI K80 至尊版手机配备超声波指纹、百瓦闪充、满级防水等
感谢IT之家网友 Autumn_Dream、蛋炒鱼、偏科骚黄4100只眼、呵_女人、软媒新友1933769 的线索投递! IT之家 6 月 17 日消息,小米 REDMI K80 …
-
骁龙8 Gen4由台积电代工 芯片专家:不会再现骁龙888发热问题
快科技5月25日消息,有网友给手机晶片达人留言:骁龙8 Gen4不会再现骁龙888那种情况吧? 对此,手机晶片达人回复:骁龙8 Gen4采用台积电3nm工艺,不是三星。 众所周知,…
-
华为 nova 12 系列优惠来袭:至高可享 500 元优惠
去年 12 月,华为发布了华为 nova 12 系列手机,主打“时尚先锋全能人像”手机,如今该系列发布已经有九个月,在年轻消费者群体中依然有着颇高的热度。而最近想买该系列的…
-
手机秒变望远镜,vivo X100 Ultra 联合 Rokid AR 眼镜升级 3D 相机
7 月 18 日消息,vivo 今日宣布,vivo X100 Ultra 3D 相机全新升级,号称是安卓阵营中唯一支持 3D 影像拍摄的手机。vivo 与 AR 眼镜公司“Roki…
