Sora视频生成模型亮相:技术惊艳但仍有挑战


近日,OpenAI展示了其新型视频生成模型Sora,这一模型在文本转视频技术上取得了显著进步。然而,在彭博社进行的测试中,Sora的表现并不完美,出现了一些不符合现实场景的动作,如鹦鹉飞过猴子时翅膀扭曲,以及猴子身上出现鹦鹉尾巴等。
这些问题反映了Sora在理解和呈现物体物理特性方面的局限性。OpenAI科学家Bill Peebles也承认了这一点,他表示:“确实会在片段中找到一些奇怪的动作。”
Sora采用Diffusion transformer技术,将视频内容分解成一系列patch,并通过去噪技术预测出清晰的原始图像信息。虽然这种方法优化了视频生成效果,但Sora仍面临一系列挑战和局限性。
这些挑战包括物理交互的准确性、对象状态变化的一致性、长期样本的连贯性、物体的自发出现、手部和身体部位的处理、计算资源的需求、模型的泛化能力以及视频编辑和扩展的能力。在复杂场景中,Sora可能会出现不符合现实场景的动作,如篮球穿过篮筐侧面、狗在走路时相互穿过等。
尽管Sora在某些特定场景下表现出色,但OpenAI表示,该模型仍有很长的路要走,需要解决许多技术挑战。随着技术的不断进步,我们有理由相信Sora的未来会更加出色。
相关推荐
-
雷克沙推SL300/ES3移动固态硬盘 配双层石墨烯散热
雷克沙海外上新了SL300和ES3两款移动固态硬盘,两款型号只有外观颜色差异。 雷克沙近日在海外官网上新了SL300和ES3两款移动固态硬盘,专为寻求高速数据存储以及高安全性的用户…
-
Rivian电动汽车制造商宣布新一轮裁员,以寻求利润率提升及年底毛利转正
美国电动汽车初创公司Rivian再次宣布裁员计划,以调整公司规模并寻求利润率提升,目标是实现年底毛利转正。尽管这是该公司今年的第二轮裁员,但裁员比例较之前有所减少,仅占员工总数的1…
-
苹果Vision Pro头显风扇系统新专利:高效带走热量,还能缓冲掉落冲击力
IT之家 1 月 18 日消息,根据美国商标和专利局(USPTO)近日公示的清单,苹果公司获得了一项关于 Vision Pro 头显内部风扇系统的专利,不仅可以引导头显内的气流流动…
-
vivo X200 Ultra 手机三配色外观公布:配 2K 蔡司大师色彩屏 + 超声波指纹
感谢IT之家网友 独立摄影师、風見暉一 的线索投递! IT之家 4 月 8 日消息,vivo 产品副总裁黄韬今日公布了 vivo X200 Ultra 手机的三款配色的外观,并透露…
-
特斯拉Tesla Cybertruck生锈遭吐槽 不锈钢车身是假的?
近期,特斯拉Tesla Cybertruck生锈现象引起了广泛关注。这款售价超过40万元、以不锈钢为卖点的车型,为何在仅仅淋雨后就出现锈迹? 不锈钢,顾名思义,应当不易生锈。但事实…
-
Photoshop 级编辑,消息称苹果“照片”应用将引入 AI 功能 Clean Up
感谢IT之家网友 华南吴彦祖 的线索投递! IT之家 5 月 7 日消息,根据国外科技媒体 AppleInsider 报道,苹果公司计划提高“照片”(Photos)应用的 AI 技…
-
苹果 iOS 17.5 RC 版发布:允许欧盟 iPhone 用户从网站下载应用
【点此直达升级教程】 IT之家 5 月 8 日消息,苹果今日向 iPhone 用户推送了 iOS 17.5 RC 更新(内部版本号:21F79),本次更新距离上次发布隔了 70 天…
-
苹果取消最强芯片研发:改研究服务器芯片
据最新媒体报道,苹果公司在高性能芯片研发策略上出现了重大调整。原计划中的史上最强大M4 Extreme芯片,可能已被苹果取消,转而将研发重心放在了服务器芯片上。这一消息引发了业界广…
-
vivo Y300 手机发布:搭载后置“超级扬声器”,预售价 1399-1999 元
IT之家 12 月 16 日消息,vivo Y300 系列手机今日发布并开启预售,价格区间为 1399-1999 元,将于 12 月 20 日正式开售。 京东 vivo Y300 …
-
唯一 6.3 英寸 1.5K+165Hz 小直屏,消息称一加 15T 手机配件开始试产
感谢IT之家网友 啊俊、偏科骚黄4100只眼、顺势而为、软媒新友2314428、蛋炒鱼、坚守阵地、呵_女人、Autumn_Dream、雨雪载途、肖战割割 的线索投递! IT之家 1…
