Sora视频生成模型亮相:技术惊艳但仍有挑战


近日,OpenAI展示了其新型视频生成模型Sora,这一模型在文本转视频技术上取得了显著进步。然而,在彭博社进行的测试中,Sora的表现并不完美,出现了一些不符合现实场景的动作,如鹦鹉飞过猴子时翅膀扭曲,以及猴子身上出现鹦鹉尾巴等。
这些问题反映了Sora在理解和呈现物体物理特性方面的局限性。OpenAI科学家Bill Peebles也承认了这一点,他表示:“确实会在片段中找到一些奇怪的动作。”
Sora采用Diffusion transformer技术,将视频内容分解成一系列patch,并通过去噪技术预测出清晰的原始图像信息。虽然这种方法优化了视频生成效果,但Sora仍面临一系列挑战和局限性。
这些挑战包括物理交互的准确性、对象状态变化的一致性、长期样本的连贯性、物体的自发出现、手部和身体部位的处理、计算资源的需求、模型的泛化能力以及视频编辑和扩展的能力。在复杂场景中,Sora可能会出现不符合现实场景的动作,如篮球穿过篮筐侧面、狗在走路时相互穿过等。
尽管Sora在某些特定场景下表现出色,但OpenAI表示,该模型仍有很长的路要走,需要解决许多技术挑战。随着技术的不断进步,我们有理由相信Sora的未来会更加出色。
相关推荐
-
苹果大裁员,涉及苹果汽车和MicroLED团队700余人
近日,苹果公司向加利福尼亚州提交了一份WARN通知,宣布将裁员700余人。这一裁员计划主要涉及苹果汽车和MicroLED团队,是苹果近年来最大规模的一次裁员行动。此次裁员计划不仅对…
-
特斯拉Tesla 2023年财报发布:总营收967.73亿美元,同比增长19%
特斯拉Tesla近日公布了2023年度财报,数据显示,公司全年总营收达到967.73亿美元,同比增长19%。这一增长得益于特斯拉在全球范围内的销售业绩和产品线扩张。 在财报发布会上…
-
全球 6G 创新发展合作倡议发布:呼吁共同制定全球统一标准
感谢IT之家网友 西窗旧事、HH_KK 的线索投递! IT之家 11 月 13 日消息,据澎湃新闻报道,2024 全球 6G 发展大会今日在上海发布,IMT-2030(6G)推进组…
-
传闻三星新一代折叠屏手机Galaxy Z Flip6和Z Fold6将于本周开启预订
随着科技的不断进步,智能手机市场也迎来了新的变革。近日,全球知名科技企业三星计划于7月10日在其Galaxy Unpacked 2024活动上正式推出备受瞩目的新一代折叠屏手机——…
-
vivo X300 系列全系搭载京东方护眼屏,支持全亮度 2160Hz 高频 PWM 调光、DC 调光
感谢IT之家网友 風見暉一、偏科骚黄4100只眼 的线索投递! IT之家 10 月 13 日消息,vivo X300 系列新品发布会正在进行中,官方宣布新机全系京东方护眼屏,全系标…
-
苹果Vision Pro颠覆机上娱乐体验,微软Word负责人分享使用感受
IT之家 2 月 13 日消息,苹果发布 Vision Pro 头显时,用户反应褒贬不一。当时有传言称该产品可能无法达到预期销量,然而,事实并非如此。 这款结合增强现实和空间计算技…
-
华为FreeClip耳夹耳机海外新增“玫瑰金”配色
IT之家 12 月 13 日消息,华为于 2023 年 12 月发布了 FreeClip 耳夹耳机,当时提供星空黑和流光紫两种配色,售价 1299 元。2024 年 5 月,Fre…
-
【视频】清新配色,高效AI,全新华为MatePad Air上手体验
新一代华为MatePad Air设计清新活泼,特别是“樱语粉”与“草木绿”两款马卡龙色系配色,清爽适合夏日。搭载Harmony OS,小艺、华为笔记等核心App获AI助力,提升创作…
-
魅族21 Note发布日期确认,搭载骁龙8代芯片与AIOS系统
在智能手机市场经历了一段时间的沉寂后,魅族近日再次吸引了业界的目光。该公司原计划在今年早些时候退出智能手机市场,但随后推出的魅族21专业版旗舰智能手机打破了这一传闻,并再次证明了魅…
-
号称“视频安卓领先,比肩 iPhone”,vivo X200 Ultra 支持全焦段 4K 60fps 10bit Log
感谢IT之家网友 Autumn_Dream、漂流、風見暉一、顺势而为、蛋炒鱼、呵_女人 的线索投递! IT之家 4 月 14 日消息,vivo 今日下午举行 X 系列蓝图影像技术沟…
