好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源，中文优质信息越来越少了 |

首页 > 最前沿 > Meta新推出媒体基础模型——Movie Gen，92页论文曝光技术细节

Meta新推出媒体基础模型——Movie Gen，92页论文曝光技术细节

Frontier 10月 15, 2024 2.88k 浏览 0

Meta公司新推出的媒体基础模型——Movie Gen，特别是其视频和音频生成能力。

1. Movie Gen概述

类型: Movie Gen Video和Movie Gen Audio。
参数:
- Movie Gen Video: 30B参数，生成1080P、16秒、每秒16帧的视频。
- Movie Gen Audio: 13B参数，生成与视频同步的高保真音频，最长可达45秒。

2. 技术特点

Transformer架构: Movie Gen Video基于Transformer设计，特别借鉴了Llama 3。
流匹配（Flow Matching）: 这种新兴的生成模型训练方法使得视频生成在精度和细节表现上优于传统的扩散模型。
时空压缩: 通过潜在空间生成，提升训练和推理效率。

3. 生成能力

视频生成: 能够根据文本提示生成高质量视频，支持物体运动、主客体交互等复杂场景。
个性化功能: 可以将个人照片转换为个性化视频，展示了强大的编辑和定制能力。

4. 技术报告

Meta发布了92页的技术报告，详细介绍了Movie Gen的设计和实现细节。

尽管Movie Gen已上线，但预计正式向公众开放的时间为明年。该技术的推出标志着AI视频生成领域的一个新阶段，可能会推动相关技术的发展。

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/62550.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

上一篇: ByteDance Research提出机器人大模型GR-2，具备世界建模和强大泛化能力

下一篇: 第118届美国会科学技术领域的主要议题和政策关注点

文章推荐：

“纳米多晶金刚石”实现迄今最高强度 2020-11-12

过去几十年全球维生素D推荐摄入量被严重低估导致VD缺乏症大流行 2025-07-28

ZeroAvia完成新型600kW航空氢燃料电池动力系统的首次大功率地面测试 2021-08-13

硅光子芯片光学公司Ayar Labs获1.3亿美元融资，加速业界首个封装光学I/O产品商业化 2022-05-05

Imagindairy在精密发酵方面取得突破，推出实验室制造的人造牛奶 2021-06-14

通用原子公司推出“进化”无人机系统 2022-03-07

标签