Meta推出音频生成模型Audiobox和多模态数据集Ego-Exo4D

Meta推出音频生成模型Audiobox,模型结合使用语音输入和自然语言文本提示来生成语音和音效。同时推出基础数据集和基准套件Ego-Exo4D,用于支持视频学习和多模态感知研究。

© 版权声明

相关文章