Meta公开全新音频压缩技术EnCodec,容量比MP3小10倍,而且无损?

Meta在网上公布了一项新技术EnCodec,这是一种全新的开源音频压缩技术。通过这种技术,压缩文件大小比MP3格式小10倍。

Meta旗下研究团队在AI驱动的音频超压缩领域构建了一个由三部分组成的系统,为能让该系统将音频数据压缩到目标大小,然后可以使用神经网络对这些数据进行译码,对此进行了训练。

新技术EnCodec能够对文件的压缩比64kbps的MP3多10倍,而且并且不会损失任何内容。

nCodec的三部分包括:

 

编码器:收集未处理的数据并加工为更高维度和更低帧率的表示(representation)。

量化器:通过训练量化器给目标大小,同时保留最重要的数据来重建原始信号。

解码器:将压缩信号进行译码转换。

Meta表示,该技术还不能应用到视频,但现在已经在进行研究,其目标是改进视像会议、串流媒体电影以及在VR中与朋友玩游戏等的音频体验。

Rate this post

留言 | Comments