谷歌开发出用文本生成音乐的AI系统
最近,谷歌创建了一个人工智能系统MusicLM,可以根据详细的文字描述生成歌曲。但怕有风险,尚未正式发布。
根据官方介绍,MusicLM是一种从文本描述中生成高保真音乐的模型,将条件音乐生成过程视为分层的序列到序列建模任务,它以24kHz 的频率生成音乐,并在几分钟内保持一致。
谷歌的实验表明,MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。此外,谷歌团队称证MusicLM 可以同时以文本和旋律为条件,因为它可以根据文本标题中描述的风格转换吹口哨和哼唱的旋律。为了支持未来的研究,谷歌还公开发布了 MusicCaps,这是一个由5.5k 音乐-文本对组成的数据集,其中包含由人类专家提供的丰富文本描述。
根据官方介绍,MusicLM是一种从文本描述中生成高保真音乐的模型,将条件音乐生成过程视为分层的序列到序列建模任务,它以24kHz 的频率生成音乐,并在几分钟内保持一致。
谷歌的实验表明,MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。此外,谷歌团队称证MusicLM 可以同时以文本和旋律为条件,因为它可以根据文本标题中描述的风格转换吹口哨和哼唱的旋律。为了支持未来的研究,谷歌还公开发布了 MusicCaps,这是一个由5.5k 音乐-文本对组成的数据集,其中包含由人类专家提供的丰富文本描述。