
微软推出VALL-E,只需3秒音频训练即可模仿人说话
科技巨头微软研究人员推出了最新的文本到语音 (TTS) 生成器VALL-E,可以在短短三秒钟内训练模仿任何人的声音。与以前听起来像机器人的语音发生器不同,VALL-E 听起来很自然,这可能不是一件好事。
科技巨头微软研究人员推出了最新的文本到语音 (TTS) 生成器VALL-E,可以在短短三秒钟内训练模仿任何人的声音。与以前听起来像机器人的语音发生器不同,VALL-E 听起来很自然,这可能不是一件好事。
芝加哥大学的研究人员发现语音复制算法能够欺骗语音识别设备。此前,尽管深度伪造(Deepfake)视频栩栩如生且令人信服,但其无法再现一个人的声音。