- 我最近在帮朋友一起搞AI漫剧,碰到个特别头疼的问题。 因为像AI漫剧,有些内容涉及到多个角色对话,但找配音演员的话周期太长,而且成本比较高。 我有去市面上找过一些AI配音工具,但效果总感觉怪怪的,就是一听还是能听出来是AI。 虽然音色能模仿个大概,但没有情感起伏,听起来非常机械...... 比如你让它模拟紧张,它只会把声音拔高一点,让它表达温柔,就是放慢语速。 但跟我想要的AI漫剧里角色呈现出来的音色,完全不是一个味儿。 我跟朋友归纳了一下,这些AI配音最本质的问题,就是只会照葫芦画瓢。你给它一段参考音频,它能学个七八成像,但它不会演戏。 想要它表现出角色具体的情绪、场景感,非常非常难。 但今天,我朋友很兴奋的转发给我一条消息,说阿里这两天发布了两款新的语音模型。 他第一时间就接入测了一下,效果非常棒! 我看了一下这这两款模型。 一个叫Fun-CosyVoice3.5,主打声音克隆加指令控制; 另一个叫Fun-AudioGen-VD,可以无中生有创造音色,还能叠加背景音效。 官方管这个能力叫freestyle模式,换句话说就是你能用文字指令告诉AI该怎么说话,用什么情绪,什么语速,甚至要不要加背景声。 看我朋友这么兴奋,我立马上阿里云百炼,花了一晚上时间测了一下效果,主要覆盖声音克隆、生僻字朗读、场景合成、角色创造这几个方向~ 不得不说,效果真的可以! 我迫不及待来给大家分享一下我的实测效果🤩 #深度思考 #AI人工智能 #一个想法不一定对 #我的口音逐渐失控 #播音配音 #cosyvoice #阿里云 #AI配音