微软携手 Project Gutenberg,利用 AI 制作 5000 本免费有声书
IT之家 9 月 12 日消息,微软近日与“免费数字图书馆计划”Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。
▲ 图源 Project Gutenberg 网站
据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
IT之家经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。
参考
免责声明:凡本网站发布的文章、图片、音频、视频等内容所表述的观点和立场不代表本网站的观点和立场,若对该观点或立场有疑义或异议,请及时用电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。凡本网站发布的所有文章 、图片、音频、视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一和版权者联系,如果本网所选内容的文章作者及编辑认为其作品不宜上网供大家浏览,或不应无偿使用,请及时用电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
相关阅读
只是偶然搜索,天工AI竟然走心回答,勾起魔兽催泪回忆杀!
2024.04.30
盘不完,根本盘不完……怎么没人早点告诉我AI音乐这么好玩
2024.04.25
中国首个音乐SOTA模型「天工音乐大模型」今日公测
2024.04.17
解码「天工SkyMusic」,填补AI音乐领域技术空白
2024.04.12
「天工SkyMusic」跨界喜剧,用实验音乐探索笑声与旋律的碰撞
2024.04.11