关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2026-01-13 00:00:01267人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉申报Model Y长续航后驱版 又是一个走量款

网易汽车 浏览 324 10-12

日本自卫队高强度"尾随"中国海军 真实水平被试出来了

空天力量 浏览 268 12-21

钓友举报砂石厂偷排泥浆水污染河道 村官:没那么严重

澎湃新闻 浏览 509 08-20

维克托:巴萨前场竞争激烈离队是最好的选择 弗里克就像我的父亲

直播吧 浏览 428 08-28

沪指4000点临门一脚,与十年前有何不同?豆包AI这样回答

每经牛眼 浏览 297 10-27

理想i8售32.18万元起 交付即有"专职司机"

网易汽车 浏览 4794 07-31

4.0T V8发动机 阿斯顿·马丁DB12 S官图发布

车质网 浏览 358 10-10

赢下官司,击败田家,褚韶华再次证明了自己!

电和影 浏览 407 09-21

四川无人机大佬离婚案终审宣判!女方分得5亿市值股份,任斌还是实控人

红星资本局 浏览 1222 07-18

贝弗利:不认为克莱是角色球员 他能得50分&进10记三分

直播吧 浏览 487 08-27

法比尼奥:我本不想离开利物浦,与克洛普的谈话让我决定去沙特

直播吧 浏览 716 08-10

赵贤祐:磨合时间虽短但打出了不错比赛 只能将这份遗憾铭记在心

直播吧 浏览 4793 07-16

长城汽车取消大小周,员工感慨:工作11年,终于等到全面双休了

红星资本局 浏览 261 01-07

全球"围攻"以色列 内塔尼亚胡被逼急做的决定出人意料

空天力量 浏览 488 09-26

男子质疑遭遇"维修刺客":他拔几个插头就收了300元

潇湘晨报 浏览 3325 08-10

宁波小伙拒绝内卷,把普通产品高端化,年销几千万元

电商在线 浏览 3861 08-12

阿拉维斯vs塞维利亚:德尼斯-苏亚雷斯、阿莱尼亚首发,阿斯皮利奎塔、夸西出战

懂球帝 浏览 396 09-21

随着中国男足0-0,日本6-1,亚预赛最新晋级形势出炉:6队已晋级

侃球熊弟 浏览 431 09-10

小伙7年后与患重病初恋女友重逢再牵手:攒钱等特效药

扬子晚报 浏览 272 12-11

迪米特洛夫宣布退出美网,58次大满贯连续参赛纪录终结

网球之家 浏览 8348 07-30

3岁女童16楼走道坠亡 父母起诉开发商、物业索赔51万

红星新闻 浏览 546 09-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11