从语音导航到智能客服,从智能手机到智能家居,语音技术早已融入我们生活。甚至在元宇宙,虚拟歌手也可以通过语音合成技术来发布专辑。

  这一切都来源于人工智能技术的不断突破和生态创新的蓬勃发展,也源自于12年前科大讯飞的一次勇敢尝试。

  创新十二年  从语音技术到生态平台

  2010年10月28日,科大讯飞发布了全球首个提供移动互联网智能语音交互能力平台——讯飞语音云,自此开放自己的语音合成技术。全球开发者云集讯飞语音云,用人工智能解决社会刚需命题,开启改变世界的伟大历程。

  12年时间,从技术创新到生态开放,“讯飞语音云”发展成为“讯飞开放平台”,并于2017年通过科技部认定,入选首批国家新一代人工智能开放平台。截至目前,讯飞开放平台已开放510项AI能力,聚集了363万开发者团队,应用覆盖终端设备数超36亿。

  从语音到图像,从感知智能到认知智能,讯飞开放平台用不断夯实的技术底蕴滋养着人工智能生态的繁花似锦。用技术照亮产业未来,让AI像水和电一样融入人们的生活。

  以声传情  让语音有了喜怒哀乐

  如何让机器的声音媲美人类?

  科大讯飞自上世纪90年代,就开始在语音领域的探索,并始终坚持源头技术创新。2016年Blizzard Challenge比赛,讯飞在英文语音合成自然度达到4.2MOS,首次超过普通发音人平均水平(4.0MOS)。

  2019年Blizzard Challenge比赛中,讯飞在中文语音合成自然度达到4.5MOS,再次刷新历史记录,实现了最好的中文语音合成技术掌握在中国人手中的目标。后来,更是在国内率先构建了60个语种的语音合成系统,有效为企业出海解决了技术封锁等问题。

  2022年,讯飞升级全新一代SMART-TTS系统,让机器语音表达方面实现了媲美真人的水平。21种以上的情感风格表达,每种情感具备40档的细腻情感强度调节,真正实现了合成系统媲美真人表达的能力。让语音合成从简单的信息播报,到具备喜怒哀乐情感的智能助手

  当你按照交规驾驶时,TA可以用开心喜悦的声音鼓励你。你疲惫时,TA可以用温柔甜美的声音安慰你。而当你阅读小说,或者进入元宇宙,需要上下文情景理解时,SMART-TTS的多风格语音合成能力则带来更多想象空间。

  作为语音合成方向的代表性APP,讯飞有声APP率先采用SMART-TTS系统!

  限时福利  讯飞有声全新升级

  作为一款文字转语音朗读软件,讯飞有声APP让2000万用户实现用“耳朵”来阅读海量信息,更高效地利用碎片化时间学习。不论是文本,还是文章链接、本地文件、甚至是图片、PDF都可以朗读。几十位AI主播,支持多种风格的音色、多种语言。

  假如你对着讯飞有声APP朗读一段文章,它甚至可以根据你的音色定制朗读主播。这样便可以用自己的声音给孩子讲故事,给家人道晚安。

  在1024开发者节,讯飞有声APP迎来全新升级!

  整合最新SMART-TTS系统,打造情感丰富的朗读音,带来全新的产品使用体验。同时,五位聆系列新主播正式上线。邻家女孩聆小琪和聆小瑶,温暖甜美,声音稳定。聆飞瀚音色浑厚大气,聆飞哲音色年轻时尚,声音自然流畅。作为讯飞有声最受欢迎男主播聆天明,则声音自然,情感充沛。

  阅读是一场自己与自己的对话。除了声音效果升级,用户体验也完成全新优化。在APP首页,简洁明晰的功能区,把用户时间还给阅读。“复制朗读”、“图片朗读”、“文件朗读”,三大板块,阅读从这里轻松展开。

  (责任编辑:施雅龄)