爱吧机器人网 » 技术 > 人工智能 > 正文

像人一样说话,Google的AI又点亮新技能

  除了下棋、设计衣服,Google 家的 AI 最近又点亮了一门新技能——说人话。会说话的 机器人 并不稀奇,苹果的 Siri,微软的小娜,都是我们所熟悉的语音助手。但 Google 家的 WaveNet ,却是能模仿真实人类声音的 AI,并且还精通多国语言、各种乐器,可以说是高配的洛天依。

  WaveNet 的前世今生

  让人们使用自然语言与机器进行交流,是人类长久以来的梦想。一直以来,计算机生成声音主要依靠文本-语音转换系统,即 TTS( text-to-speech):计算机从朗读者的声音片段组成庞大的数据库中,将文本与声音进行对应,将声音片段组合形成完整的语音输出。

  然而,这种方法有一个缺陷,就是声音修改非常困难,比如换成一个声音、改变重读部分或者朗读者的感情等。这就要求参数 TTS 存储大量的模型数据、语音内容和声音特点等。除此之外,使用 TTS 转换而来的声音总是显得过于生硬,衔接也不够自然。

  因此,也就有了 WaveNet 项目的诞生。WaveNet 是一个能生成原始声波的深度神经网络系统,是 Google 旗下的人工智能公司 DeepMind 开发的项目之一。9 月 12 日,DeepMind 在其官方博客上宣布,WaveNet 已经能够发出高仿真的人类声音。

  与 TTS 不同的是,WaveNet 使用的是真实的声波而不仅仅是语言。简单来讲,就是将自然人声输入到系统中,由第一层券积层先进行处理,再反馈至第二层,为下一步的生成提供预测。

  每一步都会生成新的样本,并且都会受到此前样本结果的影响,也即每一步的结果都将影响下一步的样本预测,并帮助生成下一步的样本。经过层层处理后,最终输出的声音非常逼真。

  PK,WaveNet 效果拔群

  在对比测试中,DeepMind 请了英语和汉语的测试人员用各自的母语进行录音,与 Google 目前最优秀的 TTS 系统 Concatenative 和 Parametric 以及 WaveNet 进行对比。

  测试结果表明,WaveNet 生成的声音要比 Google 的 TTS 系统更为自然,但与真实的人声仍有差距。

  这一结果令研究人员兴奋不已,DeepMind 在其博客上表示:

  “这种方法能在所有 16 千赫兹的音频上奏效已经足够让人惊喜,更何况还击败了美国最先进的 TTS 系统。”

  太贵,WaveNet 暂无法实现商用

  除了人类声音,理论上 WaveNet 能模仿任何声音,比如喘息的声音,甚至是音乐,比如钢琴声等。有兴趣的小伙伴可以前往 DeepMind 博客试听。

  DeepMind 表示:“WaveNet 为 TTS、音乐和音频建模开启了许多可能性。”

  事实上,研发人员通常会避免使用 WaveNet 进行建模,因为它每秒钟需要分析 16000 个样本,速度惊人,但也意味着极其高昂的成本,就连 DeepMind 也承认“这是一个巨大的挑战”。

  根据彭博社的分析,考虑到成本问题,WaveNet 在短期内无法实现商用。




上一篇:塞满AI技术的计算机能“秒懂”你的心?
下一篇:AI金融或制造新的不可解问题
精选推荐
机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

本周栏目热点

说一说那些进入日常生活的智能机器人

[1970-01-01]    从《星球大战》里的机器人英雄,到前些年大受欢迎的电影《我,机器人》,无数的科幻作品里都少不了机器人元素,人们将之视为 未来感的 ...

奇点大学:人工智能与“奇点理论”

[1970-01-01]    就在前几天和行业内的几个朋友吃饭时,内容在不经意间又转向了那个老生常谈的话题-到底什么是在智能电视上最好的交互方式上,于是乎五 ...

说客小π情感机器人体验【评测】

[2015-12-29]     前言  随着语音识别技术的发展,声控灯、语音输入法、语音交互等各具特色 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01]    无论你是否认为面部识别令人毛骨悚然,很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。  无论是微软的猜年龄机器人, ...

麻省理工智能机器人最新技术 机器手指研究获得突破

[2015-12-27]     麻省理工智能机器人最新消息,今年在研究机器手方面跨出了一大步,现在它又 ...