三、语音的核心价值和竞争力
回到开头,我们来看Echo这个产品。它和Siri最大的不同在于:这是一个纯粹通过语音、完全不需要屏幕的产品,看起来就像一台音响,用起来就像和人对话一样。进一步说,它解放了人们的眼睛和双手,你可以一边做别的事情,一边用语音和它交互。
这样一说就清楚了,归根结底,Siri和讯飞们并不是纯粹的声控交互产品,他们顶多只能算半声控交互产品,因为从唤醒他们到判断语音输入准确与否到最终的结果显现,你几乎都要用到眼睛和手,声控交互的核心价值“解放眼和手、不再低头族”完全得不到显现。换句话说,他们都是视触觉交互的补充而已,所以本身就锦上添花、可有可无。
你用Siri打开微信,比自己亲手打开能方便多少呢?你用语音输入法输入一段话,错了还得回删,这真的比打字输入更方便吗?
但是Echo展现出的是纯粹声控交互完全不同的价值,并且这几乎是一个“高频刚需”。
1、抓住了不适宜使用手和眼睛的人群。比如中老年人、残疾人、不擅长打字输入的人群,除非有一天人类技术发达到脑波交互,否则语音都是最适合他们的交互模式。
2、抓住了不方便使用手和眼睛的场景。这就是我们常说的“低头族场景”,走在路上、正在开车、晚上睡前、保护视力。由于以往的声控交互产品做得太差,中国人以强大的适应能力,练就了在这些场景“眼疾手快、目不离机”的超能力,哪怕视力下降、头昏眼花、低头撞人也在所不惜。但是试想一下,如果声控交互真的做上去了,语音真的成了乔布斯口中的“自然延伸”,他们还会这样吗?
3、创造了全新的伴随式场景。小的时候,我们为何早上起来会听收音机,因为可以边听边做其他事情,一心两用。对,就是这个一心两用!今天我们为何会一边跑步一边开车一边听喜马拉雅——像笔者年初一边在虹桥火车站办手续一边在喜马拉雅听罗胖的跨年演说、一边热泪盈眶……这都是一心两用呀!简言之,声控交互解放了人的手和眼,不仅在不适宜使用眼手的“低头族场景”,更在其他丰富的时刻。通过声控交互,你可以边听边说,一边干其他事情,这种一心多用的方便效率是不可抵御的。本来这些事,你要不停切换APP来完成,或者放下手机、把视线移到别的地方,但是现在完全可以并行不悖、同步推进了。