随着技术的进步以及更多人的认可,
机器学习面临的最大困境不是如何跨过前往通用人工智能(AGI)路上的障碍,而是如何将现有的机器学习技术对更多企业开放,并让其更具实用性。了解到这一点,科技巨头们纷纷投资于大众化的人工智能,以便使其工具和服务可以得到更广泛的使用,然而,在这个过程中,机器学习用户的体验(UX)被忽视了。
对此,即使是那些没有大量数据或者人才基础的公司,也可以对基于机器学习的
应用程序进行大规模的改进,比如,通过构建一个优秀的UI(User Interface)来弥补数据的缺乏,等等。当我们将
人工智能作为一种工具,并意识到其可用性对于未来广泛采纳的重要性时,增强现有人工智能技术的机会便会出现,而这一切与人类级别的智能机器或者通过人工智能毫无关系。
AGI或许会上头条,但AI工具才能带来利益
虽然与谷歌更为普通的人工智能应用(如搜索)相比,像DeepMind或者Google Brain这样华而不实的项目更可能成为头条新闻,吸引到人们的注意力,但总的来说,前者才是一项利润丰厚的业务。
根据MarketWatch最近的一篇文章,谷歌目前已经“在人工智能和机器学习上投入了近数十亿美元的押注”,或许谷歌的押注是针对人工智能是否有“冬季”这一问题的对冲,换句话说,人们对人工智能的兴趣是不是会有降低的那一天。
最近,纽约大学的Gary Marcus撰写了一篇关于深度学习的评论文章,不仅在WIRED和MIT Technology Review等技术出版物上出现,在主流媒体上也得到了很多相关报道。在文中,Marcus警告了关于过度炒作人工智能的危险。
今年2月,英国《金融时报》发表了一篇题为《为什么我们处于高估人工智能的危险中》(Why We Are in Danger of Overestimating AI)的文章,指出目前人工智能系统存在严重的问题,比如它们可以轻易被愚弄并缺乏常识。
而在最近一部长达78分钟的纪录片中,对人工智能的炒作是关于通用人工智能的,而不是AI工具(AI-as-a-tool)。如果前者可以平静一段时间,那可能再好不过了。一方面,这不会影响我们对已投入应用的机器学习技术的使用,如搜索,翻译,内容推荐,对象分类等众多用途。
另一方面,我们可以通过将服务提供给那些不能像谷歌或亚马逊一样雇佣大量人才的公司来增加价值。为了实现这一目标,这两家企业现在都提供各种平台和服务,甚至是机器学习模型即服务(已经接受大量数据培训),当然,对象都是缺乏专业知识的公司。
这不是关于向人类级别的智能发展,而是要让现有技术得到更广泛的使用。微软和IBM也在大力投资这种所谓的大众化人工智能。但是,除了让现有的技术可供更多人使用之外,还有各种方式可以使该技术变得更加有用。
不确定性是一个用户体验问题
机器学习的一个基本方面涉及从一组“训练数据”中学习,以便能够对新数据作出预测,因此该预测是不确定,不准确的。它仅仅是研究人员根据提供给系统的数据以数学方式得出的概率。
当然,机器学习系统预测中固有的不确定性是不会消失的,所以我们必须把它处理掉,至少在基于预测采取的行动比针对网络内容或广告更严重的情况下,我们应该这么做。要知道,在某些情况下,机器学习预测所提供的决策可能会造成非常严重的后果。
因此,我们面临的挑战是如何让用户对这种不确定性更加满意。在某种程度上,我们可以将可解释性问题视为可用性问题来对待。毕竟,一个可解释的预测比没有解释的预测更容易被信任和利用。
一旦意识到某些用户体验问题,我们便可以通过标准的工具和流程(可用性研究等)来寻找解决方案。
UI如何提高机器学习的准确度
在文章开头部分提到了通过构建一个优秀的UI来弥补数据的缺乏,这是一种叫做“HitL”(human-in-the-Loop)的机器学习,这仅仅意味着任何机器学习系统的训练都会涉及到人类的工作。
像Figure Eight和Mighty AI等公司就是在引领该领域的众包方式。Mighty AI有一款应用,可以让任何拥有智能手机的人通过在图像上标注交通灯、行人、停着的汽车等标记来赚取几美分,而这些图像是该公司用于训练其自动驾驶汽车的数据。
但HitL不仅仅是通过众包来给所有的训练数据贴标签。我们可以创造性地使用像少量学习(Few-Shot Learning)这样的技术,在这个过程中,一个系统可以从几个标记的例子中学习如何进行分类,以及转移学习,即将学习从一个任务应用到另一个任务,以解决没有标签的训练数据可用的问题。
迁移学习,换句话说,是学习丰富的数据代表,通常与少量学习相结合,因为它可以从几个例子中展开学习,丰富表达。如今,引入“少量投射”(Few Shots),便可以从没有标记数据到拥有强大的分类器成为可能。这里确实有很多需要探索的内容,包括如何更好地向人们展示最有效的标签示例,其中,如何充分利用HitL,对分类器的准确性至关重要。
会话式AI:它只是软件
也许,用户体验最关键的地方是对话界面的设计。这里并不是在讨论HitL,而是人类作为应用程序的最终用户。会话式AI是通用人工智能与人工智能为工具的区别里的一个关键领域。不管是基于语音的AI还是会话式AI,其最初的目标可能是研发出一种可以进行智能的、开放式对话的产品。但是,事实证明,这很难做到,很明显,因为在缺乏生活经验或者常识的情况下,真正的对话是不可能实现的。
目前,OpenAI团队正在研究解决这个问题的一种特殊方法,即让机器在环境中使用语言来完成目标,但这在很大程度上还处于起步阶段。另一个方法便是其Cyc Project,目的是通过在一个庞大的数据库中存储事实和推理规则来给机器注入常识知识。实际上,这个项目始于20世纪80年代,几十年过去了,还是没有实现。
苹果Siri研究公司SRI International的Bill Mark在最近接受采访时表示,“我们不是为了通过图灵测试而构建这些系统。”他指出,在设计基于语音的系统时,需要务实并承认缺乏理解能力,以便解决限制问题并设计出真正有用的东西。
这是基于语音的人工智能系统的新目标,它需要的技能超出了人工智能研究员的能力。总的来说,它要求软件工程师和用户体验设计师与自然语言处理专家合作,来创造一些可以不那么聪明但却要很有用的东西。