机器人记者已经出现在我们的生活中。本周,美联社宣布,将采用软件自动生成关于大学体育赛事方面的新闻报道,而该社之前尚未关注该领域。该软件称之为Wordsmith,由来自北卡罗来纳的公司Automated Insights开发。
这是大型新闻机构转向使用算法创造内容的最新案例。美联社是Automated Insights的投资者之一,他们此前已经利用Wordsmith生成公司财报方面的报道。其间,自动内容生成领域方面的竞争对手Narrative Science也在为包括《财富》及Big Ten Network在内的客户提供类似服务。去年,在地震发生后,来自《洛杉矶时报》的记者也用定制软件自动生成了相关新闻。
数据分析
定制内容
但是,这些由机器自动生成的内容会有人阅读吗?Automated Insights的CEO罗比·艾伦(Robbie Allen)表示,这个问题问得不对。虽然公司在2014年生成了超过10亿份内容,但是大部分并非面向普通受众。Wordsmith更像某种类型的个人数字科学家,其从海量的未经加工的数据中进行分析,为某些甚至某一位受众生成定制内容。
例如,公司在梦幻橄榄球赛期间就为数亿雅虎用户生成了赛况总结报道,将难以阅读的表格以直观明晰的形式呈现。某天,你也可以拥有自己的个人机器人记者,为你整理每日的个人健身数据及财务信息。
“这颠覆了传统的内容生成模式,”他说道。“以往,一个报道可以获得100万浏览量,而现在,我们生成100万的报道,每个获得1次浏览量。”
本质上会完成两件工作。首先,它查看并分析海量结构化数据,从中发掘出兴趣点,例如,某个选手在某场比赛的表现不如预期。然后,以人类可读的形式生成内容。
机器人记者创造初衷
艾伦于8年前有了创造这种软件的想法,当时他还是思科的一位工程师。此前,他已经拥有10本著作。而现在,他想要做一点别人没有做过的事情。因此,他决心将自己对计算机科学、写作以及体育赛事分析的激情结合在一起,结果便是StatSheet公司的诞生。
“在体育赛事的报道中,90%的工作就是填写各类数字,” 艾伦说道。
然而,艾伦很快意识到他的想法不仅仅能够用在体育方面,定量数据方面也同样适用。于是,他将公司的名称变更为现在的Automated Insights,公司的目标行业也随之扩展到了包括金融、医疗及传媒在内的各行各业。
自动化目前,Wordsmith还只能配合结构化的定量数据工作,这些数据通常保存在电子表格及数据库中。艾伦表示,这方面的潜力巨大,包括研究或写作过程的自动化、重新撰写新闻稿件或者对非结构化文档筛选并生成摘要。但是,他觉得公司目前还不会偏离定量分析的方向。
上月,公司被私募股权公司Vista Equity Partners收购,后者同时拥有体育数据公司STATS以及商业智能公司TIBCO。通过与该私募旗下其他公司合作,艾伦表示他们手头要完成的工作更多了。“我们现在感到有点无所适从,”他说道。“在结构化数据方面,我们已经有大量的机会,为何还需要贸然尝试解决那些困扰人们多年的问题?”