新闻组织正在使用人工智能生成数据驱动的文章

导读 也许您是小联盟的球迷。也许您是对公司上一季度的业绩感兴趣的投资者,或者是想要挖掘本地选举结果数量的政治狂热者。无论您是哪种类型的数

也许您是小联盟的球迷。也许您是对公司上一季度的业绩感兴趣的投资者,或者是想要挖掘本地选举结果数量的政治狂热者。无论您是哪种类型的数据吞噬者,得知您刚刚阅读的新闻故事不是由人类撰写的,您可能会感到惊讶。

自动化新闻业中,具有人工智能功能的软件程序使用算法从原始数据(例如体育比赛得分和公司收益报告)中塑造故事,这似乎是媒体业务中最热门的新趋势之一。支持者说,使用机器人作家可以帮助新闻机构对新闻大多为数字的话题进行更多的报道,同时使人类新闻工作者免于繁琐的撰写公式化文章的工作,并让他们有时间报道和撰写更重要的故事,复杂的主题。

美联社(AP)于2014年开始使用这种趋势,当时它开始使用由一家名为Automated Insights的初创公司创建的文章生成软件来自动生成有关美国公司收益的故事。以前,人类记者是在公司公告发布后,尽快在截止日期之前整理出这些数字文章的。根据Automated Insights案例研究,该软件使AP能够将故事的输出(通常为150至300个字长)增加12倍,从每季度300个增加到大约3700个。

效果如此之好,以至于2016年,AP开始使用该软件覆盖全国每个赛季的10,000场小联盟棒球比赛,利用盒子得分中的数据在裁判最终召唤后的几分钟内抽出在线上播出的故事。复制的内容与运动散文家罗杰·安杰尔(Roger Angell)的工作无关。这些作品没有包括球员的引述或戏剧的生动描述,而且如果没有球员退出,诸如替补席上的斗殴之类的具有新闻价值的时刻可能不会融入故事。但是这些故事确实提供了一些见解,例如球员是否正在发挥职业生涯的表现,或者球队是否已经扩大了对对手的连胜纪录。这种深度统计报告是幻想体育游戏的生死攸关的东西。

这种趋势已经蔓延到其他新闻机构。《华盛顿邮报》开始使用名为Heliograph的程序在2016年里约奥运会上生成更新,然后在2016年选举周期中,利用该技术覆盖了美国所有州,参议院和州长竞选的全部50个州(总共进行了近500场选举)。彭博社的编辑,总编辑约翰·米克尔思韦特告诉新闻机构的工作人员在一份备忘录去年自动化“是新闻的比我们许多人更广泛的方式,未来是至关重要的实现,”根据新闻智囊团的波因特研究所。

内曼新闻实验室的职员里卡多·比尔顿(Ricardo Bilton)通过电子邮件说,到目前为止,自动化仅限于“一些更千篇一律,大量统计数据的故事,例如收益报告和体育” 。该组织作为哈佛大学内曼新闻基金会的一部分,跟踪新闻媒体的创新。

毕尔顿说:“通常情况下,很多早期行动都在太空中进行,因为这些故事具有清晰的结构,可以很容易地由软件解析和复制。”

伯尔顿说,机器人作家可以在财务报告等领域提供巨大的竞争优势,在这些领域中,快速获取信息可以增加其价值。他说:“投资者向他们支付获得信息的权利,这将有助于他们把钱放在正确的地方。” “如果这些客户能比竞争对手更快地获得信息,那将是巨大的优势,也是自动化故事承诺的核心。”

自动化新闻并非没有潜在的弊端。Bilton补充说:“完全信任自动化故事很容易,因为在我们看来,'自动化'等同于'可靠'。” “但是我们知道代码也会出错。”

例如,在6月,美国地质调查局软件中未纠正的Y2K错误使该机构发出了有关1925年实际发生的加利福尼亚州6.8级地震的错误警报。而该错误又导致了《洛杉矶时报》 Quakebot算法生成网络故事并发送有关不存在的地震的推文。(错误已得到迅速纠正。)