NSTM:彭博社的实时查询驱动的新闻综述撰写

2020-06-03 00:08:11

下载PDF摘要:来自全球数十万来源的数百万篇新闻文章每天都会出现在新闻聚合器上。消费如此大量的报纸几乎是一个不可逾越的挑战。例如,一位读者在彭博社的系统上搜索有关英国的新闻,在非典型的一天会找到10000篇文章。苹果公司是世界上新闻报道最多的公司,每天收到约1800篇新闻文章。我们意识到需要一种新的摘要引擎,一种可以将大量新闻浓缩成简短、易于吸收要点的引擎。该系统将过滤噪音和重复内容,以识别和汇总有关公司、国家或市场的关键新闻。当给出用户查询时,彭博社的解决方案“关键新闻主题”(Key News Themes,简称NSTM)利用最先进的语义聚类技术和小说摘要方法,生成全面而简洁的摘要,极大地简化了新闻消费过程。NSTM可供世界各地数十万读者使用,每天以亚秒级的延迟处理数千个请求。在ACL 2020上,我们将展示NSTM的演示。