文本生成评价研究综述

2020-06-29 19:15:14

下载PDF摘要：本文综述了近几年发展起来的自然语言生成(NLG)系统的评价方法。我们将NLG评估方法分为三类：(1)以人为中心的评估指标；(2)不需要训练的自动评估指标；(3)机器学习的评估指标；对于每一类，我们讨论了已经取得的进展和仍然面临的挑战，重点是对最近提出的NLG任务和神经NLG模型的评估。在此基础上，给出了自动文本摘要和长文本生成的两个案例研究，并对全文进行了总结，提出了未来的研究方向。