下载PDF摘要:本文综述了近几年发展起来的自然语言生成(NLG)系统的评价方法。我们将NLG评估方法分为三类:(1)以人为中心的评估指标;(2)不需要训练的自动评估指标;(3)机器学习的评估指标;对于每一类,我们讨论了已经取得的进展和仍然面临的挑战,重点是对最近提出的NLG任务和神经NLG模型的评估。在此基础上,给出了自动文本摘要和长文本生成的两个案例研究,并对全文进行了总结,提出了未来的研究方向。