Tensorboy's Home Try your best

Word Embedding Evaluation

词向量的评价大体上可以分成两种方式,第一种是把词向量融入现有系统中,看对系统性能的提升;第二种是直接从语言学的角度对词向量进行分析,如相似度、语义偏移等。

  1. 提升现有系统, 最常见的有两种

   直接用于神经网络模型的输入层或者作为辅助特征扩充现有模型

  1. 语言学评价

    • 将词向量的相似度与人工标注的相似度做比较
    • 类比(analogy)的方式来评测(Mikolov, 2013)
  2. Reference