MLE不适合用于NLP • MLE选择的参数使训练语料具有最高的概率，它

正在加载图片...

MLE不适合用于NLP MLE选择的参数使训练语料具有最高的概率, 它没有浪费任何概率在于没有出现的现象中 ·但是MLE通常是不适合NLP的统计语言推导的,因为数据稀疏,如果一个为0,会向下传播一个例子说明数据稀疏:从 IBM Laser patent Text语料中1.5 Million的词进行训练,在同语料中的测试文本中,新出现23%的 trigram tokensMLE不适合用于NLP • MLE选择的参数使训练语料具有最高的概率，它没有浪费任何概率在于没有出现的现象中 • 但是MLE通常是不适合NLP的统计语言推导的，因为数据稀疏，如果一个为0，会向下传播… • 一个例子说明数据稀疏：从IBM Laser Patent Text语料中1.5 Million 的词进行训练，在同一语料中的测试文本中，新出现23%的trigram tokens

<<向上翻页向下翻页>>

点击下载：《自然语言处理》课程教学资源（PPT课件讲稿）语言模型