正在加载图片...
MLE不适合用于NLP MLE选择的参数使训练语料具有最高的概率, 它没有浪费任何概率在于没有出现的现象中 ·但是MLE通常是不适合NLP的统计语言推导 的,因为数据稀疏,如果一个为0,会向下传 播 一个例子说明数据稀疏:从 IBM Laser patent Text语料中1.5 Million的词进行训练,在同 语料中的测试文本中,新出现23%的 trigram tokensMLE不适合用于NLP • MLE选择的参数使训练语料具有最高的概率, 它没有浪费任何概率在于没有出现的现象中 • 但是MLE通常是不适合NLP的统计语言推导 的,因为数据稀疏,如果一个为0,会向下传 播… • 一个例子说明数据稀疏:从IBM Laser Patent Text语料中1.5 Million 的词进行训练,在同一 语料中的测试文本中,新出现23%的trigram tokens
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有