点击切换搜索课件文库搜索结果(990)
文档格式:PDF 文档大小:2.17MB 文档页数:73
如何建立词项词典? 文档解析:格式?语言?编码方式? 词条化:词条(Tokens)/词项(Terms) 停用词:停用词表?查表法 or 基于文档频率 词项归一化:等价类同义词扩展表 词形归并:am, are, is be 词干还原:去除单词两端词缀、Porter算法 如何实现倒排记录表? • 跳表:跳表指针(位置、个数、更新问题) • 短语查询 • 二元词索引扩展的二元词索引:词性标注 • 位置信息索引邻近查询 • 增加倒排记录表 • 混合索引机制
文档格式:PPT 文档大小:1.2MB 文档页数:109
◼ 本章主要介绍语法分析的处理 ◼ 要进行语法分析,必须对语言的语法结构进行描述。 采用正规式和有限自动机可以描述和识别语言的单词符号; 用上下文无关文法来描述语法规则
文档格式:PDF 文档大小:5.18MB 文档页数:47
高三《日语》第32课 高考日语听力备考附件4:义务教育阶段课标单词及语法
文档格式:PDF 文档大小:759.98KB 文档页数:8
中文电子病历文本包含大量嵌套实体、句子语法结构复杂、句式偏短。为有效识别其医疗实体,提出一种融合多特征嵌入与注意力机制的命名实体识别算法,在输入表示层融合字符、单词、字形三个粒度的特征,并在双向长短期记忆网络的隐含层引入注意力机制,使算法在捕获特征时更加关注于医疗实体相关的字符,最终实现对中文电子病历中疾病、身体部位、症状、药物、操作五类实体的最优标注。面向开源和自建糖尿病数据集的实验结果中所提算法的实体识别准确率、召回率和F1值都达到97%以上,表明其可以更加有效地识别中文电子病历中各类实体
文档格式:PPTX 文档大小:181.87KB 文档页数:22
 单词  句子  段落组织
文档格式:PPT 文档大小:925KB 文档页数:25
选择字体、颜色 改变字号 格式化单词和字母 格式化整个段落 给列表定义样式
文档格式:DOC 文档大小:118.04KB 文档页数:24
小学英语四年级上册各单元重点单词、语音、句子读背资料
文档格式:DOC 文档大小:72KB 文档页数:18
西安建筑科技大学:《工程热力学》课程教学资源(电子教材)自编英文词汇单词表(一)
文档格式:DOC 文档大小:64KB 文档页数:4
ad prep.(后+acc.)到,近于 albus, adj. A. 白色的 alternatius, adj. A. 互生的 annus, adj. A. 一年生的 anthera, s.f.I. 花药
文档格式:DOC 文档大小:155KB 文档页数:26
If the preoccupation of schools with academic (a.①) work was lessened, more time might be spent teaching children surer values.[1995年阅读4] 【例句精译】 如果学校对学业的强调减少一些, 也许就有更多的时间教孩子更重要的价值观念
首页上页1617181920212223下页末页
热门关键字
搜索一下,找到相关课件或文库资源 990 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有