pretraining model greatly&#_中国高校课件下载中心

正在加载图片...

张德政等：基于ALBERT与双向GRU的中医脏腑定位模型 ·1183 pretraining model greatly reduces the number of model parameters compared with the BERT model and effectively reduces the model size.Finally,the F1-value of the Zang-fu localization model proposed in this paper reaches 0.8013 on the test set,which provided certain support for the TCM auxiliary diagnosis and treatment. KEY WORDS multi-label text classification:ALBERT:GRU:localization of Zang-fu:traditional Chinese medicine(TCM) 人工智能技术的快速发展为各个行业注入了提供了新的方法，多标签文本分类即为其中的重新的活力，也为中医学的发展提供了新的思路.随要方法.多标签文本分类是指一个样本可以属于着人工智能与中医的结合，也为中医的辅助诊疗多个类别（或标签）.比如一条症状同时与“肾”和提供了更多可能.中医学在历史上形成了多种辨 “肝”两个标签关联，即该症状表现与“肾”和“肝” 证方法，其中脏腑辨证是根据脏腑的生理功能，病两个脏腑相关.有研究人员从聚类的角度对文本理表现，对疾病证候进行归纳，借以推究病机，判进行多标签分类，申超波等图提出了一种基于标断病变的部位、性质、正邪盛衰情况的一种辨证签聚类的标签幂集方法，通过改进平衡k-means聚方法，是辨证体系中的重要组成部分.当某一脏腑类来发现训练集中潜在的重要标签集合，并用于发生病变时，反映出的临床症状也各不相同，且依形成新的训练集进行多标签分类.黄志强例对基据脏腑辨证特点，一个症状可涉及多个脏腑，所以于k-means的多标签分类及标签补全算法进行了本文将中医中的脏腑定位问题抽象为自然语言处研究理领域的多标签文本分类问题，将医案数据中的在基于神经网络对文本特征进行提取表示方症状类文本信息作为输入，将具体病变脏腑作为面，研究人员也进行了大量研究.李德玉等提多标签文本分类问题中的标签. 出一种基于标签特征的卷积神经网络(CNN)情绪多标签分类方法，使用Word2Vec进行词向量表 1研究现状示，然后利用标签特征来强化文本情绪和标签之在中医的辨证推理方面，已经有大量研究人间的联系，融合入CNN模型对文本情绪进行深层员进行过相关研究.许强山通过对经典证素辨证次的表示和多标签分类.Joulin等基于浅层神体系相关内容的总结，分析经典证素辨证体系存经网络设计出了文本分类工具FastText..易士翔等2，在的不足，并基于有向图这种数据结构重新对证在中文突发事件数据集上验证了双向LSTM模型素概念进行定义，对证素内容进行分类，并重新对在文本表征中的有效性.Chen等]在获得文本的辨证医理模型进行构建.尹丹等回采用领域本体整体语义(Text feature vector)后，将文本整体语义七步法构建中医经方知识图谱，并通过Cypher设输入到一个递归神经网络(RNN)的序列中作为初计一种模拟人联想思维进行检索的经方知识检索始值，每一时刻输入是上一时刻的输出，将卷积神框架.刘超等)基于BP神经网络方法，建立冠状经网络和递归神经网络进行集成应用，以获得全动脉临界病变患者证候要素及其常见组合的中医局和局部文本语义.Yogatama等w针对文本分类辨证诊断模型.褚娜在中医辨证的现状研究和问题构建了基于LSTM(Long short-term memory, 相关智能算法的基础上，提出适合于中医辨证的长短期记忆网络)的生成模型和判别模型.wang 理论方法和系统实施方案.杨开明阿将85例糖尿提出了中断递归神经网络(DRNN),将位置不变性病患者结合C4.5决策树算法建立了中医辨证决策引入RNN中.该网络通过限制RNN中的信息流树，提取出糖尿病的8种中医证候分类规则.周璐的距离，将每个时间步长的隐藏状态限制为表示等将C4.5决策树、随机森林、支持向量机、BP 当前位置附近的单词.Kiml6提出TextCNN,将卷神经网络算法进行融合，最终得到一种复合结构积神经网络应用到文本分类任务，利用多个不同的智能化辨证选方模型.舒鑫等基于神经网络大小的kernel提取句子中的关键信息，这种方法类构建了AS气虚证预测模型，并展现出了良好的似于多窗口大小的-gram,能够更好地捕捉局部准确率.在此类方法中，尚未充分使用运用文本的相关性高层语义信息，可以尝试在此类方法基础上融入在对多标签文本分类效果的提升过程中，输高层语义信息进行效果提升入高质量的文本表征对模型效果有巨大的作用自然语言处理技术的发展为中医的辨证论治基于大规模语料库的预训练模型已经成为自然语pretraining model greatly reduces the number of model parameters compared with the BERT model and effectively reduces the model size. Finally, the F1-value of the Zang-fu localization model proposed in this paper reaches 0.8013 on the test set, which provided certain support for the TCM auxiliary diagnosis and treatment. KEY WORDS multi-label text classification；ALBERT；GRU；localization of Zang-fu；traditional Chinese medicine (TCM) 人工智能技术的快速发展为各个行业注入了新的活力，也为中医学的发展提供了新的思路. 随着人工智能与中医的结合，也为中医的辅助诊疗提供了更多可能. 中医学在历史上形成了多种辨证方法，其中脏腑辨证是根据脏腑的生理功能，病理表现，对疾病证候进行归纳，借以推究病机，判断病变的部位、性质、正邪盛衰情况的一种辨证方法，是辨证体系中的重要组成部分. 当某一脏腑发生病变时，反映出的临床症状也各不相同，且依据脏腑辨证特点，一个症状可涉及多个脏腑，所以本文将中医中的脏腑定位问题抽象为自然语言处理领域的多标签文本分类问题，将医案数据中的症状类文本信息作为输入，将具体病变脏腑作为多标签文本分类问题中的标签. 1 研究现状在中医的辨证推理方面，已经有大量研究人员进行过相关研究. 许强[1] 通过对经典证素辨证体系相关内容的总结，分析经典证素辨证体系存在的不足，并基于有向图这种数据结构重新对证素概念进行定义，对证素内容进行分类，并重新对辨证医理模型进行构建. 尹丹等[2] 采用领域本体七步法构建中医经方知识图谱，并通过 Cypher 设计一种模拟人联想思维进行检索的经方知识检索框架. 刘超等[3] 基于 BP 神经网络方法，建立冠状动脉临界病变患者证候要素及其常见组合的中医辨证诊断模型. 褚娜[4] 在中医辨证的现状研究和相关智能算法的基础上，提出适合于中医辨证的理论方法和系统实施方案. 杨开明[5] 将 85 例糖尿病患者结合 C4.5 决策树算法建立了中医辨证决策树，提取出糖尿病的 8 种中医证候分类规则. 周璐等[6] 将 C4.5 决策树、随机森林、支持向量机、BP 神经网络算法进行融合，最终得到一种复合结构的智能化辨证选方模型. 舒鑫等[7] 基于神经网络构建了 AIS 气虚证预测模型，并展现出了良好的准确率. 在此类方法中，尚未充分使用运用文本的高层语义信息，可以尝试在此类方法基础上融入高层语义信息进行效果提升. 自然语言处理技术的发展为中医的辨证论治提供了新的方法，多标签文本分类即为其中的重要方法. 多标签文本分类是指一个样本可以属于多个类别（或标签）. 比如一条症状同时与“肾”和 “肝”两个标签关联，即该症状表现与“肾”和“肝” 两个脏腑相关. 有研究人员从聚类的角度对文本进行多标签分类，申超波等[8] 提出了一种基于标签聚类的标签幂集方法，通过改进平衡 k-means 聚类来发现训练集中潜在的重要标签集合，并用于形成新的训练集进行多标签分类. 黄志强[9] 对基于 k-means 的多标签分类及标签补全算法进行了研究. 在基于神经网络对文本特征进行提取表示方面，研究人员也进行了大量研究. 李德玉等[10] 提出一种基于标签特征的卷积神经网络（CNN）情绪多标签分类方法，使用 Word2Vec 进行词向量表示，然后利用标签特征来强化文本情绪和标签之间的联系，融合入 CNN 模型对文本情绪进行深层次的表示和多标签分类. Joulin 等[11] 基于浅层神经网络设计出了文本分类工具 FastText. 易士翔等[12] 在中文突发事件数据集上验证了双向 LSTM 模型在文本表征中的有效性. Chen 等[13] 在获得文本的整体语义 (Text feature vector) 后，将文本整体语义输入到一个递归神经网络（RNN）的序列中作为初始值，每一时刻输入是上一时刻的输出，将卷积神经网络和递归神经网络进行集成应用，以获得全局和局部文本语义. Yogatama 等[14] 针对文本分类问题构建了基于 LSTM（ Long short-term memory，长短期记忆网络）的生成模型和判别模型. Wang[15] 提出了中断递归神经网络（DRNN），将位置不变性引入 RNN 中. 该网络通过限制 RNN 中的信息流的距离，将每个时间步长的隐藏状态限制为表示当前位置附近的单词. Kim[16] 提出 TextCNN，将卷积神经网络应用到文本分类任务，利用多个不同大小的 kernel 提取句子中的关键信息，这种方法类似于多窗口大小的 n-gram，能够更好地捕捉局部相关性. 在对多标签文本分类效果的提升过程中，输入高质量的文本表征对模型效果有巨大的作用. 基于大规模语料库的预训练模型已经成为自然语张德政等：基于 ALBERT 与双向 GRU 的中医脏腑定位模型 · 1183 ·

<<向上翻页向下翻页>>

点击下载：《工程科学学报》：基于ALBERT与双向GRU的中医脏腑定位模型