相关文档

电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 04 Association Rules of Data Reasoning（Apriori Algorithm、Improve of Apriori Algorithm）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 05 Clustering Analysis
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 03 Regression Analysis and Classification
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 03 Regression Analysis（Logistic Regression）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 02 Raw Data Analysis and Pre-processing（2.1-2.4）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 02 Raw Data Analysis and Pre-processing（2.5-2.7）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 01 Overview Data Analysis and Data Mining（李晓瑜）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）量子降维算法
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）量子神经网络（Neural Network，NN）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）量子支持向量机（support vector machine, SVM）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）量子机器学习（量子K-means算法）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）隐马尔科夫算法
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）降维算法
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）分类算法（朱钦圣）
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）聚类算法
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）量子力学
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）决策树
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）线性模型
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）模型评估与选择
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）绪论
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 04 Association Rules of Data Reasoning
电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 06 Classification
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第一章算法概述 Algorithm Introduction（刘瑶、陈佳）
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第二章递归与分治策略
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第三章动态规划 Dynamic Programming
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第四章贪心算法（Greedy Algorithm）
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第五章回朔法（Backtracking Algorithm）
电子科技大学：《算法设计与分析 Algorithms Design and Analysis》课程教学资源（课件讲稿）第六章分支限界法（Branch and Bound Method）
上饶师范学院：《数据库系统原理 An Introduction to Database System》课程教学资源（电子教案，颜清）
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）01 Introduction（肖鸣宇）
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）Stable Matching
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）02 Basics of algorithm design & analysis
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）03 Maximum Flow
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）04 NP and Computational Intractability
电子科技大学：《算法设计与分析 Design and Analysis of Algorithms》研究生课程教学资源（课件讲稿，英文版）05 Approximation Algorithms
电子科技大学：《现代密码理论 Modern Cryptographic Theory》课程教学资源（课件讲稿）第1章概述（李发根）
电子科技大学：《现代密码理论 Modern Cryptographic Theory》课程教学资源（课件讲稿）第2章古典密码
电子科技大学：《现代密码理论 Modern Cryptographic Theory》课程教学资源（课件讲稿）第3章流密码
电子科技大学：《现代密码理论 Modern Cryptographic Theory》课程教学资源（课件讲稿）第4章分组密码
电子科技大学：《现代密码理论 Modern Cryptographic Theory》课程教学资源（课件讲稿）第5章 Hash函数

电子科技大学：《数据分析与数据挖掘 Data Analysis and Data Mining》课程教学资源（课件讲稿）Lecture 04 Association Rules of Data Reasoning（FP-growth Algorithm）

团购合买资源类别：文库，文档格式：PDF，文档页数：42，文件大小：2.59MB

Lecture 4 Association Rules of Data Reasoning Dr.李晓瑜Xiaoyu Li Email:xiaoyuuestc@uestc.edu.cn http://blog.sciencenet.cn/u/uestc2014xiaoyu 2019-Spring SunData Group http://www.sundatagroup.org School of Information and Software Engineering,UESTC 1966 Copyright2019 by Xiaoyu Li

Dr.李晓瑜 Xiaoyu Li Email：xiaoyuuestc@uestc.edu.cn http://blog.sciencenet.cn/u/uestc2014xiaoyu 2019-Spring Lecture 4 Association Rules of Data Reasoning SunData Group http://www.sundatagroup.org/ School of Information and Software Engineering, UESTC Copyright © 2019 by Xiaoyu Li. 1

FP-growth Algorithm Use a compressed representation of the database using an FP-tree Once an FP-tree has been constructed,it uses a recursive divide-and-conquer approach to mine the frequent itemsets DATA 3 Copyright 2019 by Xiaoyu Li

FP-tree Construction null After reading TID=1: A:1 TID Items 1 (A,B) 2 (B,C,D) B:1○ 3 (A,C,D,E) 4 (A,D,E) After reading TID=2: 5 (A,B,C} null 6 (A,B,C,D) A:I B:l 7 {B,C} 8 (A,B,C) 9 (A,B,D) B:1 C:1 10 B.C,E) D:1 4 Copyright 2019 by Xiaoyu Li

FP-tree Construction TID Items Transaction 1 (A,B) Database 2 (B.C,D) null 3 (A,C,D,E) 4 (A,D,E) 5 (A,B,C) 6 A:7 B:3 (A,B,C,D) 7 (B,C) 8 (A,B,C) 9 (A,B,D) B:5 C:I D:1 C:3 10 (B.C,E) Header table D:1 :3 E:1 Item Pointer D: A 海年际带新际带标海司 B 带新带带带带带带带带 E:1 C D: 带带标带参带新 D Pointers are used to assist E frequent itemset generation ATA 5 Copyright 2019 by Xiaoyu Li

FP-growth null Conditional Pattern base for D: P={A:1,B:1,C:1) A:7 B:1 (A1,B:1) (A:1,C:1) (A:1), B:5 C:I (B1,C:1)} D:1 Recursively apply FP-growth C:3 ○Dl on P D:1 Frequent Itemsets found D:I (with sup>1): AD,BD,CD,ACD,BCD D:1 ATA 6 Copyright 2019 by Xiaoyu Li

Rule Generation Given a frequent itemset L,find all non-empty subsets f CL such that f-L-f satisfies the minimum confidence requirement If [A,B,C,D}is a frequent itemset,candidate rules: ABC→D, ABD→C, ACD→B, BCD→A, A→BCD, B→ACD, C→ABD, D→ABC AB→CD AC→BD, AD→BC BC→AD, BD→AC CD→AB, llf L =k,then there are 2k-2 candidate association rules(ignoring L→☑and☑→L) ATA Copyright 2019 by Xiaoyu Li

Rule generation How to efficiently generate rules from frequent itemsets? In general,confidence does not have an anti- monotone property c(ABC→D)can be larger or smaller than c(AB→D) But confidence of rules generated from the same itemset has an anti-monotone property -e.g.,L=(A,B,C,D): c(ABC→D)2c(AB→CD)≥c(A→BCD) Confidence is anti-monotone w.r.t.number of items on the RHS of the rule ATA 8 Copyright 2019 by Xiaoyu Li

Rule Generation for Apriori Lattice of rules ABCD=>(} Low Confidence Rule BCD=>A ACD=>B ABD=>C ABC=>D CD=>AB BD=>AC BC=>AD AD=>BC AC=>BD AB=>CD D=>ABC C=>ABD B=>ACD A=>BCD Pruned Rules ATA 9 Copyright 2019 by Xiaoyu Li

Rule Generation for Apriori Candidate rule is generated by merging two rules that share the same prefix in the rule consequent CD=>AB BD=>AC join(CD=>AB,BD=>AC) would produce the candidate rule D =ABC Prune rule D=>ABC if its D=>ABC subset AD=>BC does not have high confidence DATA 10 Copyright 2019 by Xiaoyu Li

点击进入文档下载页（PDF格式）

共42页，可试读14页，点击继续阅读 ↓↓

点击下载（PDF格式）

浏览记录