人气 9403

[资料下载] 《数据挖掘:方法与应用》智能制造之工业大数据书籍下载 [复制链接]

yuano8o8 2021-4-2 15:14:58
《数据挖掘:方法与应用》智能制造之工业大数据书籍下载
数据挖掘:方法与应用.jpg

主编推荐


" 数据挖掘出现于20 世纪80 年代后期,随着信息化技术的持续发展,它不断汲取统计学、机器学习、数据库技术、人工智能、模式识别和数据可视化等多学科领域的知识,无可争议地成为当今利用大数据分析获取知识的核心利器。本教材是浙江省“十三五”优势专业(经济统计学)、浙江省品质学科(统计学)、浙江省优势特色学科(统计学)的建设成果之一,具有以下显著特点: (1) 重视数据挖掘项目实现的整个流程,除了包含数据挖掘的经典理论与方法,还详细介绍了数据挖掘工具、挖掘的数据类型和存储环境、大数据平......

内容简介

本书以应用为导向介绍数据挖掘的相关工具、理论和方法,包括数据挖掘概述、数据挖掘工具、数据与数据平台、数据预处理、关联分析、决策树、贝叶斯分类和神经网络。通过循序渐进地讲解数据挖掘可使用的工具、数据存储及分析环境、原始数据可能存在的问题及相应的预处理方法、数据挖掘经典算法等相关知识,使读者对数据挖掘有整体的认识和了解。此外,本书以解决问题为目的,结合实例阐述了使用IBM SPSS Modeler和R软件进行数据挖掘的方法与步骤,便于读者更好地理解和掌握。本书可作为统计学、大数据等相关专业高年级本科生及硕士研究生数据挖掘课程的教材,也可作为其他数据挖掘爱好者的参考用书。


目录

第一章数据挖掘概述1
1.1数据挖掘的产生与发展1
1.1.1数据挖掘概念的提出2
1.1.2数据挖掘系统的发展3
1.1.3当前热点和未来趋势5
1.2数据挖掘过程10
1.2.1Fayyad过程模型10
1.2.2CRISP-DM过程模型11
1.3数据挖掘功能与使用技术21
1.3.1数据挖掘功能21
1.3.2数据挖掘使用技术22
1.4数据挖掘应用26
1.4.1金融领域的数据挖掘26
1.4.2电信领域的数据挖掘26
1.4.3零售与电子商务领域的数据挖掘27
1.4.4政府政务领域的数据挖掘27
1.4.5医疗领域的数据挖掘28
1.4.6科学领域的数据挖掘28
1.5练习与拓展28
第2章数据挖掘工具30
2.1Weka30
2.1.1Weka简述30
2.1.2Weka运行界面31
2.2IBMSPSSModeler34
2.2.1IBMSPSSModeler简述34
2.2.2IBMSPSSModeler主界面及功能35
2.3R语言41
2.3.1R语言简述41
2.3.2RStudio42
2.3.3R语言与数据挖掘42
2.4Python语言45
2.4.1Python语言简述45
2.4.2Python与数据分析46
2.4.3Anaconda46
2.5练习与拓展50
第3章数据与数据平台51
3.1数据类型51
3.1.1数据形态与数据类型51
3.1.2数据环境与数据类型54
3.2关系型数据库55
3.2.1关系型数据库概述55
3.2.2关系型数据库管理系统56
3.3NoSQL数据库57
3.3.1键值数据库57
3.3.2文档数据库58
3.3.3列族数据库60
3.3.4图数据库61
3.4数据仓库与大数据平台63
3.4.1数据仓库63
3.4.2大数据平台68
3.5练习与拓展74
第4章数据预处理75
4.1数据预处理概述75
4.1.1原始数据中存在的问题75
4.1.2数据预处理的主要任务77
4.2数据清洗77
4.2.1缺失数据处理77
4.2.2异常数据处理78
4.3数据集成80
4.3.1模式匹配及数值一致化80
4.3.2删除冗余数据81
4.4数据变换82
4.4.1定性数据数值化82
4.4.2定量数据离散化和规范化83
4.4.3不平衡数据处理84
4.5数据归约85
4.5.1属性的归约85
4.5.2记录的归约87
4.5.3数值的归约88
4.6练习与拓展89
第5章关联分析90
5.1关联分析概述90
5.1.1关联分析基本概念91
5.1.2关联规则挖掘的基本过程93
5.2Apriori算法94
5.2.1Apriori性质94
5.2.2Apriori算法的频繁项集产生95
5.3强关联规则的悖论99
5.3.1强关联规则不一定是有趣的规则99
5.3.2基于提升度过滤无趣的强关联规则100
5.3.3基于支持度、置信度及提升度的关联规则发现100
5.4基于IBMSPSSModeler的应用103
5.4.1事实表数据的应用示例103
5.4.2事务表数据的应用示例113
5.5基于R语言的应用123
5.5.1数据初探123
5.5.2可视化交易数据125
5.5.3挖掘关联规则127
5.5.4可视化关联规则130
5.6练习与拓展134
第6章决策树136
6.1决策树概述136
6.1.1决策树分析相关概念137
6.1.2决策树分析核心问题138
6.2ID3算法138
6.2.1信息论的基本概念138
6.2.2ID3算法基本原理139
6.2.3使用ID3算法建立决策树141
6.3C5.0算法143
6.3.1C5.0算法的决策树生长144
6.3.2C5.0算法的决策树修剪149
6.4基于IBMSPSSModeler的应用151
6.4.1数据读取与审核152
6.4.2探索性分析153
6.4.3数据预处理158
6.4.4决策树模型构建与评估:基于C5.0算法163
6.4.5预测结果170
6.5基于R语言的应用171
6.5.1数据探索172
6.5.2数据分区177
6.5.3模型训练与评估178
6.5.4使用boosting和代价矩阵调整模型181
6.6练习与拓展184
第7章贝叶斯分类185
7.1贝叶斯分类概述185
7.1.1贝叶斯定理186
7.1.2贝叶斯信念网络186
7.2朴素贝叶斯分类188
7.2.1朴素贝叶斯分类原理188
7.2.2朴素贝叶斯分类计算示例191
7.2.3零概率问题:拉普拉斯平滑193
7.3TAN贝叶斯分类194
7.3.1TAN贝叶斯网络结构194
7.3.2TAN贝叶斯分类过程195
7.4基于IBMSPSSModeler的应用196
7.4.1数据读取与审核198
7.4.2探索性分析199
7.4.3数据预处理208
7.4.4TAN贝叶斯分类模型构建与评估210
7.5基于R语言的应用214
7.5.1数据探索214
7.5.2文本数据预处理215
7.5.3划分数据集219
7.5.4词云分析221
7.5.5模型训练与评估223
7.6练习与拓展225
第8章神经网络226
8.1神经网络概述226
8.1.1生物神经元与人工神经元226
8.1.2激活函数227
8.1.3神经网络的拓扑结构230
8.2BP神经网络232
8.2.1BP神经网络的学习过程232
8.2.2BP算法描述237
8.2.3前馈神经网络计算示例238
8.3卷积神经网络240
8.3.1卷积层240
8.3.2激活层243
8.3.3池化层244
8.3.4全连接层244
8.4基于IBMSPSSModeler的应用245
8.4.1数据读取246
8.4.2“数据审核”节点预处理247
8.4.3探索性分析250
8.4.4分区与平衡251
8.4.5模型构建与评价252
8.5基于R语言的应用260
8.5.1数据初探260
8.5.2数据转换与分区263
8.5.3模型构建与评价263
8.6练习与拓展268
参考文献270

下载地址

链接: https://pan.baidu.com/s/158svF60APwkWIuVMrz0sMQ
提取码:
游客,如果您要查看本帖隐藏内容请回复


xzgx34 2021-4-14 12:46:10
谢谢分析
回复

使用道具 举报

shl662950 2021-5-25 08:39:25
谢谢分享
回复

使用道具 举报

chenmessi 2021-6-8 13:39:19
谢谢分享
回复

使用道具 举报

sqYang1988 2021-7-7 22:59:06
感谢分享
回复

使用道具 举报

singham 2021-7-7 23:11:56
谢谢校长
回复

使用道具 举报

dw996 2021-7-18 23:00:38
thx fr sharing
回复

使用道具 举报

xuegao 2021-7-30 10:54:54
谢谢分享
回复

使用道具 举报

q531062 2021-10-11 22:38:51
谢谢分享
回复

使用道具 举报

问道六卫 2023-7-25 07:26:57
谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|手机版|精益人 ( 沪ICP备19004111号-1 )|网站地图

GMT+8, 2024-12-22 13:01 , Processed in 0.681549 second(s), 22 queries .

Powered by Lean.ren X3.5 Licensed  © 2001-2030 LEAN.REN