SQL Server数据挖掘与商业智能基础及案例实战

简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书全面介绍了数据挖掘与商业智能的基本概念与原理,包括经典理论与趋势发展,并深入叙述了各种数据挖掘的技术与典型应用。通过本书的学习,读者可以对数据挖掘与商业智能的整体结构、概念、原理、技术和发展有深入的了解和认识。
本书共四部分:第一部分介绍数据仓库、数据挖掘与商业智能之间的关系;第二部分对Microsoft SQL Server的整体架构进行介绍,并详细阐述直接与数据挖掘相关的两个服务:分析服务和报表服务;第三部分逐一阐述Microsoft SQL Server中包含的九种数据挖掘模型;第四部分提供四个数据挖掘的案例以及数据挖掘模型的评估,通过模仿练习,读者可获得实际的数据挖掘经验,稍加修改就能在自己所处的领域中加以应用。
本书配有案例的相关素材文件,读者可以从万水书苑以及中国水利水电出版社网站下载,网址为:http://www.wsbookshow.com和http://www.waterpub.com.cn/softdown/。
本书为经台湾碁峰资讯股份有限公司独家授权发行的中文简体版。本书中文简体字版在中国大陆之专有出版权属中国水利水电出版社所有。在没有得到本书原版出版者和本书出版者书面许可时,任何单位和个人不得擅自摘抄、复制本书的一部分或全部以任何方式包括(资料和出版物)进行传播。本书原版版权属碁峰资讯股份有限公司。版权所有,侵权必究。
Microsoft商业智能中一项重要的技术为数据挖掘的分析技术,主要是在大量数据库中寻找有意义或有价值的信息的过程。透过机器学习技术或是统计分析方法论,根据整合的资料加以分析探索,发掘出隐含在数据中的特性,通过专业领域知识(Domain Know-how)整合及解释,从中找出合理且有用的信息,经过相关部门针对该模型的评估后,再提供给相关决策单位加以运用。
近年来,数据量的增加速度越来越快,加上商业智能的运用早已受到企业的重视。将企业累积的数据库,透过大量的信息与相关信息的分析,更能找出顾客区分、消费行为、业务成本与效率等对企业极为重要的信息。通过商业智能的应用,使之更深入了解客户,并可协助业务的开发以及增加在顾客管理上的有效性。
随着知识经济时代来临,企业间的竞争模式从传统的采用压低成本与价格的杀价流血竞争,到近来倡导以创新为核心竞争力。不论哪一种策略模式,都是不断在技术研发、制造生产、营销销售、客户服务或资源分配等相关问题上,寻求问题的发生原因并尝试找出解决方案。在不同运营阶段,陆续累积的庞大数据,往往就是答案的隐身之所。因此,如何善用数据,从运营的历史记录中,挖掘出深藏其中的宝贵经验(金矿),就是数据挖掘(Data Mining)的目的。
相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SQL Server 2014可为您的关键任务应用程序提供突破性的性能、可用性和可管理性。SQL Server 2014 还针对在线事务处理(OLTP)和数据仓库提供了把核心数据库内置于内存中 (In-Memory)的新功能,完善了现有数据仓库和商业智能的功能。借助这些功能,极大提升了企业在商业智能处理方面的性能与效率。然而如何充分发挥Microsoft SQL Server在商业智能应用中的效力,则需要一定的专业知识和学习过程。针对业界实务上的需求,我们编写了这本教程,以期在实务应用和理论方法之间搭建一座桥梁。让读者迅速掌握现代商业智能应用的主要内容。
Chapter 1 绪论 2
1-1 商业智能 3
1-1-1 什么是商业智能 3
1-1-2 商业智能作用及意义 3
1-1-3 商业智能架构 4
1-1-4 商业智能中的挑战 6
1-2 数据挖掘 7
1-3 大数据 9
1-3-1 何谓大数据 9
1-3-2 大数据的应用 9
1-4 云计算 10
Chapter 2 数据仓库 13
2-1 数据仓库定义 14
2-2 数据仓库特性 14
2-3 数据仓库架构 15
2-4 创建数据仓库的目的 17
2-5 数据仓库的运用 18
2-6 数据仓库的管理 19
2-7 No SQL数据库 19
2-7-1 Key-Value型数据库 20
2-7-2 内存数据库(In-memory Database) 20
2-7-3 文件数据库(Document Database) 20
2-7-4 图形数据库(Graph Database) 20
2-8 Hadoop 21
Chapter 3 数据挖掘简介 22
3-1 数据挖掘的定义 23
3-2 数据挖掘的重要性 23
3-3 数据挖掘的功能 23
3-4 数据挖掘的步骤 24
3-5 数据挖掘建模的标准CRISP-DM 25
3-6 数据挖掘的应用 27
3-7 数据挖掘软件介绍 28
3-8 数据挖掘与Excel 30
Chapter 4 数据挖掘的主要方法 31
4-1 回归分析(Regression Analysis) 32
4-1-1 简单线性回归分析(Simple Linear
Regression Analysis) 32
4-1-2 多元回归分析(Multiple Regression
Analysis) 32
4-1-3 脊回归分析(Ridge Regression
Analysis) 32
4-1-4 逻辑回归分析(Logistic Regression
Analysis) 34
4-2 关联规则(Association Rule) 34
4-3 聚类分析(Cluster Analysis) 34
4-4 判别分析(Discriminant Analysis) 36
4-5 神经网络(Artificial Neural Network) 37
4-6 决策树(Decision Tree) 39
4-7 其他分析方法 40
Chapter 5 数据挖掘与相关领域的关系 42
5-1 数据挖掘与统计分析 43
5-2 数据挖掘与数据仓库 43
5-3 数据挖掘与知识发现(KDD) 44
5-4 数据挖掘与OLAP 45
5-5 数据挖掘与机器学习 46
5-6 数据挖掘与Web数据挖掘 46
5-7 数据挖掘、云计算与大数据 47
PART II Microsoft SQL Server概述
Chapter 6 Microsoft SQL Server中的商业智能 49
6-1 Microsoft SQL Server入门 50
6-2 关系数据仓库 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技术 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的
数据挖掘功能 56
7-1 创建商业智能应用程序 57
7-2 Microsoft SQL Server数据挖掘功能
的优势 59
7-2-1 易于使用 59
7-2-2 简单而丰富的API 59
7-2-3 可伸缩性 60
7-2-4 数据挖掘算法 60
7-3 Microsoft SQL Server数据挖掘算法 61
7-4 Microsoft SQL Server可扩展性 62
7-5 Microsoft SQL Server是数据挖掘与
商业智能的结合 62
7-5-1 数据分析 62
7-5-2 报告 63
7-6 使用数据挖掘可以解决的问题 63
7-6-1 构建挖掘模型 63
7-6-2 构建数据挖掘应用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服务
(Analysis Services) 67
8-1 创建多维数据集的结构 68
8-2 建立和部署多维数据集 69
8-3 从模板创建自定义的数据库 69
8-4 统一维度模型 70
8-5 基于属性的维度 71
8-6 维度类型 72
8-7 量度组和数据视图 72
8-8 计算效率 73
8-9 MDX脚本 74
8-10 存储过程 75
8-11 关键绩效指标(KPI) 75
8-12 实时商业智能 76
Chapter 9 Microsoft SQL Server的报表服务
(Reporting Services) 78
9-1 为何使用报表服务 79
9-2 报表服务的功能 80
9-2-1 制作报表 80
9-2-2 管理报表 80
9-2-3 提交报表 81
Chapter 10 Microsoft SQL Server的整合服务 83
10-1 SSIS介绍 84
10-1-1 DTS与SSIS 84
10-1-2 DTS升级到Integration Services
重点 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration
Service)架构图 85
10-1-5 Integration Service数据流 85
10-1-6 SSIS Designer 87
10-1-7 数据流 87
10-1-8 控制流 88
10-2 操作示例 92
10-2-1 将Excel数据表导入SQL数据库
中的数据表 92
10-2-2 对数据进行抽样 103
Chapter 11 Microsoft SQL Server的
DMX语言 114
11-1 DMX语言介绍 115
11-2 DMX函数 117
11-2-1 模型建立 117
11-2-2 模型训练 118
11-2-3 模型使用(预测) 118
11-2-4 其他函数语法 119
11-3 DMX语法 122
11-3-1 决策树 123
11-3-2 贝叶斯概率分类 124
11-3-3 关联规则 125
11-3-4 聚类分析 126
11-3-5 时序聚类分析 127
11-3-6 线性回归分析 127
11-3-7 逻辑回归 128
11-3-8 神经网络 129
11-3-9 时序 130
11-4 DMX操作实例 131
11-4-1 分类(classification) 132
11-4-2 评估(estimation) 133
11-4-3 预测(prediction) 134
11-4-4 关联分组(affinity grouping) 135
11-4-5 聚类分组(clustering) 136
PART III Microsoft SQL Server 中的数据挖掘模型
Chapter 12 决策树模型 138
12-1 基本概念 139
12-2 决策树与判别函数 139
12-3 计算方法 140
12-4 操作范例 142
Chapter 13 贝叶斯分类器 152
13-1 基本概念 153
13-2 操作范例 155
Chapter 14 关联规则 166
14-1 基本概念 167
14-2 关联规则的种类 168
14-3 关联规则的算法:Apriori算法 168
14-4 操作范例 169
Chapter 15 聚类分析 179
15-1 基本概念 180
15-2 层级聚类法与动态聚类法 180
15-3 操作范例 185
Chapter 16 时序聚类 197
16-1 基本概念 198
16-2 主要算法 198
16-3 操作示例 200
Chapter 17 线性回归模型 210
17-1 基本概念 211
17-2 一元回归模型 212
17-2-1 模型假设及推估 212
17-2-2 回归模型测试 215
17-3 多元回归模型 216
17-3-1 回归效果的评估 216
17-3-2 回归变量的选择 218
17-4 操作范例 219
Chapter 18 逻辑回归模型 228
18-1 基本概念 229
18-2 logit变换与logistic分布 229
18-3 逻辑回归模型 231
18-4 操作范例 232
Chapter 19 人工神经网络模型 242
19-1 基本概念 243
19-2 神经网络模型的特点 245
19-3 神经网络模型的优劣比较 245
19-4 操作范例 247
Chapter 20 时序模型 257
20-1 基本概念 258
20-2 时序的构成 260
20-3 简单时序的预测 266
20-4 包含趋势与季节成分的时序预测 268
20-5 参数化的时序预测模型 270
20-6 操作范例 274
PART IV Microsoft SQL Server数据挖掘应用实例
Chapter 21 决策树模型实例 285
Chapter 22 逻辑回归模型实例 293
22-1 回归模型实例一:肾细胞癌转移
的回归模型 294
22-2 回归模型实例二:高中升学数据
的回归模型 300
22-3 回归模型实例三 306
Chapter 23 神经网络模型实例 312
23-1 实例一:肾细胞癌转移的神经
网络模型 313
23-2 实例二:电信行业神经网络模型 319
Chapter 24 时序模型实例 332
24-1 实例一:电力负载的时序模型 333
24-2 实例二:进出品货物价值的
时序模型 338
Chapter 25 如何评估数据挖掘模型 344
25-1 评估图节点Evaluation Chart
Node介绍 345
25-2 在SQL Server中如何评估模型 348
25-3 规则度量:支持度与可信度 353
25-4 结论 355
- 信息技术基础(麒麟操作系统+WPS Office) [主编 芮雪 蒋莉 王亮亮]
- Office高级应用项目式教程(第2版) [主编 李观金 张倩文 黎夏克 ]
- 巧用翻译学英语:英汉互译500例 [王学文 著]
- 高等教育多维评价体系构建与高质量发展研究 [张妍 著]
- 系统规划与管理师章节习题与考点特训(第二版) [主编 薛大龙]
- 计算机操作系统实践指导(openEuler版) [主编 秦光 曾陈萍 岳付强]
- 信息系统管理工程师真题及模考卷精析(适用机考) [主 编 薛大龙 程 刚 上官绪]
- 航海类院校体育教育教学研究 [张利超 李宁 著]
- 新时代背景下我国职业教育产教融合长效机制建设研究 [王玉贤 著]
- 电路分析 [主编 李飞 毛先柏]
- 信息系统管理工程师(适用第2版大纲)一站通关 [指尖疯 编著]
- 传统山水画论解读与实践 [陈钠 著]
- 网络工程师备考一本通(适配第6版考纲) [夏杰 编著]
- 陈孝云的职教理想与情怀 [祝吉太 江传瑞 张义廷 著]
- 地方本科院校电子信息学科课程思政案例集 [王甫]
- Excel数据处理与分析(第二版) [主编 张志明 邹 蕾]
- 网络工程师5天修炼(适配第6版考纲) [主编 朱小平 施游]
- 仓储管理实务(第二版) [周宁武 编著]
- 基于AE与C#的地理信息系统二次开发 [李小根 贾艳昌 乔翠平 姜彤 ]
- 2023年长沙市文化和旅游业发展报告 [主编 陈莉]
- 舞台化妆造型设计 [主编 刘思彤 张 涛 张忆雨]
- 产教融合视角高校体育专业实践教学体系构建研究 [杨柳青 叶华兵 著]
- 知识图谱及应用案例 [张善文 黄文准 于长青 陈明淑]
- Python程序设计案例教程(微课版) [主编 石利平 田辉平 余以胜]
- 皓月繁星:青少年儿童心理成长手册 [主 编 林赞歌 副主编 杜志南]
- 材料力学 [章宝华 赵新胜 徐斌]
- 系统集成项目管理工程师考试32小时通关(第3版) [主编 薛大龙 副主编 上官绪阳]
- 软考论文高分特训与范文10篇——系统分析师(第二版) [薛大龙 邹月平 施游]
- 黄河海勃湾水利枢纽防凌安全运行 [王战领 王丛发 范瑜彬 著]
- 大学生心理健康教育 [方雄 著]