SQL Server数据挖掘与商业智能基础及案例实战
简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书全面介绍了数据挖掘与商业智能的基本概念与原理,包括经典理论与趋势发展,并深入叙述了各种数据挖掘的技术与典型应用。通过本书的学习,读者可以对数据挖掘与商业智能的整体结构、概念、原理、技术和发展有深入的了解和认识。
本书共四部分:第一部分介绍数据仓库、数据挖掘与商业智能之间的关系;第二部分对Microsoft SQL Server的整体架构进行介绍,并详细阐述直接与数据挖掘相关的两个服务:分析服务和报表服务;第三部分逐一阐述Microsoft SQL Server中包含的九种数据挖掘模型;第四部分提供四个数据挖掘的案例以及数据挖掘模型的评估,通过模仿练习,读者可获得实际的数据挖掘经验,稍加修改就能在自己所处的领域中加以应用。
本书配有案例的相关素材文件,读者可以从万水书苑以及中国水利水电出版社网站下载,网址为:http://www.wsbookshow.com和http://www.waterpub.com.cn/softdown/。
本书为经台湾碁峰资讯股份有限公司独家授权发行的中文简体版。本书中文简体字版在中国大陆之专有出版权属中国水利水电出版社所有。在没有得到本书原版出版者和本书出版者书面许可时,任何单位和个人不得擅自摘抄、复制本书的一部分或全部以任何方式包括(资料和出版物)进行传播。本书原版版权属碁峰资讯股份有限公司。版权所有,侵权必究。
Microsoft商业智能中一项重要的技术为数据挖掘的分析技术,主要是在大量数据库中寻找有意义或有价值的信息的过程。透过机器学习技术或是统计分析方法论,根据整合的资料加以分析探索,发掘出隐含在数据中的特性,通过专业领域知识(Domain Know-how)整合及解释,从中找出合理且有用的信息,经过相关部门针对该模型的评估后,再提供给相关决策单位加以运用。
近年来,数据量的增加速度越来越快,加上商业智能的运用早已受到企业的重视。将企业累积的数据库,透过大量的信息与相关信息的分析,更能找出顾客区分、消费行为、业务成本与效率等对企业极为重要的信息。通过商业智能的应用,使之更深入了解客户,并可协助业务的开发以及增加在顾客管理上的有效性。
随着知识经济时代来临,企业间的竞争模式从传统的采用压低成本与价格的杀价流血竞争,到近来倡导以创新为核心竞争力。不论哪一种策略模式,都是不断在技术研发、制造生产、营销销售、客户服务或资源分配等相关问题上,寻求问题的发生原因并尝试找出解决方案。在不同运营阶段,陆续累积的庞大数据,往往就是答案的隐身之所。因此,如何善用数据,从运营的历史记录中,挖掘出深藏其中的宝贵经验(金矿),就是数据挖掘(Data Mining)的目的。
相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SQL Server 2014可为您的关键任务应用程序提供突破性的性能、可用性和可管理性。SQL Server 2014 还针对在线事务处理(OLTP)和数据仓库提供了把核心数据库内置于内存中 (In-Memory)的新功能,完善了现有数据仓库和商业智能的功能。借助这些功能,极大提升了企业在商业智能处理方面的性能与效率。然而如何充分发挥Microsoft SQL Server在商业智能应用中的效力,则需要一定的专业知识和学习过程。针对业界实务上的需求,我们编写了这本教程,以期在实务应用和理论方法之间搭建一座桥梁。让读者迅速掌握现代商业智能应用的主要内容。
Chapter 1 绪论 2
1-1 商业智能 3
1-1-1 什么是商业智能 3
1-1-2 商业智能作用及意义 3
1-1-3 商业智能架构 4
1-1-4 商业智能中的挑战 6
1-2 数据挖掘 7
1-3 大数据 9
1-3-1 何谓大数据 9
1-3-2 大数据的应用 9
1-4 云计算 10
Chapter 2 数据仓库 13
2-1 数据仓库定义 14
2-2 数据仓库特性 14
2-3 数据仓库架构 15
2-4 创建数据仓库的目的 17
2-5 数据仓库的运用 18
2-6 数据仓库的管理 19
2-7 No SQL数据库 19
2-7-1 Key-Value型数据库 20
2-7-2 内存数据库(In-memory Database) 20
2-7-3 文件数据库(Document Database) 20
2-7-4 图形数据库(Graph Database) 20
2-8 Hadoop 21
Chapter 3 数据挖掘简介 22
3-1 数据挖掘的定义 23
3-2 数据挖掘的重要性 23
3-3 数据挖掘的功能 23
3-4 数据挖掘的步骤 24
3-5 数据挖掘建模的标准CRISP-DM 25
3-6 数据挖掘的应用 27
3-7 数据挖掘软件介绍 28
3-8 数据挖掘与Excel 30
Chapter 4 数据挖掘的主要方法 31
4-1 回归分析(Regression Analysis) 32
4-1-1 简单线性回归分析(Simple Linear
Regression Analysis) 32
4-1-2 多元回归分析(Multiple Regression
Analysis) 32
4-1-3 脊回归分析(Ridge Regression
Analysis) 32
4-1-4 逻辑回归分析(Logistic Regression
Analysis) 34
4-2 关联规则(Association Rule) 34
4-3 聚类分析(Cluster Analysis) 34
4-4 判别分析(Discriminant Analysis) 36
4-5 神经网络(Artificial Neural Network) 37
4-6 决策树(Decision Tree) 39
4-7 其他分析方法 40
Chapter 5 数据挖掘与相关领域的关系 42
5-1 数据挖掘与统计分析 43
5-2 数据挖掘与数据仓库 43
5-3 数据挖掘与知识发现(KDD) 44
5-4 数据挖掘与OLAP 45
5-5 数据挖掘与机器学习 46
5-6 数据挖掘与Web数据挖掘 46
5-7 数据挖掘、云计算与大数据 47
PART II Microsoft SQL Server概述
Chapter 6 Microsoft SQL Server中的商业智能 49
6-1 Microsoft SQL Server入门 50
6-2 关系数据仓库 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技术 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的
数据挖掘功能 56
7-1 创建商业智能应用程序 57
7-2 Microsoft SQL Server数据挖掘功能
的优势 59
7-2-1 易于使用 59
7-2-2 简单而丰富的API 59
7-2-3 可伸缩性 60
7-2-4 数据挖掘算法 60
7-3 Microsoft SQL Server数据挖掘算法 61
7-4 Microsoft SQL Server可扩展性 62
7-5 Microsoft SQL Server是数据挖掘与
商业智能的结合 62
7-5-1 数据分析 62
7-5-2 报告 63
7-6 使用数据挖掘可以解决的问题 63
7-6-1 构建挖掘模型 63
7-6-2 构建数据挖掘应用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服务
(Analysis Services) 67
8-1 创建多维数据集的结构 68
8-2 建立和部署多维数据集 69
8-3 从模板创建自定义的数据库 69
8-4 统一维度模型 70
8-5 基于属性的维度 71
8-6 维度类型 72
8-7 量度组和数据视图 72
8-8 计算效率 73
8-9 MDX脚本 74
8-10 存储过程 75
8-11 关键绩效指标(KPI) 75
8-12 实时商业智能 76
Chapter 9 Microsoft SQL Server的报表服务
(Reporting Services) 78
9-1 为何使用报表服务 79
9-2 报表服务的功能 80
9-2-1 制作报表 80
9-2-2 管理报表 80
9-2-3 提交报表 81
Chapter 10 Microsoft SQL Server的整合服务 83
10-1 SSIS介绍 84
10-1-1 DTS与SSIS 84
10-1-2 DTS升级到Integration Services
重点 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration
Service)架构图 85
10-1-5 Integration Service数据流 85
10-1-6 SSIS Designer 87
10-1-7 数据流 87
10-1-8 控制流 88
10-2 操作示例 92
10-2-1 将Excel数据表导入SQL数据库
中的数据表 92
10-2-2 对数据进行抽样 103
Chapter 11 Microsoft SQL Server的
DMX语言 114
11-1 DMX语言介绍 115
11-2 DMX函数 117
11-2-1 模型建立 117
11-2-2 模型训练 118
11-2-3 模型使用(预测) 118
11-2-4 其他函数语法 119
11-3 DMX语法 122
11-3-1 决策树 123
11-3-2 贝叶斯概率分类 124
11-3-3 关联规则 125
11-3-4 聚类分析 126
11-3-5 时序聚类分析 127
11-3-6 线性回归分析 127
11-3-7 逻辑回归 128
11-3-8 神经网络 129
11-3-9 时序 130
11-4 DMX操作实例 131
11-4-1 分类(classification) 132
11-4-2 评估(estimation) 133
11-4-3 预测(prediction) 134
11-4-4 关联分组(affinity grouping) 135
11-4-5 聚类分组(clustering) 136
PART III Microsoft SQL Server 中的数据挖掘模型
Chapter 12 决策树模型 138
12-1 基本概念 139
12-2 决策树与判别函数 139
12-3 计算方法 140
12-4 操作范例 142
Chapter 13 贝叶斯分类器 152
13-1 基本概念 153
13-2 操作范例 155
Chapter 14 关联规则 166
14-1 基本概念 167
14-2 关联规则的种类 168
14-3 关联规则的算法:Apriori算法 168
14-4 操作范例 169
Chapter 15 聚类分析 179
15-1 基本概念 180
15-2 层级聚类法与动态聚类法 180
15-3 操作范例 185
Chapter 16 时序聚类 197
16-1 基本概念 198
16-2 主要算法 198
16-3 操作示例 200
Chapter 17 线性回归模型 210
17-1 基本概念 211
17-2 一元回归模型 212
17-2-1 模型假设及推估 212
17-2-2 回归模型测试 215
17-3 多元回归模型 216
17-3-1 回归效果的评估 216
17-3-2 回归变量的选择 218
17-4 操作范例 219
Chapter 18 逻辑回归模型 228
18-1 基本概念 229
18-2 logit变换与logistic分布 229
18-3 逻辑回归模型 231
18-4 操作范例 232
Chapter 19 人工神经网络模型 242
19-1 基本概念 243
19-2 神经网络模型的特点 245
19-3 神经网络模型的优劣比较 245
19-4 操作范例 247
Chapter 20 时序模型 257
20-1 基本概念 258
20-2 时序的构成 260
20-3 简单时序的预测 266
20-4 包含趋势与季节成分的时序预测 268
20-5 参数化的时序预测模型 270
20-6 操作范例 274
PART IV Microsoft SQL Server数据挖掘应用实例
Chapter 21 决策树模型实例 285
Chapter 22 逻辑回归模型实例 293
22-1 回归模型实例一:肾细胞癌转移
的回归模型 294
22-2 回归模型实例二:高中升学数据
的回归模型 300
22-3 回归模型实例三 306
Chapter 23 神经网络模型实例 312
23-1 实例一:肾细胞癌转移的神经
网络模型 313
23-2 实例二:电信行业神经网络模型 319
Chapter 24 时序模型实例 332
24-1 实例一:电力负载的时序模型 333
24-2 实例二:进出品货物价值的
时序模型 338
Chapter 25 如何评估数据挖掘模型 344
25-1 评估图节点Evaluation Chart
Node介绍 345
25-2 在SQL Server中如何评估模型 348
25-3 规则度量:支持度与可信度 353
25-4 结论 355
- 输水管线工程风险管理 [张勇 党亥生 著]
- 民用航空飞机标准线路施工 [主编 王志敏 陈明]
- 不息的水脉—大运河讲谈录 [赵珩 著]
- 实用运筹学 [主编 邢育红 于晋臣]
- 三峡梯级电站水资源决策支持系统研究与开发 [姚华明 潘红忠 汤正]
- 海南黎族民俗文化鉴赏 [庞国华 著]
- 石墨烯在太赫兹及中红外频段电磁器件设计中的应用 [李艳秀 庄华伟 著]
- 电子技术(第二版) [主编 覃爱娜 李飞]
- 办公自动化高级应用 [陈萍 朱晓玉]
- 信息处理技术员考试32小时通关 [薛大龙]
- 电子产品设计案例教程(微课版)—基于嘉立创EDA(专业版) [王静 莫志宏 陈学昌 丁红]
- C程序设计实践教程 [刘卫国]
- C程序设计(慕课版) [刘卫国]
- Web技术开发教程(基于.NET开源MVC框架) [王合闯 韩红玲 王青正 陈海蕊]
- 商务英语翻译教程(笔译)(第四版) [主编 王军平]
- 智慧零售技术与应用 [洪旭 著]
- 建设工程法规实务 [主编 余滢]
- 商务秘书理论与实务(第三版) [主编 张同钦]
- 程序设计基础实践教程(C/C++语言版) [张桂芬 葛丽娜]
- C++案例项目精讲 [主编 杨国兴]
- 劳动争议处理实务 [主编 王秀卿 罗静]
- 工程数学 [主编 郭立娟 王海]
- 语音识别理论与实践 [主编 莫宏伟]
- 信息系统项目管理师章节习题与考点特训(第二版) [主编 薛大龙]
- 武术基础教程 [主编 李代勇 谢志民]
- 计算机网络实训教程 [主编 张浩军 赵玉娟]
- 画法几何与机械制图习题集(多学时) [主编 赵军]
- HCIA-Datacom认证题库分类精讲 [主 编 韩立刚]
- SwiftUI完全开发 [李智威 著]
- 网络规划设计师备考一本通 [夏杰 编著]