数据挖掘算法—基于C++及CUDA C
简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书是美国著名数据挖掘算法专家、数值计算专业的数理统计学博士Timothy Masters的最新作品。
应用中的预测或分类使数据挖掘工程师经常会面对成千上万的候选特征。这些特征绝大多数没有价值或只有很小的价值,只有与某个或某些其他特征联合起来才可能有用;一些特征可能有巨大的预测能力,但它们又可能仅存在于整体特征空间的某些区域……数据挖掘中,类似这种使人痛苦的问题是无穷的。本书中的现代特征选择技术,将帮助你解决这些问题。本书中所有的算法都可被直觉证实,并有相关方程和解释材料支撑。作者还展现了这些算法的完整的、受到高度好评的源代码(下载网址:https://www.apress.com/cn/book/9781484259870),并对其进行了解析。
本书适合算法、数据挖掘、人工智能等领域的师生及相关的技术与研究人员使用。
数值计算专家Timothy Masters 博士著作
展现特征提取与选择算法的最新技术
所有算法都可被直觉证实
Timothy Masters获得数值计算专业的数理统计博士学位后,一直担任政府和行业的独立顾问。早期研究领域包括高程影像的自动特征检测,还开发了洪灾和旱灾预测,隐蔽导弹发射井检测和军用车辆识别等应用。后来与医学研究人员合作开发了穿刺活检良性细胞/恶性细胞的计算鉴别算法。在过去的20年中,主要专注于金融市场交易系统的自动评估方法研究。撰写了12本关于预测建模实际应用方面的图书:
《实用神经网络C++实现》(Academic,1993)
《基于神经网络的信号和图像处理》(Wiley,1994)
《神经网络先进算法》(Wiley,1995)
《时间序列预测的神经网络、新型和混合算法》(Wiley,1995)
《预测和分类的评估与改进》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第一卷:受限玻尔兹曼机和监督式前馈网络》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第二卷:复域中的自编码》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第三卷:卷积神经网络》(Apress,2018)
《数据挖掘算法的C++实现》(Apress,2018)
《市场交易系统的测试与优化》(Apress,2018)
《金融市场预测的可靠统计指标:C++算法实现》(KDP,2019,第2版 2020)
《交易系统开发的排列检验和随机检验:C++算法实现》(KDP,2020)
第2章 前向选择成分分析 3
前向选择成分分析概述 3
数学原理与代码示例 5
最大化解释方差 6
方差最大化准则代码 7
后向细化 10
多线程后向细化 13
有序成分正交化 18
综合应用 20
仅前向选择子集的成分变量 24
后向细化子集的成分变量 25
人工变量示例 26
第3章 局部特征选择 30
算法概述 30
算法输出结果 34
简要介绍:单纯形算法 34
线性规划问题 35
Simplex类的接口 36
更多细节 37
一种更严格的LFS方法 38
类内分割和类间分割 41
计算权重 43
最大化类间分割 45
最小化类内分割 48
测试β试验值 49
关于线程的简要说明 52
CUDA权重计算 52
将CUDA代码集成到算法中 53
初始化CUDA硬件 54
计算与当前实例之差 56
计算距离矩阵 57
计算最小距离 59
计算权重方程项 63
转置项矩阵 64
权重项求和 65
权重迁移到主机 66
局部特征选择示例 66
关于运行时的解释说明 67
第4章 时间序列特征的记忆特性 68
简单数学概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常规计算 78
均值和协方差 78
概率密度 79
多元正态概率密度函数 80
启动参数 81
初始化算法流程 81
对均值施加扰动 82
对协方差施加扰动 82
对转移概率施加扰动 83
关于随机数发生器的解释 83
完整优化算法 84
计算状态概率 85
更新均值和协方差 87
更新初始概率和转移概率 89
HMM在时间序列中的记忆特性评估 93
链接特征变量与目标变量 96
链接HMM状态与目标 102
一个人为的不当示例 109
一个合理可行的示例 111
第5章 逐步选择改进算法 113
特征评估模型 114
基本模型实现代码 115
交叉验证性能度量 118
逐步选择算法 120
确定第一个变量 125
在现有模型中添加变量 127
三个算法演示示例 130
第6章 名义变量到有序变量的转换 133
实现概述 135
合理关系测试 135
股票价格变动示例 136
名义变量到有序变量变换实现代码 138
构造函数 139
输出计数表 141
计算映射函数 143
Monte-Carlo置换检验 145
- Python程序设计案例教程 [主编 毛锦庚 钟肖英 周贤来 ]
- 数据标注技术 [俞永飞]
- 信息系统项目管理师案例分析一本通 [王树文]
- 网络规划设计师5天修炼(第二版) [朱小平 施游]
- 软考论文高分特训与范文10篇—信息系统项目管理师 [薛大龙]
- 大数据营销 [丁慧洁 杨升炜]
- 软考论文高分特训与范文10篇—网络规划设计师 [雷红艳 施游 朱小平]
- 基于.NET Core框架的分布式系统架构设计 [汤佳 著]
- 高职院校软件类专业“类上班制”人才培养模式研究 [杨智勇 王海洋 著]
- 浮式圆柱型结构物涡激运动特性研究 [孙洪源 李 磊 林海花 著]
- 信电类专门用途英语教程 [主编 宋晶]
- 体育舞蹈教程 [主编 刘伟 陈志明 曾明]
- VR-X3D虚拟现实开发与设计 [张金钊 张金镝 张帅晨 张]
- 线性代数导学篇 [主编 史昱]
- 信息技术基础实训与习题指导(Windows7+Office2016) [主编 周金容 唐天国]
- 中考英语单词循环速记手抄本 [宋德伟 编著]
- 运动控制系统安装调试与运行 [张燕 李兰云 王爱林]
- Mr.Yang的魔法自然拼读 [杨家成]
- 机械制图 [许淑珍 于利民]
- 微积分(经管类)导学篇(下册) [王海棠 曹海军 周玲丽]
- 大学生创新创业基础 [主编 姜国权 姜福佳]
- 农产品云仓模式研究—以北京农产品流通物流供应链重构为例 [武晓钊 王成林 王春娟 等著]
- 信息技术(微课版) [王云 徐江鸿 李清霞 罗学锋 ]
- 管理基础与实务 [主编 王凤基 颜汉军]
- 高等数学导学篇(下册) [主编 李文婧 胡雷 尹金生]
- 高等数学导学篇(上册) [主编 李文婧 胡雷 尹金生]
- 高等数学(下册) [主编 李爱芹 胡雷 尹金生]
- 高等数学(上册) [主编 李爱芹 胡雷 尹金生]
- 庭院风骨—树、灌、篱 [创意房主 著]
- Python语言程序设计教程 [郭其标 房宜汕]