数据挖掘算法—基于C++及CUDA C
简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书是美国著名数据挖掘算法专家、数值计算专业的数理统计学博士Timothy Masters的最新作品。
应用中的预测或分类使数据挖掘工程师经常会面对成千上万的候选特征。这些特征绝大多数没有价值或只有很小的价值,只有与某个或某些其他特征联合起来才可能有用;一些特征可能有巨大的预测能力,但它们又可能仅存在于整体特征空间的某些区域……数据挖掘中,类似这种使人痛苦的问题是无穷的。本书中的现代特征选择技术,将帮助你解决这些问题。本书中所有的算法都可被直觉证实,并有相关方程和解释材料支撑。作者还展现了这些算法的完整的、受到高度好评的源代码(下载网址:https://www.apress.com/cn/book/9781484259870),并对其进行了解析。
本书适合算法、数据挖掘、人工智能等领域的师生及相关的技术与研究人员使用。
数值计算专家Timothy Masters 博士著作
展现特征提取与选择算法的最新技术
所有算法都可被直觉证实
Timothy Masters获得数值计算专业的数理统计博士学位后,一直担任政府和行业的独立顾问。早期研究领域包括高程影像的自动特征检测,还开发了洪灾和旱灾预测,隐蔽导弹发射井检测和军用车辆识别等应用。后来与医学研究人员合作开发了穿刺活检良性细胞/恶性细胞的计算鉴别算法。在过去的20年中,主要专注于金融市场交易系统的自动评估方法研究。撰写了12本关于预测建模实际应用方面的图书:
《实用神经网络C++实现》(Academic,1993)
《基于神经网络的信号和图像处理》(Wiley,1994)
《神经网络先进算法》(Wiley,1995)
《时间序列预测的神经网络、新型和混合算法》(Wiley,1995)
《预测和分类的评估与改进》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第一卷:受限玻尔兹曼机和监督式前馈网络》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第二卷:复域中的自编码》(Apress,2018)
《深度信念网络的C++和CUDA C实现:第三卷:卷积神经网络》(Apress,2018)
《数据挖掘算法的C++实现》(Apress,2018)
《市场交易系统的测试与优化》(Apress,2018)
《金融市场预测的可靠统计指标:C++算法实现》(KDP,2019,第2版 2020)
《交易系统开发的排列检验和随机检验:C++算法实现》(KDP,2020)
第2章 前向选择成分分析 3
前向选择成分分析概述 3
数学原理与代码示例 5
最大化解释方差 6
方差最大化准则代码 7
后向细化 10
多线程后向细化 13
有序成分正交化 18
综合应用 20
仅前向选择子集的成分变量 24
后向细化子集的成分变量 25
人工变量示例 26
第3章 局部特征选择 30
算法概述 30
算法输出结果 34
简要介绍:单纯形算法 34
线性规划问题 35
Simplex类的接口 36
更多细节 37
一种更严格的LFS方法 38
类内分割和类间分割 41
计算权重 43
最大化类间分割 45
最小化类内分割 48
测试β试验值 49
关于线程的简要说明 52
CUDA权重计算 52
将CUDA代码集成到算法中 53
初始化CUDA硬件 54
计算与当前实例之差 56
计算距离矩阵 57
计算最小距离 59
计算权重方程项 63
转置项矩阵 64
权重项求和 65
权重迁移到主机 66
局部特征选择示例 66
关于运行时的解释说明 67
第4章 时间序列特征的记忆特性 68
简单数学概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常规计算 78
均值和协方差 78
概率密度 79
多元正态概率密度函数 80
启动参数 81
初始化算法流程 81
对均值施加扰动 82
对协方差施加扰动 82
对转移概率施加扰动 83
关于随机数发生器的解释 83
完整优化算法 84
计算状态概率 85
更新均值和协方差 87
更新初始概率和转移概率 89
HMM在时间序列中的记忆特性评估 93
链接特征变量与目标变量 96
链接HMM状态与目标 102
一个人为的不当示例 109
一个合理可行的示例 111
第5章 逐步选择改进算法 113
特征评估模型 114
基本模型实现代码 115
交叉验证性能度量 118
逐步选择算法 120
确定第一个变量 125
在现有模型中添加变量 127
三个算法演示示例 130
第6章 名义变量到有序变量的转换 133
实现概述 135
合理关系测试 135
股票价格变动示例 136
名义变量到有序变量变换实现代码 138
构造函数 139
输出计数表 141
计算映射函数 143
Monte-Carlo置换检验 145
- Linux系统管理(openEuler版) [主编 许兴鹍 黄君羡]
- Web前端开发从学到用完美实践 [阮晓龙 冯顺磊 编著]
- 用英语讲中国故事(全视频 彩色版)上、下册 [主编 谢亮亮 汪洋]
- 新时代大学生美育教育 [穆林 刘苍劲 彭圣芳]
- 电子商务英语 [丁文毅 严慧]
- 智能可穿戴项目化教程 [曾文波 陈赵云]
- 视觉设计解析与实战教程 [姜春磊 杨晓]
- 电子产品制图与制版案例教程 [邹莉莉 苏文斌 贺小艳]
- 设计新维度:CMF元素与创新产品设计 [彭小鹏]
- 园林树木识别与应用 [主编 张玉泉]
- 文本信息处理与应用 [主编 何黎松 姚香秀]
- 工业机器人编程及应用(第二版) [主编 向艳芳 胡月霞]
- C语言程序设计(第二版) [主编 刘祖珉 赵仕波]
- 数据分析与应用 [主编 孙伟 王兰芹]
- Linux操作系统配置与管理项目化教程(第二版) [主编 白玉羚 刘金明 闫 淼]
- Ansys SpaceClaim直接建模与仿真指南 [蔡宜时 编著]
- 基于大数据的智慧农业管理平台关键技术研究与实践 [周永福 著]
- 健美运动 [戴显岩]
- Python程序开发基础(AI+微课版) [赵艳莉 曾鑫]
- 大学生心理困境突围之路 [张珏 著]
- 机器学习基础与实践 [主编 李晓峰 胥文婷 李云波]
- 大模型应用实战 DeepSeek+即梦AI+剪映重塑创作 [丁红 杨彦彦 丁丁 编著]
- HarmonyOS从入门到精通 [陈赵云 周永福 杨 浪]
- 用英语发现世界:欧美文化篇 [李小丽 张薇 编著]
- 大学体育教程 [戴显岩]
- 新一代信息技术 [李佼辉 任雪冬]
- 轨道交通类专门用途英语教程 [李德华主编 商晔副主编]
- 建设工程项目团队知识异质性对团队绩效的影响研究 [胡可]
- 新时代元阳梯田 云南现代化高原立体灌区 前世 今生 未来 [云南省水利水电勘测设计研究院 ]
- 网络工程师章节习题与考点特训(适配第6版考纲) [夏杰 编著]

