热门关键字:  听力密码  听力密码  新概念美语  单词密码  巧用听写练听力

机器学习基础与实践

中国水利水电出版社
    【作 者】主编 李晓峰 胥文婷 李云波 【I S B N 】978-7-5226-3702-0 【责任编辑】张玉玲 【适用读者群】本专通用 【出版时间】2025-10-01 【开 本】16开 【装帧信息】平装(光膜) 【版 次】第1版第1次印刷 【页 数】260 【千字数】426 【印 张】16.25 【定 价】49.8 【丛 书】普通高等教育人工智能专业系列教材 【备注信息】
图书详情

    本书系统、全面地讲解了机器学习,旨在为读者构建从理论到实践的完整知识体系。全书以机器学习的基本概念为起点,逐步深入到核心算法的原理与应用,涵盖回归、分类、聚类等经典算法,并系统地介绍了神经网络与深度学习的理论框架和技术要点,不仅详细讲解了机器学习的三要素(数据、模型、算法),还通过Python工具库的使用和开发环境的构建帮助读者快速上手实践。本书强调机器学习工程实践中的模型评估、特征工程和性能度量,并通过具体的案例分析(如医疗保险欺诈分析和异常血糖预测)展示从数据准备到模型训练的完整流程,这些案例不仅突出了机器学习的应用价值,还为读者提供了实战经验和解决方案。

    本书内容丰富、体系完整,可作为高等院校大数据、人工智能相关专业的教材,也可作为广大机器学习爱好者和从业者的参考书,助力读者在实践中掌握机器学习的核心技术与应用方法。

    理实一体

    通过理论与实践相结合构建知识体系,将理论转化为实操能力,培养解决实际问题的本领,为深入探索机器学习打下坚实基础。

    突出应用

    突出机器学习技术的实际应用价值,精选综合案例全方位展现其解决现实问题的能力,培养用科技解决实际问题、服务社会的能力,增强对机器学习技术应用价值的认识和理解。

    系统全面

    打造系统全面的知识架构,覆盖机器学习全领域,培养系统思考与解决问题能力,为深入研究和职业发展提供坚实的知识支撑。

    在当今全球数字化浪潮的推动下,机器学习作为人工智能的关键技术,深刻地影响和重塑人类社会的各领域。从智能语音助手的精确识别到医疗影像诊断的精准辅助,再到机器人技术的创新应用和数据挖掘与预测的广泛应用,机器学习的应用无处不在。其卓越的数据处理与模式识别能力,不仅为解决复杂问题提供了全新的视角和方法,也为各行业的创新和发展带来了前所未有的机遇。本书旨在系统地阐述机器学习的基本理论、关键技术及其实际应用,帮助读者构建坚实的知识框架,培养解决实际问题的能力。同时,本书提供了一条系统、全面且深入的学习路径,读者能够全方位地掌握机器学习的知识与技能。

    本书特色

    (1)理实一体。本书通过理论与实践结合,构建知识体系。从基本概念出发,深入剖析机器学习在各领域的应用,精准阐释数据、模型、算法三要素的联系,清晰界定人工智能、机器学习与深度学习的层级关系,为实践筑牢理论根基。同时,结合Python编程,通过大量实例代码展示利用机器学习库实现算法,从数据预处理到模型评估,每步都有清晰注释,帮助读者快速上手,将理论转化为实践能力,培养解决实际问题的本领,为深入探索机器学习打下坚实的基础。

    (2)突出应用。本书突出机器学习技术的实际应用价值,精选综合案例全方位展现其解决现实问题的能力。在医疗保险欺诈分析案例中,从目标分析、数据准备、特征工程、模型训练到性能度量,展示了机器学习在反欺诈中的应用流程。异常血糖预测案例介绍了数据导入、特征筛选、模型训练与性能评估,帮助读者学会利用机器学习分析医疗健康数据,支持个性化医疗方案,体现了科技助力医疗、服务民生的宗旨。这些案例使读者能够在不同场景下领略机器学习的创新应用,拓宽思维边界,培养其用科技解决实际问题、服务社会的能力,增强其对机器学习技术应用价值的认识和理解。

    (3)系统全面。本书打造系统、全面的知识架构,覆盖机器学习全领域,不仅包含传统算法,还深入前沿神经网络与深度学习架构,紧跟领域的最新发展。书中详述模型评估指标体系,精准度量性能;剖析模型复杂度度量的关键维度,助力优化构建;系统梳理模型获取与改进流程,从数据集划分到训练优化,全方位呈现通用流程,使读者清晰掌握各环节,能在实际项目中有序推进工作。这种系统性安排帮助读者建立全面认识,培养系统思考与解决问题能力,为深入研究和职业发展提供坚实的知识支撑。

    本书内容

    第1章 机器学习基础。本章是全书的开篇,为读者介绍了机器学习的基本概念、应用领域、分类方法和常见术语,详细阐述了机器学习的三要素—数据、模型和算法,并探讨了人工智能、机器学习和深度学习的关系,还介绍了机器学习开发环境的构建和Python机器学习工具库的使用,为读者后续的学习打下坚实的基础。本章的核心在于帮助读者建立起对机器学习的全面认识,理解其在现代科技中的重要地位和广泛应用,同时掌握开展机器学习实践所需的基本工具和环境。

    第2章 机器学习工程实践。本章聚焦机器学习工程中的关键环节,首先介绍了模型评估指标体系,包括回归模型、分类模型和聚类模型的评估指标;然后深入探讨了模型复杂度度量的关键维度,如偏差与方差、拟合与正则化;接着系统梳理了模型获取与改进的流程,从训练集、验证集和测试集的划分到训练过程的优化,全方位呈现了机器学习通用流程。本章的核心在于让读者掌握机器学习工程中的关键技术和方法,能够有效评估和优化模型,确保模型在实际应用中的可靠性和准确性。

    第3章 回归算法与应用。本章全面阐述了回归算法的理论基础及其在实际中的应用。首先详细讲解了线性回归的原理,并通过一个基于线性回归的糖尿病预测案例展示了该算法在实际问题中的应用;然后介绍了逻辑回归的原理,并通过另一个基于逻辑回归的乳腺癌预测案例深入探讨了逻辑回归在二分类问题中的强大能力。本章旨在帮助读者掌握回归算法的基本原理和应用方法,使其有效运用回归算法来解决实际问题中的预测和分类任务。

    第4章 分类算法与应用。本章全面介绍了多种分类算法的理论基础及其实际应用。首先深入探讨了支持向量机的原理,并通过一个基于支持向量机的葡萄酒分类案例,展示了该算法在处理多分类问题时的效能;然后转向决策树算法,不仅解释了其工作原理,还通过另一个葡萄酒分类的实例强调了决策树在分类任务中的直观性和强大的解释能力;此外,还详细讲解了K近邻算法和朴素贝叶斯算法的基本概念,并通过鸢尾花分类的经典案例展示了这些算法在解决基础分类问题时的有效性和实用性。本章旨在让读者充分理解和掌握各分类算法的特点及适用场景,从而能够在实际问题中灵活选择合适的算法构建模型和预测分析。

    第5章 聚类算法与应用。本章详细介绍了聚类算法的原理及其应用。首先讲解了k均值聚类的基本原理,并通过一个基于k均值的鸢尾花分类案例展示了该算法在数据分组和模式识别中的应用;然后探讨了密度聚类的原理,特别是DBSCAN算法,通过一个基于DBSCAN的鸢尾花分类案例展示了密度聚类在处理复杂形状数据和噪声数据方面的优势;此外,还介绍了层次聚类的原理,特别是AGNES算法,通过一个基于AGNES的鸢尾花分类案例展示了层次聚类在数据层次结构分析和可视化方面的特点。本章的核心目标是帮助读者掌握聚类算法的基本原理和应用方法,使其有效地利用聚类算法对数据分组和分析,从而发现数据中的潜在模式和结构。

    第6章 神经网络与深度学习。本章介绍了神经网络与深度学习的基本原理及架构。首先讲解神经网络的基本概念;然后深入探讨深度学习架构,包括卷积神经网络和循环神经网络;此外,还介绍了神经网络在图像视觉、数据挖掘与预测、自然语言处理、自动化控制、生物医疗等领域的应用。通过简单神经网络和VGG16迁移学习在MNIST手写数字分类案例中的应用展示了深度学习在图像识别领域的强大能力。本章的核心目标是帮助读者理解神经网络和深度学习的基本原理及应用,掌握构建和训练深度学习模型的方法,从而利用深度学习技术解决复杂的实际问题。

    第7章 综合案例一:医疗保险欺诈分析。本章以医疗保险欺诈分析为背景,详细介绍了目标分析、数据准备、特征工程、模型训练和性能度量的全流程。首先介绍了医疗保险欺诈分析的背景和意义,并详细描述和分析了数据;然后进行数据清洗、特征选择和特征工程,构建了适合模型训练的数据集;接着选择合适的机器学习算法训练模型,并进行了性能评估和优化。通过该案例,读者可以了解机器学习在医疗保险欺诈中的应用,掌握利用机器学习技术解决实际问题。本章的核心在于将前面章节所学的理论知识和算法应用到实际问题中,提高读者解决实际问题的能力,培养读者的综合分析和实践能力。

    第8章 综合案例二:异常血糖预测。本章以异常血糖预测为背景,详细介绍了数据导入、特征筛选、模型训练和性能评估的全过程。首先介绍了异常血糖预测的背景和数据来源,并对数据进行了详细的分析和预处理;然后进行特征筛选和特征工程,构建了适合模型训练的数据集;接着选择了多种机器学习算法训练模型,并全面评估和优化模型的性能。通过该过程展示了有效利用机器学习技术解决实际问题的方法。本章的核心在于展示通过机器学习技术从数据中提取有价值的信息,从而实现异常血糖的准确预测,为糖尿病患者和医疗专业人员提供重要的决策支持。

    适用对象

    本书适合作为高等院校大数据、人工智能相关专业的教材,也适合作为广大机器学习爱好者和从业者的参考书。对于大学生来说,本书系统、全面的知识体系和丰富的实践案例有助于他们快速掌握机器学习的基础知识和技能,为后续的专业课程学习和毕业设计打下坚实的基础。对于机器学习爱好者和从业者来说,本书深入浅出的讲解和实用的操作指导可以帮助他们更好地理解及应用机器学习技术,提升解决实际问题的能力。

    “机器学习”是一门充满魅力和挑战的学科,它为我们打开了探索未知世界的大门。希望本书能够成为读者在机器学习道路上的“良师益友”,陪伴读者一起探索机器学习的奥秘,共同迎接智能科技时代的到来。在学习过程中,我们鼓励读者积极思考、勇于实践,不断探索机器学习的新方法和新应用。相信学习本书内容后,读者将能够在机器学习领域取得丰硕的成果,为推动智能科技的发展贡献自己的力量。

    由于作者水平有限,书中难免出现疏漏和不足之处,恳请读者批评指正。

    前言
    第1章 机器学习基础 1
    1.1 机器学习简介 1
    1.1.1 机器学习的概念 2
    1.1.2 机器学习的应用领域 2
    1.1.3 机器学习的分类 3
    1.1.4 机器学习的常见术语 5
    1.1.5 机器学习的三要素(数据、模型和算法) 6
    1.1.6 人工智能、机器学习和深度学习 7
    1.2 机器学习开发环境构建 11
    1.3 Python机器学习工具库 17
    1.3.1 机器学习的常用库 17
    1.3.2 扩展库导入与使用 18
    1.3.3 数据可视化工具库 19
    本章小结 20
    习题1 20
    第2章 机器学习工程实践 22
    2.1 模型评估指标 22
    2.1.1 回归模型评估指标 23
    2.1.2 分类模型评估指标 23
    2.1.3 聚类模型评估指标 25
    2.2 模型复杂度度量 26
    2.2.1 偏差与方差 26
    2.2.2 拟合与正则化 26
    2.3 模型的获取与改进 27
    2.3.1 获取模型的过程 27
    2.3.2 训练集、验证集和测试集 28
    2.3.3 训练过程 28
    2.4 机器学习通用流程 29
    2.4.1 目标分析 30
    2.4.2 数据准备 30
    2.4.3 特征工程 31
    2.4.4 模型训练 32
    2.4.5 性能度量与模型调优 32
    本章小结 33
    习题2 33
    第3章 回归算法与应用 35
    3.1 回归算法概述 35
    3.1.1 回归算法的含义 35
    3.1.2 回归算法中的常用方法 36
    3.2 线性回归 36
    3.2.1 线性回归的原理 36
    3.2.2 案例3-1:基于线性回归的糖尿病预测 38
    3.3 逻辑回归 42
    3.3.1 逻辑回归的原理 42
    3.3.2 案例3-2:基于逻辑回归的乳腺癌预测 44
    本章小结 52
    习题3 52
    第4章 分类算法与应用 54
    4.1 分类算法概述 55
    4.1.1 分类算法的含义 55
    4.1.2 分类算法中的常用方法 55
    4.2 支持向量机 55
    4.2.1 支持向量机的原理 55
    4.2.2 案例4-1:基于支持向量机的葡萄酒
       分类 57
    4.3 决策树 65
    4.3.1 决策树的原理 65
    4.3.2 案例4-2:基于决策树的葡萄酒分类 68
    4.4 KNN 76
    4.4.1 KNN的原理 76
    4.4.2 案例4-3:基于KNN的鸢尾花分类 78
    4.5 朴素贝叶斯 86
    4.5.1 朴素贝叶斯的原理 86
    4.5.2 案例4-4:基于朴素贝叶斯的鸢尾花
       分类 88
    本章小结 96
    习题4 96
    第5章 聚类算法与应用 98
    5.1 聚类算法概述 99
    5.1.1 聚类算法的含义 99
    5.1.2 聚类算法中的常用方法 99
    5.2 k均值聚类 99
    5.2.1 k均值聚类的原理 99
    5.2.2 案例5-1:基于k均值聚类的鸢尾花
       聚类 101
    5.3 密度聚类 113
    5.3.1 密度聚类的原理 113
    5.3.2 案例5-2:基于DBSCAN的鸢尾花
       聚类 115
    5.4 层次聚类 124
    5.4.1 层次聚类的原理 124
    5.4.2 案例5-3:基于AGNES的鸢尾花聚类 126
    本章小结 138
    习题5 138
    第6章 神经网络与深度学习 140
    6.1 神经网络 141
    6.1.1 神经网络的含义 141
    6.1.2 神经元模型 141
    6.1.3 前馈神经网络 148
    6.1.4 损失函数和梯度下降 149
    6.1.5 反向传播网络 154
    6.1.6 神经网络的特点 154
    6.2 深度学习 155
    6.2.1 深度学习的含义 155
    6.2.2 卷积神经网络 155
    6.2.3 循环神经网络 160
    6.2.4 深度学习进阶 162
    6.2.5 深度学习的特点 165
    6.3 神经网络的应用 166
    6.3.1 图像视觉 166
    6.3.2 数据挖掘与预测 167
    6.3.3 自然语言处理 168
    6.3.4 自动化控制方面的应用 168
    6.3.5 生物医疗方面的应用 169
    6.4 案例6-1:基于简单神经网络的MNIST手写
       数字分类 169
    6.4.1 目标分析 169
    6.4.2 数据准备 169
    6.4.3 模型训练 174
    6.4.4 性能度量 177
    6.4.5 案例总结 178
    6.5 案例6-2:VGG16迁移学习的MNIST手写
       数字分类 179
    6.5.1 目标分析 179
    6.5.2 数据准备 179
    6.5.3 模型训练 181
    6.5.4 性能度量 183
    6.5.5 案例总结 185
    本章小结 185
    习题6 185
    第7章 综合案例一:医疗保险欺诈分析 187
    7.1 目标分析 188
    7.1.1 背景介绍 188
    7.1.2 数据说明 188
    7.1.3 实验设计 190
    7.1.4 实验环境 191
    7.2 数据准备 192
    7.2.1 数据导入 192
    7.2.2 描述性统计分析 193
    7.2.3 数据清洗 195
    7.2.4 数据可视化分析 196
    7.3 特征工程 205
    7.3.1 投保人特征工程 205
    7.3.2 医疗机构特征工程 209
    7.3.3 特征工程总结 214
    7.4 模型训练 214
    7.4.1 特征标准化 214
    7.4.2 k均值算法实现投保人聚类 214
    7.4.3 k均值算法实现医疗机构特征聚类 217
    7.4.4 聚类结果 220
    7.5 性能度量 220
    7.5.1 投保人医疗保险欺诈分析 220
    7.5.2 医疗机构医疗保险欺诈分析 222
    本章小结 224
    习题7 224
    第8章 综合案例二:异常血糖预测 225
    8.1 目标分析 226
    8.1.1 背景介绍 226
    8.1.2 数据介绍 226
    8.1.3 预测模型介绍 227
    8.1.4 实验设计 230
    8.1.5 实验环境 231
    8.2 数据准备 232
    8.2.1 训练集与测试集数据导入 232
    8.2.2 导入数据展示 233
    8.3 特征工程 233
    8.3.1 绘图基础设置 233
    8.3.2 血糖数据分析 234
    8.3.3 数据清洗与特征筛选 235
    8.4 模型训练 239
    8.4.1 34特征组数据与LightGBM预测模型 239
    8.4.2 14特征组数据与LightGBM预测模型 240
    8.4.3 14特征组数据与支持向量机预测模型 240
    8.4.4 14特征组数据与随机森林预测模型 241
    8.5 性能度量 241
    8.5.1 34特征组数据与LightGBM预测模型
       实验结果 242
    8.5.2 14特征组数据与LightGBM预测模型
       实验结果 243
    8.5.3 14特征组数据与支持向量机预测模型
       实验结果 245
    8.5.4 14特征组数据与随机森林预测模型
       实验结果 246
    8.5.5 实验结果对比 248
    8.5.6 测试集异常血糖预测 248
    本章小结 250
    习题8 251
    参考文献 252





最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册