Python统计分析项目化教程
-
【作 者】章小华 孙伟男 于虹博 李文龙
【I S B N 】978-7-5226-3449-4
【责任编辑】鞠向超
【适用读者群】本专通用
【出版时间】2025-08-21
【开 本】16开
【装帧信息】平装(光膜)
【版 次】第1版第1次印刷
【页 数】240
【千字数】365
【印 张】15
【定 价】¥49
【丛 书】普通高等教育数据科学与大数据技术专业教材
【备注信息】
简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书以数据分析的实际应用为核心,结合Python的强大功能,系统讲解了数据处理、统计分析与建模的理论和实践。全书从搭建数据分析环境入手,逐步介绍Python中常用的统计工具包(如numpy、pandas、matplotlib等),并深入讲解概率计算、描述性统计分析、方差分析、参数估计与假设检验等核心内容,辅以丰富的Python代码示例。书中重点探讨回归分析和时间序列分析,涵盖一元回归与多元回归、逻辑回归、趋势分析和预测方法,并结合实际案例展示其应用价值。最后一章通过精选案例整合全书知识点,呈现理论在实际项目中的应用。本书理论与实践相结合,旨在帮助读者构建系统化的数据分析能力,无论是初学者还是专业人士都能从中获得提升,为职业发展奠定坚实的基础。
本书可作为高等院校“统计分析与Python应用”“数据科学基础”等课程的教材或配套参考书,也可作为数据分析师、统计建模工程师的职业技能培训的参考书。
内容实用——理论与实践结合,重点突出应用
体系完善——构建完整的大数据专业解决方案
产教融合——高校企业共参与,对标行业标准
资源丰富——微课、课件、教案、源码、答案
在当今数字化时代,数据已成为推动社会进步和经济发展的重要力量。随着大数据、人工智能、机器学习等技术的迅猛发展,数据分析能力已成为众多领域不可或缺的核心技能。无论是科学研究、商业决策还是社会管理,都离不开对数据的深度挖掘和分析。Python作为一种简洁而强大的编程语言,在数据分析领域得到了广泛应用,成为众多专业人士和学者的首选工具。
本书旨在为读者提供一套系统、全面且实用的Python统计分析学习方案,帮助读者从零开始,逐步掌握数据分析的理论知识与实践技能。本书内容涵盖了从基础的Python环境搭建到复杂的统计分析方法,包括概率计算、描述性统计分析、方差分析、参数估计与假设检验、相关与回归分析、时间序列分析等多个方面。通过理论与实践相结合的方式,本书致力于培养读者的统计思维和数据分析能力,使读者能够运用Python解决实际问题。
本书的特点主要体现在以下几个方面:
(1)系统性与实用性。本书内容系统全面,涵盖了统计分析的基本理论和常用方法,同时结合Python语言的强大功能,提供了丰富的实践案例。读者不仅能够学习到统计分析的原理,还能通过实际操作加深理解,提升应用能力。
(2)项目化教学。本书采用项目化教学模式,将复杂的统计分析问题分解为多个具体案例,引导读者逐步解决问题。这种教学方式有助于读者更好地理解统计分析的实际应用场景,培养解决实际问题的能力。
(3)配套资源丰富。为了方便读者学习,本书提供了丰富的配套资源,包括教学课件、案例数据、代码示例以及在线学习资源等。这些资源将帮助读者更好地掌握书中的内容,提高学习效率。
本书共分为8章,前7章为理论与实践相结合的内容,系统讲解了统计分析的基础知识和常用方法;第8章为案例分析,通过具体案例展示了如何运用所学知识解决实际问题。本书的编写团队由多年从事数据分析教学与研究的专业人士组成,他们在数据分析领域积累了丰富的经验,并将这些经验融入本书中。
本书由章小华、孙伟男、于虹博、李文龙任主编,陈勇、王贵鑫、周苏、王艺瑾、刘志扬任副主编,参与部分编写工作的还有曲艳梅、赵海静、刘相宜。感谢所有为本书提供意见和建议的专家、学者和读者,你们的反馈对本书的完善起到了重要作用。由于编者水平有限,书中难免存在不足之处,恳请读者批评指正,以便在后续修订中不断完善。
最后,希望本书能够成为读者学习Python统计分析的良师益友,引领读者在数据分析的道路上不断前行,探索数据背后的奥秘。
1.1 环境配置 1
1.1.1 Python环境搭建 2
1.1.2 PyCharm安装与配置 3
1.1.3 Jupyter Notebook安装与配置 4
1.1.4 Python统计分析包的安装 4
1.2 Python统计分析包 4
1.2.1 numpy包 5
1.2.2 pandas包 5
1.2.3 matplotlib包 7
1.2.4 scipy包 9
1.2.5 statsmodels包 10
本章小结 18
习题1 18
第2章 概率计算与随机抽样 20
2.1 不同类型的概率计算 20
2.1.1 古典概型 21
2.1.2 条件概率 22
2.1.3 贝叶斯概率 23
2.1.4 联合概率和边缘概率 25
2.2 随机抽样 27
2.2.1 概率抽样 27
2.2.2 非概率抽样 29
2.2.3 概率抽样与非概率抽样的区别 32
本章小结 33
习题2 33
第3章 描述性统计分析 35
3.1 分布数列 36
3.1.1 分布数列的概念 36
3.1.2 分布数列的构成要素 36
3.1.3 分布数列的基本形式 36
3.1.4 分布数列的分类 36
3.1.5 累计次数分布 39
3.1.6 次数分布的主要类型 39
3.2 统计图 42
3.2.1 统计图的概念 42
3.2.2 统计图的种类 42
3.2.3 常见统计图的特征及用途 43
3.3 描述性统计量 49
3.3.1 集中趋势的测度 49
3.3.2 描述数据离散程度的特征量 54
3.3.3 分布的峰度和偏度指标 57
本章小结 59
习题3 59
第4章 方差分析 61
4.1 单因素方差分析 61
4.1.1 单因素方差分析的基本原理 61
4.1.2 单因素方差分析的数学模型 62
4.1.3 单因素方差分析的Python示例 64
4.2 双因素方差分析 68
4.2.1 双因素方差分析的基本原理 68
4.2.2 无交互作用的双因素试验的方差分析 68
4.2.3 双因素方差分析的Python示例 69
本章小结 75
习题4 75
第5章 参数估计与假设检验 77
5.1 参数估计 78
5.1.1 点估计 78
5.1.2 矩估计 79
5.1.3 最大似然估计法 80
5.1.4 基于截尾样本的最大似然估计 82
5.1.5 评估量的评选标准 83
5.1.6 区间估计 84
5.1.7 正态总体均值与方差的区间估计 85
5.1.8 0-1分布参数的区间估计 86
5.1.9 置信区间 87
5.2 假设检验 89
5.2.1 假设检验方法 89
5.2.2 正态总体均值的假设检验 92
5.2.3 基于成对数据的检验 94
5.2.4 正态总体方差的假设检验 96
5.2.5 置信区间与假设检验之间的关系 97
5.2.6 样本容量的选取 98
5.2.7 秩和检验 104
5.2.8 假设检验问题的p值检验法 105
本章小结 106
习题5 106
第6章 相关与回归分析 108
6.1 相关分析 108
6.1.1 变量的关系类型 109
6.1.2 相关关系的种类 109
6.1.3 相关分析的内容 109
6.1.4 一元线性相关分析 109
6.1.5 多元线性相关分析 112
6.1.6 卡方检验 113
6.1.7 皮尔逊相关系数 115
6.1.8 方差分析 117
6.1.9 相关性图 118
6.2 回归分析 122
6.2.1 一元线性回归 122
6.2.2 多元线性回归 126
6.2.3 非线性回归 127
6.2.4 时间序列回归 128
6.2.5 逻辑回归 130
本章小结 131
习题6 132
第7章 时间序列分析 134
7.1 时间序列基本概念 135
7.1.1 平稳性 135
7.1.2 遍历性 135
7.1.3 白噪声 135
7.2 时间序列的分类 135
7.2.1 时间序列的数据类型 136
7.2.2 常见的数据特征 136
7.3 时间序列的对比分析 139
7.3.1 发展水平与平均发展水平 139
7.3.2 增长量与平均增长量 142
7.3.3 发展速度与增长速度 143
7.3.4 平均发展速度与平均增长速度 145
7.4 时间序列的成分及其分析 146
7.4.1 时间序列的成分 146
7.4.2 时间序列的分解模型 146
7.4.3 长期趋势分析 147
7.4.4 季节成分分析 152
7.4.5 循环成分与不规则成分分析 152
7.5 时间序列的预测方法 154
7.5.1 趋势外推法 154
7.5.2 移动平均预测 155
7.5.3 指数平滑预测 156
7.5.4 预测误差 156
本章小结 159
习题7 160
第8章 案例分析 162
8.1 概率计算与随机抽样案例分析 163
8.1.1 古典概型 163
8.1.2 条件概率 164
8.1.3 贝叶斯概率 165
8.1.4 联合概率和边缘概率 166
8.1.5 概率抽样 168
8.1.6 非概率抽样 170
8.2 描述性统计分析案例分析 172
8.2.1 分布数列分类(变量数列) 172
8.2.2 次数分布的主要类型 174
8.2.3 集中趋势的测度 176
8.2.4 描述数据离散程度的特征量 178
8.3 方差分析案例分析 179
8.3.1 单因素方差分析 180
8.3.2 双因素方差分析 181
8.4 参数估计与假设检验案例分析 184
8.4.1 点估计和矩估计 184
8.4.2 基于截尾样本的最大似然估计 186
8.4.3 置信区间 188
8.4.4 正态总体均值的假设检验 191
8.4.5 正态总体方差的假设检验 194
8.4.6 秩和检验 196
8.5 相关与回归分析案例分析 198
8.5.1 一元线性相关分析 199
8.5.2 多元线性相关分析 201
8.5.3 卡方检验 203
8.5.4 方差分析 205
8.5.5 一元线性回归 207
8.5.6 多元线性回归 210
8.5.7 非线性回归 212
8.6 时间序列分析案例分析 215
8.6.1 发展速度与增长速度 215
8.6.2 平均发展速度与平均增长速度 218
8.6.3 长期趋势分析 220
8.6.4 季节成分分析 223
8.6.5 移动平均预测 227
8.6.6 指数平滑预测 229
本章小结 230
习题8 231
参考文献 234
- Linux系统管理(openEuler版) [主编 许兴鹍 黄君羡]
- Web前端开发从学到用完美实践 [阮晓龙 冯顺磊 编著]
- 用英语讲中国故事(全视频 彩色版)上、下册 [主编 谢亮亮 汪洋]
- 新时代大学生美育教育 [穆林 刘苍劲 彭圣芳]
- 电子商务英语 [丁文毅 严慧]
- 智能可穿戴项目化教程 [曾文波 陈赵云]
- 视觉设计解析与实战教程 [姜春磊 杨晓]
- 电子产品制图与制版案例教程 [邹莉莉 苏文斌 贺小艳]
- 设计新维度:CMF元素与创新产品设计 [彭小鹏]
- 园林树木识别与应用 [主编 张玉泉]
- 文本信息处理与应用 [主编 何黎松 姚香秀]
- 工业机器人编程及应用(第二版) [主编 向艳芳 胡月霞]
- C语言程序设计(第二版) [主编 刘祖珉 赵仕波]
- 数据分析与应用 [主编 孙伟 王兰芹]
- Linux操作系统配置与管理项目化教程(第二版) [主编 白玉羚 刘金明 闫 淼]
- Ansys SpaceClaim直接建模与仿真指南 [蔡宜时 编著]
- 基于大数据的智慧农业管理平台关键技术研究与实践 [周永福 著]
- 健美运动 [戴显岩]
- Python程序开发基础(AI+微课版) [赵艳莉 曾鑫]
- 大学生心理困境突围之路 [张珏 著]
- 机器学习基础与实践 [主编 李晓峰 胥文婷 李云波]
- 大模型应用实战 DeepSeek+即梦AI+剪映重塑创作 [丁红 杨彦彦 丁丁 编著]
- HarmonyOS从入门到精通 [陈赵云 周永福 杨 浪]
- 用英语发现世界:欧美文化篇 [李小丽 张薇 编著]
- 大学体育教程 [戴显岩]
- 新一代信息技术 [李佼辉 任雪冬]
- 轨道交通类专门用途英语教程 [李德华主编 商晔副主编]
- 建设工程项目团队知识异质性对团队绩效的影响研究 [胡可]
- 新时代元阳梯田 云南现代化高原立体灌区 前世 今生 未来 [云南省水利水电勘测设计研究院 ]
- 网络工程师章节习题与考点特训(适配第6版考纲) [夏杰 编著]

