热门关键字:  听力密码  听力密码  新概念美语  单词密码  巧用听写练听力

Python数据分析

中国水利水电出版社
    【作 者】主编 冯志辉 赵磊 李放 【I S B N 】978-7-5226-2166-1 【责任编辑】魏渊源 【适用读者群】本专通用 【出版时间】2024-03-05 【开 本】16开 【装帧信息】平装(光膜) 【版 次】第1版第1次印刷 【页 数】208 【千字数】333 【印 张】13 【定 价】42 【丛 书】普通高等教育数据科学与大数据技术专业教材 【备注信息】
图书详情

    本书从开发环境配置入手,以先理论后实践的形式讲解Python数据分析,理论部分内容包括Python简介及数据分析概述、Python语言基础、科学计算库NumPy、数据处理库Pandas、数据可视化和数据分析方法,由浅入深地引出实践部分的三个经典数据分析实战案例,并将理论知识综合应用到数据分析案例中,进一步加深知识理解。全书理论部分可以作为理论课知识进行教学,案例内容可以用于实训课教学。全书章节可以拆分重组,为不同背景知识的学生提供合适的知识组合,为教师组织教学提供便利。本书内容表达图文并茂、通俗易懂,以实践操作应用为导向,侧重知识的内在认知逻辑引导,适合于理论与实践相结合的教学方式。

    本书适合作为本科或高职院校的计算机科学技术、数据科学与大数据技术、人工智能、信息管理、电子商务、应用数学、信息与计算科学、统计学、金融工程、市场营销等专业的教学用书,同时也适合作为其他相关专业的选修课程教材。本书提供微课视频,并配套程序源代码、教学课件和习题答案。

    内容实用——理论与实践结合,重点突出应用

    体系完善——构建完整的大数据专业解决方案

    产教融合——高校企业共参与,对标行业标准

    资源丰富——微课、课件、教案、源码、答案

    “Python数据分析”是信息管理、计算机科学技术等专业的大数据方向及人工智能方向的专业核心课程之一,课程设置学期位于职业能力形成阶段,主要讲解大数据分析基础理论、分析工具、分析方法

    等。课程目标是使学生能够熟练运用Python工具来解决实际问题,同时让学生掌握在不同领域使用Python扩展模块解决大数据处理问题的方法,要求学生通过课堂教学和实验训练后,具有初步处理数据、独立分析数据的能力。数据分析作为一种从数据中提炼信息的方法,在就业方面也是多个岗位要求掌握的技能。

    本书致力于推动数据分析的普及教育,深入浅出地介绍了数据分析相关知识,使用通俗易懂的语言进行讲述,内容包括Python语言的语法特点以及数据分析的流程思路,并结合典型应用展开阐述,从基本知识和数据分析的逻辑关系角度,使读者建立起数据分析的知识体系和框架。本书不局限于知识和技能的介绍,更注重从数理思维的角度引发读者探索数据世界的兴趣,激发求知欲,使其通过理论学习和实践过程的反复迭代,在认识客观世界的方法上有更加深刻的认识,这也是辩证唯物主义实践观和认识观的一种学习体验。

    本书共9章,前6章为理论部分,包括Python简介及数据分析概述、Python语言基础、科学计算库NumPy、数据处理库Pandas、数据可视化、数据分析方法;后面3章结合数据分析的典型案例,进行数据分析实战演练。

    本书的编写注重可读性和逻辑性,并在章节中增加了课程思政的案例和内容,将知识传授、能力培养和价值塑造有机融合。本书由冯志辉、赵磊、李放担任主编,鱼明、陈慧颖、陈祥担任副主编。本书的Pandas讲解及案例编程部分得到了东北师范大学赵志铭的支持和帮助,另外在本书编写过程中,智慧云未来科技(北京)有限公司黄智慧总经理和北京普开数据技术有限公司刘生副总经理给予了技术指导,中国水利水电出版社的领导和编辑也给予了很大的支持与帮助,并付出了辛勤劳动,在此一并向他们表示衷心感谢。

    由于编者水平有限,加之时间仓促,书中难免存在错误和不妥之处,恳请读者批评指正。

    编 者

    2023年9月

    前言
    第1章 Python简介及数据分析概述 1
    1.1 Python简介 1
    1.1.1 Python语言的特点 1
    1.1.2 Python语言的应用领域 2
    1.2 Python开发环境部署 3
    1.2.1 下载对应版本安装文件 4
    1.2.2 Python的安装及相关文件介绍 6
    1.3 扩展库的安装 9
    1.4 开发环境应用示例 12
    1.4.1 Anaconda的功能介绍及安装 12
    1.4.2 JupyterLab的使用及文本数据分析
    实例演示 14
    1.5 数据分析概述 18
    1.5.1 数据分析的过程 18
    1.5.2 数据分析常用扩展库 19
    本章小结 20
    练习1 20
    第2章 Python语言基础 22
    2.1 数据类型 22
    2.1.1 数值 22
    2.1.2 字符串 24
    2.1.3 列表 25
    2.1.4 元组 25
    2.1.5 集合 26
    2.1.6 字典 26
    2.2 数据类型的共有方法 27
    2.2.1 索引 27
    2.2.2 切片 28
    2.2.3 提取长度 28
    2.2.4 统计 28
    2.2.5 确认成员身份 29
    2.2.6 删除变量 29
    2.3 字符串、列表、元组、集合及字典的方法 30
    2.3.1 字符串的方法 30
    2.3.2 列表的方法 33
    2.3.3 元组的方法 35
    2.3.4 集合的方法 36
    2.3.5 字典的方法 38
    2.4 内置函数、内置模块与自定义函数 40
    2.4.1 内置函数 40
    2.4.2 高级函数 41
    2.4.3 help()函数 43
    2.4.4 内置函数与内置模块的区别 44
    2.4.5 常用的内置模块 44
    2.4.6 自定义函数 44
    2.5 类和对象 47
    2.5.1 类和对象的概念 47
    2.5.2 类和对象的使用 47
    2.5.3 类和对象实例演示 48
    2.6 读取数据文件 50
    本章小结 51
    练习2 51
    第3章 科学计算库NumPy 54
    3.1 NumPy简介 54
    3.2 NumPy中的对象 55
    3.2.1 ndarray对象 56
    3.2.2 array对象的属性和方法 58
    3.2.3 NumPy创建数组 58
    3.3 NumPy中数组的索引 62
    3.3.1 数组的维度和基本索引 62
    3.3.2 高级索引 63
    3.4 Numpy中的统计函数 64
    3.5 Numpy中的矩阵操作 66
    本章小结 67
    练习3 68
    第4章 数据处理库Pandas 70
    4.1 Pandas简介 70
    4.1.1 Pandas的安装与导入 70
    4.1.2 数据类型Series 71
    4.1.3 数据类型DataFrame 71
    4.2 数据文件读取 72
    4.2.1 excel文件读取 72
    4.2.2 csv文件读取 73
    4.3 数据类型Series和DataFrame 73
    4.3.1 Series常见的属性与方法 73
    4.3.2 DataFrame常见的属性与方法 84
    4.4 Pandas的高级操作 95
    4.4.1 Pandas的高级操作简介 95
    4.4.2 Pandas数据分析案例1 97
    4.4.3 Pandas数据分析案例2 99
    本章小结 107
    练习4 107
    第5章 数据可视化 109
    5.1 数据可视化简介 109
    5.2 Matplotlib可视化 110
    5.2.1 Matplotlib散点图示例 111
    5.2.2 Matplotlib线图示例 112
    5.2.3 Matplotlib柱状图示例 113
    5.2.4 Matplotlib饼图示例 114
    5.2.5 Matplotlib箱线图示例 115
    5.2.6 Matplotlib直方图示例 116
    5.2.7 Matplotlib多子图示例 117
    5.3 Pandas绘图 120
    本章小结 125
    练习5 125
    第6章 数据分析方法 127
    6.1 数据分析方法概述 127
    6.1.1 ETL(Extract-Transform-Load) 127
    6.1.2 数据分析中常用的方法 128
    6.2 数据预处理 128
    6.2.1 异常值处理 128
    6.2.2 缺失值处理 129
    6.2.3 归一化处理 129
    6.3 分类与预测 130
    6.3.1 决策树 130
    6.3.2 朴素贝叶斯 134
    6.3.3 支持向量机 136
    6.3.4 神经网络 139
    6.4 回归 142
    6.4.1 线性回归 142
    6.4.2 非线性回归 143
    6.5 聚类 144
    6.5.1 层次聚类 144
    6.5.2 非层次聚类 146
    本章小结 147
    练习6 147
    第7章 电影数据分析 150
    7.1 项目简介 150
    7.2 代码实现 150
    7.2.1 数据清洗 150
    7.2.2 编程打分 153
    7.2.3 其他数据类型处理 157
    7.2.4 建模分析 162
    本章小结 165
    练习7 165
    第8章 客户价值分析 166
    8.1 项目简介 166
    8.2 代码实现 167
    8.2.1 数据清洗 167
    8.2.2 客户属性与客户流失的关系分析 171
    8.2.3 产品属性与客户流失的关系分析 175
    8.2.4 客户行为与客户流失的关系分析 179
    本章小结 187
    练习8 187
    第9章 房价预测分析 188
    9.1 项目简介 188
    9.2 代码实现 189
    9.2.1 线性回归 194
    9.2.2 随机森林 197
    9.2.3 支持向量机 199
    9.2.4 模型评估比较 201
    本章小结 201
    练习9 201
    参考文献 202





最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册