大数据技术基础与实战
-
【作 者】李丽萍 周永福 吴明宇
【I S B N 】978-7-5226-0866-2
【责任编辑】石永峰
【适用读者群】高职高专
【出版时间】2022-08-26
【开 本】16开
【装帧信息】平装(光膜)
【版 次】第1版第1次印刷
【页 数】240
【千字数】365
【印 张】15
【定 价】¥45
【丛 书】高等职业教育大数据与人工智能专业群系列教材
【备注信息】
简介
本书特色
前言
章节列表
精彩阅读
下载资源
相关图书
本书由基础篇和实战篇两部分组成。基础篇包括大数据概述、大数据技术、大数据处理平台、大数据采集与存储、新型数据库、大数据分析与处理、数据可视化。通过基础篇的学习,读者可对大数据技术有一个概括性的了解。实战篇以企业案例为主线,详细介绍大数据分析与处理的技术实现过程,包括大数据分析基础环境搭建、大数据平台搭建、大数据分析案例技术实战。
本书可作为高职院校电子信息类、计算机类及相关专业大数据基础课程教材,也可供大数据爱好者自学使用。
本书配有电子教案,读者可以从中国水利水电出版社网站(www.waterpub.com.cn)或万水书苑网站(www.wsbookshow.com)免费下载。
体系结构合理:基础篇和实战篇相结合,理论够用,突出实践应用。
内容安排全面:兼顾岗位要求、职业技能竞赛和1+X证书知识范围。
配套资源丰富:配套微课、课件、习题答案等,方便读者学习使用。
进入21世纪以来,云计算、大数据、人工智能等新兴信息技术飞速发展,快速融入人类社会的各个领域,对社会的发展起到了重要的促进作用。新时代的到来、新兴技术的兴起,对从事信息技术行业的技术人员和高职信息技术人才培养是一个新的挑战,各级各类学校都在大力倡导和推进新兴信息技术在教育教学中的普及和深入应用。从学习者角度,高职电子信息类、计算机类专业的学生和社会上从事信息技术相关工作的人员渴望了解和学习大数据知识和技术,因此需要一本既可以把大数据相关概念介绍清楚,又能教会大数据分析与处理全栈技术的书籍。基于此需求,我们编写了本书。
本书分为基础篇和实战篇。基础篇主要阐述大数据基本知识和基本技术:项目1阐述大数据概念、大数据来源、大数据价值、大数据影响和大数据安全;项目2主要介绍大数据基本技术;项目3介绍大数据平台架构、大数据平台采用的技术;项目4介绍大数据采集、预处理和存储技术;项目5介绍关系型数据库、新型数据库NoSQL和NoSQL产品;项目6介绍大数据分析方法和分析技术;项目7介绍大数据可视化技术。实战篇以企业案例为主线,介绍环境和平台搭建真实场景、大数据分析处理过程的技术实现:项目8介绍大数据分析与处理基本环境搭建,包括虚拟系统的搭建、Linux主机配置;项目9介绍大数据平台搭建,包括Hadoop平台搭建、离线大数据分析平台搭建和实时大数据分析平台搭建;项目10介绍基于Maven项目的开发环境搭建、案例的离线基础数据分析与统计、案例的离线基础数据过滤与处理、实时数据分析与处理技术实现。实战篇内容兼顾企业岗位要求、职业技能竞赛和1+X证书知识范围,具有很强的实用价值。
本书由李丽萍、周永福、吴明宇任主编,王兰丰、魏育华、李任鹤任副主编,王建华任主审,杨一冬、孙梦琳、李景华、邢雅丹和李依桐参与编写。李丽萍负责全书统稿工作。本书编写人员均为高职计算机类专业大数据技术相关课程一线教师,多次参加企业1+X证书技术培训,指导学生参加职业技能竞赛并多次获奖,积累了丰富的大数据技术教学经验。
在本书编写过程中,编者参阅并引用了部分论文、专著和文献资料,在此对其作者表示感谢。本书实战篇大数据分析案例由广州泰迪智能科技股份有限公司提供,在此深表谢意。由于编者水平有限,书中难免存在疏漏和不足之处,恳请读者批评指正。
编者
2022年6月
项目1 大数据概述 2
任务1 大数据概念 2
任务2 大数据来源 6
任务3 大数据价值及大数据影响 9
任务4 大数据应用与大数据安全 14
项目拓展 20
思考与练习 20
项目2 大数据技术 21
任务1 大数据技术概述 21
任务2 Hadoop概述 27
项目拓展 32
思考与练习 32
项目3 大数据处理平台 33
任务1 大数据处理平台架构 33
任务2 离线大数据处理平台Hadoop 36
任务3 大数据综合处理平台Spark 41
项目拓展 45
思考与练习 45
项目4 大数据采集与存储 46
任务1 数据采集 46
任务2 数据预处理 50
任务3 大数据存储 55
任务4 分布式文件系统 59
项目拓展 64
思考与练习 64
项目5 新型数据库 65
任务1 关系型数据库 65
任务2 NoSQL 69
任务3 NoSQL的类型与产品 74
项目拓展 81
思考与练习 82
项目6 大数据分析与处理 83
任务1 大数据分析方法 83
任务2 大数据分析技术 86
项目拓展 93
思考与练习 93
项目7 数据可视化 94
任务1 数据可视化概念 94
任务2 数据可视化方法 101
任务3 数据可视化应用 108
项目拓展 116
思考与练习 116
实战篇
项目8 大数据分析基础环境搭建 118
任务1 虚拟系统的搭建 118
任务2 Linux主机的配置 130
项目拓展 145
思考与练习 145
项目9 大数据平台搭建 146
任务1 Hadoop平台的两种搭建方式 146
任务2 Hadoop平台下离线大数据分析
平台的搭建方式 176
任务3 Hadoop平台下实时大数据分析
平台的搭建方式 189
项目拓展 198
思考与练习 198
项目10 大数据分析案例技术实战 199
任务1 法律服务大数据分析与探索 199
任务2 基于Maven的项目开发环境搭建 203
任务3 离线基础数据分析与统计 209
任务4 离线基础数据的过滤与统计 220
任务5 离线数据的处理 225
任务6 实时数据分析与处理 229
项目拓展 235
思考与练习 235
参考文献 236
- 输水管线工程风险管理 [张勇 党亥生 著]
- 民用航空飞机标准线路施工 [主编 王志敏 陈明]
- 不息的水脉—大运河讲谈录 [赵珩 著]
- 实用运筹学 [主编 邢育红 于晋臣]
- 三峡梯级电站水资源决策支持系统研究与开发 [姚华明 潘红忠 汤正]
- 海南黎族民俗文化鉴赏 [庞国华 著]
- 石墨烯在太赫兹及中红外频段电磁器件设计中的应用 [李艳秀 庄华伟 著]
- 电子技术(第二版) [主编 覃爱娜 李飞]
- 办公自动化高级应用 [陈萍 朱晓玉]
- 信息处理技术员考试32小时通关 [薛大龙]
- 电子产品设计案例教程(微课版)—基于嘉立创EDA(专业版) [王静 莫志宏 陈学昌 丁红]
- C程序设计实践教程 [刘卫国]
- C程序设计(慕课版) [刘卫国]
- Web技术开发教程(基于.NET开源MVC框架) [王合闯 韩红玲 王青正 陈海蕊]
- 商务英语翻译教程(笔译)(第四版) [主编 王军平]
- 智慧零售技术与应用 [洪旭 著]
- 建设工程法规实务 [主编 余滢]
- 商务秘书理论与实务(第三版) [主编 张同钦]
- 程序设计基础实践教程(C/C++语言版) [张桂芬 葛丽娜]
- C++案例项目精讲 [主编 杨国兴]
- 劳动争议处理实务 [主编 王秀卿 罗静]
- 工程数学 [主编 郭立娟 王海]
- 语音识别理论与实践 [主编 莫宏伟]
- 信息系统项目管理师章节习题与考点特训(第二版) [主编 薛大龙]
- 武术基础教程 [主编 李代勇 谢志民]
- 计算机网络实训教程 [主编 张浩军 赵玉娟]
- 画法几何与机械制图习题集(多学时) [主编 赵军]
- HCIA-Datacom认证题库分类精讲 [主 编 韩立刚]
- SwiftUI完全开发 [李智威 著]
- 网络规划设计师备考一本通 [夏杰 编著]