热门关键字:  听力密码  听力密码  新概念美语  单词密码  巧用听写练听力

大数据技术基础与实战

中国水利水电出版社
    【作 者】李丽萍 周永福 吴明宇 【I S B N 】978-7-5226-0866-2 【责任编辑】石永峰 【适用读者群】高职高专 【出版时间】2022-08-26 【开 本】16开 【装帧信息】平装(光膜) 【版 次】第1版第1次印刷 【页 数】240 【千字数】365 【印 张】15 【定 价】45 【丛 书】高等职业教育大数据与人工智能专业群系列教材 【备注信息】
图书详情

    本书由基础篇和实战篇两部分组成。基础篇包括大数据概述、大数据技术、大数据处理平台、大数据采集与存储、新型数据库、大数据分析与处理、数据可视化。通过基础篇的学习,读者可对大数据技术有一个概括性的了解。实战篇以企业案例为主线,详细介绍大数据分析与处理的技术实现过程,包括大数据分析基础环境搭建、大数据平台搭建、大数据分析案例技术实战。

    本书可作为高职院校电子信息类、计算机类及相关专业大数据基础课程教材,也可供大数据爱好者自学使用。

    本书配有电子教案,读者可以从中国水利水电出版社网站(www.waterpub.com.cn)或万水书苑网站(www.wsbookshow.com)免费下载。

    体系结构合理:基础篇和实战篇相结合,理论够用,突出实践应用。

    内容安排全面:兼顾岗位要求、职业技能竞赛和1+X证书知识范围。

    配套资源丰富:配套微课、课件、习题答案等,方便读者学习使用。

    进入21世纪以来,云计算、大数据、人工智能等新兴信息技术飞速发展,快速融入人类社会的各个领域,对社会的发展起到了重要的促进作用。新时代的到来、新兴技术的兴起,对从事信息技术行业的技术人员和高职信息技术人才培养是一个新的挑战,各级各类学校都在大力倡导和推进新兴信息技术在教育教学中的普及和深入应用。从学习者角度,高职电子信息类、计算机类专业的学生和社会上从事信息技术相关工作的人员渴望了解和学习大数据知识和技术,因此需要一本既可以把大数据相关概念介绍清楚,又能教会大数据分析与处理全栈技术的书籍。基于此需求,我们编写了本书。

    本书分为基础篇和实战篇。基础篇主要阐述大数据基本知识和基本技术:项目1阐述大数据概念、大数据来源、大数据价值、大数据影响和大数据安全;项目2主要介绍大数据基本技术;项目3介绍大数据平台架构、大数据平台采用的技术;项目4介绍大数据采集、预处理和存储技术;项目5介绍关系型数据库、新型数据库NoSQL和NoSQL产品;项目6介绍大数据分析方法和分析技术;项目7介绍大数据可视化技术。实战篇以企业案例为主线,介绍环境和平台搭建真实场景、大数据分析处理过程的技术实现:项目8介绍大数据分析与处理基本环境搭建,包括虚拟系统的搭建、Linux主机配置;项目9介绍大数据平台搭建,包括Hadoop平台搭建、离线大数据分析平台搭建和实时大数据分析平台搭建;项目10介绍基于Maven项目的开发环境搭建、案例的离线基础数据分析与统计、案例的离线基础数据过滤与处理、实时数据分析与处理技术实现。实战篇内容兼顾企业岗位要求、职业技能竞赛和1+X证书知识范围,具有很强的实用价值。

    本书由李丽萍、周永福、吴明宇任主编,王兰丰、魏育华、李任鹤任副主编,王建华任主审,杨一冬、孙梦琳、李景华、邢雅丹和李依桐参与编写。李丽萍负责全书统稿工作。本书编写人员均为高职计算机类专业大数据技术相关课程一线教师,多次参加企业1+X证书技术培训,指导学生参加职业技能竞赛并多次获奖,积累了丰富的大数据技术教学经验。

    在本书编写过程中,编者参阅并引用了部分论文、专著和文献资料,在此对其作者表示感谢。本书实战篇大数据分析案例由广州泰迪智能科技股份有限公司提供,在此深表谢意。由于编者水平有限,书中难免存在疏漏和不足之处,恳请读者批评指正。

    编者

    2022年6月

    基础篇
    项目1 大数据概述 2
    任务1 大数据概念 2
    任务2 大数据来源 6
    任务3 大数据价值及大数据影响 9
    任务4 大数据应用与大数据安全 14
    项目拓展 20
    思考与练习 20
    项目2 大数据技术 21
    任务1 大数据技术概述 21
    任务2 Hadoop概述 27
    项目拓展 32
    思考与练习 32
    项目3 大数据处理平台 33
    任务1 大数据处理平台架构 33
    任务2 离线大数据处理平台Hadoop 36
    任务3 大数据综合处理平台Spark 41
    项目拓展 45
    思考与练习 45
    项目4 大数据采集与存储 46
    任务1 数据采集 46
    任务2 数据预处理 50
    任务3 大数据存储 55
    任务4 分布式文件系统 59
    项目拓展 64
    思考与练习 64
    项目5 新型数据库 65
    任务1 关系型数据库 65
    任务2 NoSQL 69
    任务3 NoSQL的类型与产品 74
    项目拓展 81
    思考与练习 82
    项目6 大数据分析与处理 83
    任务1 大数据分析方法 83
    任务2 大数据分析技术 86
    项目拓展 93
    思考与练习 93
    项目7 数据可视化 94
    任务1 数据可视化概念 94
    任务2 数据可视化方法 101
    任务3 数据可视化应用 108
    项目拓展 116
    思考与练习 116
    实战篇
    项目8 大数据分析基础环境搭建 118
    任务1 虚拟系统的搭建 118
    任务2 Linux主机的配置 130
    项目拓展 145
    思考与练习 145
    项目9 大数据平台搭建 146
    任务1 Hadoop平台的两种搭建方式 146
    任务2 Hadoop平台下离线大数据分析
    平台的搭建方式 176
    任务3 Hadoop平台下实时大数据分析
    平台的搭建方式 189
    项目拓展 198
    思考与练习 198
    项目10 大数据分析案例技术实战 199
    任务1 法律服务大数据分析与探索 199
    任务2 基于Maven的项目开发环境搭建 203
    任务3 离线基础数据分析与统计 209
    任务4 离线基础数据的过滤与统计 220
    任务5 离线数据的处理 225
    任务6 实时数据分析与处理 229
    项目拓展 235
    思考与练习 235
    参考文献 236
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册