21世纪高等院校云计算和大数据人才培养规划教材

云计算和大数据技术:概念 应用与实战(第2版)

适合云计算、新时代网络建设、网络管理、系统集成行业的开发人员、技术工程师学习
分享 推荐 2 收藏 29 阅读 5.7K
王鹏 , 李俊杰 , 谢志明 , 石慧 , 黄焱 (编著) 978-7-115-42080-0

关于本书的内容有任何问题,请联系 马小霞

紧扣实验环节,深入浅出,以任务驱动模式组织内容
理论精简,案例经典,突出实操实训
配备课件、操作视频、软件资源等电子资源

特别说明

云计算与大数据时代,网络技术人员学习和参考的工具书;
高等职业院校十二五规划教材;
用实战教学,注重入门并提高,边做边学。

内容摘要

本书全面介绍云计算与大数据的基础知识、主要技术、基于集群技术的资源整合型云计算技术和基于虚拟化技术的资源切分型云计算技术。全书共10章,主要内容包括云计算基础与大数据基础、虚拟化技术和平台、MPI、Hadoop、HBase、Hive、Storm和云存储系统Swift。本书以“实践为主、理论够用”为原则,注重实用,实验丰富,将实验内容融合在课程内容中,使理论紧密联系实际。
本书主要面向高等院校计算机专业的学生,也可作为其他相关专业云计算、大数据相关课程的教材,以及IT类培训机构云计算与大数据等相关课程的培训教材和从事相关技术人员的参考书。

前言

本书2013年8月被教育部职业教育与成人教育司批准为“十二五”职业教育国家规划教材(教职成司函〔2013〕184号),第1版于2014年5月出版。由于云计算技术和大数据技术发展迅猛、日新月异,尤其是在2015年10月教育部对普通高等学校高等职业教育(专科)专业目录进行修订的教职成〔2015〕10号文件中明确将云计算技术与应用作为一个专业列入高职高专专业目录中。本书第2版增加了大约30%的篇幅,并按照院校的教学与学习习惯对章节进行了全新的编排,对原有的内容进行全面改写及扩充,以确保能更好地反映云计算专业今后的学习和发展的方向。
为使第2版能更加贴近院校教学需求,本书在改版时不仅对读者进行了调查,还调研了使用本书第1版的多所高职高专院校。反馈回来的结果表明大家更希望的是“理论要精简,案例要经典,实验要步骤明确、易于实操”。因此,本书在改版时采用“理论够用为度,突出实操实训环节”,删除了面向数据的高性能计算集群系统(HPCC)、服务器与数据中心、云计算大数据仿真技术章节,将集群系统基础中的部分内容调整到新版的第1章和第2章;增补了XenServer、VMware vSphere虚拟化平台的安装与部署、HBase、Hive和Swift的实操实训内容,并对MPI、Hadoop、Storm做了较大篇幅的调整。本书紧扣实验环节,深入浅出,以任务驱动模式组织内容,让读者知其然并知其所以然。
本书由西南民族大学计算机科学与技术学院王鹏教授组织编写,是2015年广东省高等职业教育质量工程教育教学改革项目(课题编号:GDJG2015245)和高职教育信息技术教指委教改项目(课题编号:XXJZW2015002)、2016年广东省高等教育学会高职高专云计算与大数据专业委员会教育科研课题(课题编号:GDYJSKT16-01、GDYJSKT16-03、GDYJSKT16-05)、汕尾职业技术学院2014年度资源精品共享课《云计算技术》(课题编号:swzyjpkc14002)、汕尾职业技术学院教学改革与科研立项课题(课题编号:SWKT15-002、SWKT16-002、swjy15-004、swjy15-016)、广州市教育科学规划课题(项目编号:1201420456)、模式识别与智能信息处理四川省高校重点实验室开放基金(课题编号:MSSB-2015-9)和成都市科技局创新发展战略研究项目(项目编号:11RKYB016ZF)的科研成果,本书还得到了广东省高职高专云计算与大数据专业委员会、西南民族大学、广州五舟科技股份有限公司、汕尾市创新工业设计研究院、淮阴师范学院的鼎力支持,同时也得到汕尾职业技术学院各处系领导、老师的支持和帮助,因为有了他们的支持和帮助,我们才能完成本书的撰写和出版工作。
云计算与大数据技术涉及面很广,在第2版的编写过程中部分章节及内容仍然继承了部分第1版编写工作者的经验与成果,同时,还参考并引用了大量前辈学者的研究成果和论述,对此编者向这些学者一并表示深深的敬意。云计算与大数据技术是一门高速发展的技术领域,新技术、新方法、新架构层出不穷,由于作者的经验和能力所限,本书的结构、内容肯定存在许多疏漏和不妥,望读者指正。
为方便读者学习、满足教学需要,本教材配备了大量的电子资源,欢迎读者登录人民邮电出版社教育服务与资源下载社区(http://www.ryjiaoyu.com)下载或登录并行计算实验室网站(http://www.qhoa.org)免费下载使用,同时还欢迎相关课程的教师加入云计算大数据HPC教育QQ群(321168742)讨论交流。读者还可以通过发送邮件给编者以获得更多资源(百度云盘和360云盘链接及提取码)。编者的E-mail是:gdswyun@126.com。
感谢您使用本书,期待本书能成为您的良师益友,也欢迎使用配套教材《云计算和大数据技术实战》(ISBN 978-7-115-39079-0)。
编 者
2016年3月

目录

第 1章 1
云计算基础 1
1.1 云计算技术概述 1
1.1.1 云计算简介 1
1.1.2 云计算的特点 2
1.1.3 云计算技术分类 3
1.1.4 计算机技术向现代信息技术演进的历程 4
1.2 集群系统概述 5
1.2.1 集群系统的基本概念 5
1.2.2 集群系统系统的分类 6
1.3 分布式系统中计算和数据的协作机制 6
1.3.1 基于计算切分的分布式计算 6
1.3.2 基于计算和数据切分的混合型分布式计算技术—网格计算 7
1.3.3 基于数据切分的分布式计算技术 8
1.3.4 三种分布式系统的分析对比 10
1.4 云计算平台服务 11
1.4.1 IAAS(基础设施即服务) 11
1.4.2 PAAS(平台即服务) 11
1.4.3 SAAS(软件即服务) 11
1.5 云计算与物联网 11
练习题 13
第 2章 1
大数据基础 1
2.1 大数据技术概述 1
2.1.1 大数据简介 1
2.1.2 大数据产生的原因 1
2.1.3 数据的计量单位 2
2.1.4 大数据是人类认识世界的新手段 3
2.1.5 几类高性能计算系统对比分析 4
2.1.6主要的大数据处理系统 4
2.1.7 大数据处理的基本流程 6
2.2 大数据的典型应用示例 7
2.2.1 大数据在高能物理中的应用 7
2.2.2 推荐系统 8
2.2.3 搜索引擎系统 8
2.2.4 百度迁徙 9
2.3 大数据中的集群技术 10
1.2.2 集群文件系统的基本概念 10
2.3.1 什么是集群系统 11
2.3.2 大数据并行计算的层次 13
2.3.3 大数据系统的分类方法 14
2.3.3 单一系统映象 15
2.3.4 集群中的一致性 15
2.4 云计算与大数据的发展 17
2.4.1 云计算与大数据发展历程 17
2.4.2 为云计算与大数据发展做出贡献的科学家 20
2.4.3 云计算与大数据的国内发展现状 21
练习题 22
第3章 1
虚拟化技术 1
3.1 虚拟化技术简介 1
3.1.1 虚拟化技术的发展 1
3.1.2 虚拟化技术的优势和劣势 2
3.1.3 虚拟化技术的分类 3
3.2 常见虚拟化软件 6
3.2.1 VirtualBox 6
3.2.2 VMware Workstation 6
3.2.3 KVM 6
3.3 系统虚拟化 7
3.3.1 服务器虚拟化 8
3.3.2 桌面虚拟化 10
3.3.3 网络虚拟化 13
3.4 任务 使用KVM构建虚拟机群 13
3.4.1 子任务1 系统环境设置 13
3.4.2 子任务2 安装虚拟化软件包 15
3.4.3 子任务3 虚拟系统管理器的使用 16
3.4.4 子任务4 虚拟机的远程访问 19
练习题 21
第4章 1
虚拟化平台 1
4.1 XenServer 1
4.1.1 XenServer优点 2
4.1.2 XenServer硬件要求 2
4.2 任务 XenServer部署 3
4.2.1 子任务1 XenServer的安装 3
4.2.2 子任务2 XenCenter的安装 7
4.2.3 子任务3 制作模板 10
4.2.4 子任务4 创建虚拟机 16
4.3 VMware vSphere 19
4.3.1 VMware vSphere体系结构 19
4.3.2 VMware vSphere组件及其功能 21
4.3.3 VMware vSphere硬件要求 22
4.4 任务 vSphere部署 24
4.4.1 子任务1 ESXi的安装 24
4.4.2 子任务1 vSphere Client的安装 26
练习题 33
第5章 1
面向计算—MPI 1
5.1 MPI概述 1
5.2 MPI的架构和特点 2
5.3 任务一 MPICH并行环境的建立 3
5.3.1 子任务1 系统环境设置 3
5.3.2 子任务2 用户创建和ssh设置 4
5.3.3 子任务3 NFS服务的安装 5
5.3.4 子任务4 MPICH编译运行 5
5.4 任务二 MPI分布式程序设计 7
5.4.1 子任务1 简单并行程序的编写 7
5.4.2 子任务2 获取进程标志和机器名 9
5.4.3 子任务3 有消息传递功能的并行程序 12
5.4.4 子任务4 Monte Carlo法在并行程序设计中的应用 16
5.4.5 子任务5 并行计算中节点间的Reduce操作 19
5.4.6 设计MPI并行程序时的注意事项 21
练习题 22
第6章 1
分布式大数据系统 1
—Hadoop 1
6.1 Hadoop概述 1
6.2 HDFS 2
6.1.1 Google文件系统(GFS) 2
6.2.2 HDFS文件的基本结构 4
6.2.3 HDFS的存储过程 5
6.2.4 YARN架构 6
6.3 任务一 搭建Hadoop系统 7
6.3.1 子任务1 系统环境设置 7
6.3.2 子任务2 用户创建和ssh设置 8
6.3.3 子任务3 Hadoop安装和配置 9
6.3.4 子任务4 Hadoop的启动和查看 13
6.4 分布式计算框架MapReduce 14
6.4.1 MapReduce的发展历史 14
6.4.2 MapReduce的基本工作过程 15
6.4.3 MapReduce的特点 18
6.5 任务二 Map/Reduce的C语言实现 19
6.6 任务三 在Hadoop系统运行MapReduce程序 22
练习题 23
第7章 1
分布式数据库—HBase 1
7.1 HBase 1
7.1.1 HBase简介 1
7.1.2 HBase物理模型 2
7.1.3 HBase架构及基本组件 3
7.1.4 HBase组织结构 5
7.2 任务 HBase的搭建与使用 5
7.2.1 子任务1 HBase环境的搭建 6
7.2.2 子任务2 HBase的启动 8
7.2.3 子任务2 HBase Shell的使用 9
7.2.4 子任务3 HBase编程 10
练习题 20
第8章 1
数据仓库平台—Hive 1
8.1 Hive 1
8.1.1 Hive简介 1
8.1.2 Hive的体系结构 2
8.1.3 Hive元数据存储 3
8.1.4 Hive的数据存储 5
8.1.5 Hive和普通关系型数据库的差异 6
8.2 任务一 MySQL的搭建 7
8.3 任务二 Hive的搭建与使用 9
8.2.1 子任务1 Hive环境的搭建 9
8.2.2 子任务2 Hive Client的搭建 12
8.2.3 子任务3 Hive的基本操作 13
8.2.4 子任务4 Hive内部表与外部表的操作 14
8.2.5 子任务5 HWI的使用 16
8.2.6 子任务6 Beeline与JDBC编程 18
8.2.7 子任务6 Hive与HBase集成 23
练习题 26
第9章 1
基于拓扑的流数据实时计算系统—Storm 1
9.1 Storm简介 1
9.2 Storm原理及其体系结构 2
9.2.1 Storm编程模型原理 2
9.2.2 Storm体系结构 3
9.2.3 ZooKeeper工作原理 4
9.3 任务一 搭建Storm开发环境 5
9.3.1 子任务1 系统环境设置 5
9.3.2 子任务2 安装Python工具包 7
9.3.3 子任务3 安装ZeroMQ和JZMQ工具包 7
9.3.4 子任务4 安装Zookeeper工具包 8
9.3.5 子任务5 安装Storm工具包 10
9.3.6 子任务6 复制工具包 11
9.3.7 子任务7 Storm的启动 12
9.4 任务二 Storm使用实例 13
9.4.1 子任务1 安装Maven工具包 13
9.4.2 子任务2 使用Maven管理storm-starter 15
9.4.3 子任务3 WordCountTopology实例分析 16
练习题 21
第 10章 1
云存储系统—Swift 1
10.1 云存储概述 1
10.1.1 什么是云存储 1
10.1.2 云存储的分类 1
10.1.3 云存储的特点 2
10.1.4 存储系统类别 3
10.2 Swift简介 4
10.2.1 Swift的发展历程 4
10.2.2 Swift 的特性 4
10.2.3 Swift工作原理 4
10.2.4 CAP理论 5
10.2.5 环的数据结构 6
10.2.6 Swift的系统架构 7
10.3 任务 Swift安装部署 9
10.3.1 子任务1 系统环境设置 9
10.3.2 子任务2 安装keystone 10
10.3.3 子任务3 安装proxy 14
10.3.4 子任务4 安装存储节点 17
练习题 21


读者评论

赶紧抢沙发哦!

我要评论

作者介绍

王鹏,教授,博士生导师,计算机科学博士后、金融工程博士后,第八批四川省学术和技术带头人后备人选,中组部“西部之光”访问学者,五舟技术研究院院院长,中国电子学会云计算专业委员会委员,中国计算机学会高性能计算专业委员会委员,四川省计算机学会高性能计算专业委员副主任委员,广东省高等教育学会高职高专云计算与大数据专业委员会理事长,成都市物联网产业领军人物,成都市科技攻关计划项目评审专家,迈普集团云计算首席专家,汕尾市科技顾问团首席科学家,成都市“一专多能”优秀青年教师,广东工业大学研究生导师,曾挂职深汕产业转移园管委会副主任,汕尾职业技术学院副院长。发表论文100余篇,著有《走近云计算》、《赢在云端》、《云计算-中国未来的IT战略》、《云计算的关键技术与应用实例》、《问道云计算》等专著。

相关文章

推荐用户

同系列书

  • Hadoop大数据处理技术基础与实践

    安俊秀 王鹏 靳宇倡

    全书共有12章,从Hadoop起源开始,介绍了Hadoop的安装和配置,并对Hadoop的组件分别进行了介绍,...

    ¥45.00
  • 云计算虚拟化技术与应用

    王培麟 姚幼敏 梁同乐 詹增荣 钟伟成

    全书共11章,分为理论篇、技术篇和实战篇三个部分。本书将虚拟化技术与应用融为一体,较为系统地介绍了虚拟化技术发...

    ¥39.80
  • 云计算技术与应用基础

    刘志成 林东升 彭勇

    本书从云计算技术与应用的8个维度对云计算技术基础进行了全面介绍,内容包括云概述、云标准、云存储、云服务、云桌面...

    ¥45.00
  • 大数据导论 思维、技术与应用

    武志学

    本书将基本概念与实例相结合,由浅入深、循序渐进地对大数据思维、技术和应用做了全面系统的介绍。全书共12章,分为...

    ¥49.80
  • 大数据技术与应用基础

    陈志德 曾燕清 李翔宇

    本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具...

    ¥39.80

购买本书用户

相关图书

人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部