大数据导论(第2版 )

大数据导论
分享 推荐 1 收藏 62 阅读 9.2K
林子雨 (作者) 978-7-115-64185-4

关于本书的内容有任何问题,请联系 孙澍

🌟 紧扣大数据专业导论课定位,搭建入门知识体系
遵循导论课“启蒙认知、搭建框架”的核心目标,从大数据概念、发展历程、核心技术模块到行业生态,规避复杂的理论推导和代码实现,为后续专业课程筑牢基础。
🌟 注重理论与实践相结合,践行“学以致用”
详细阐述基础理论体系,同时设计与教材配套的入门级的全套实验,加深学生对知识的理解和应用能力。
🌟 跨学科交叉融合帮助学生全面养成大数据思维
注重与其他学科的交叉融合,如云计算、物联网、人工智能、区块链、元宇宙等,通过跨学科的知识体系构建,帮助学生形成更为全面的大数据思维。
🌟 支持模块化教学设计
教材采用模块化设计,读者可以根据自身的基础和兴趣选择性地学习特定章节,既保证了内容的灵活性,也提高了学习效率。
🌟 开源教学资源共享
免费提供丰富的大数据教学资源,包括 PPT、MOOC 视频、课程思政资源、习题、案例、学习指南、备课指南、上机实验指南、题库等。

特别说明

【修订情况】
1. 增加第5章大数据硬件环境。为了应对日益庞大、复杂和高速的数据挑战,大数据系统需要在计算、存储和网络等各个方面超越单台计算机的性能局限,将服务器联网形成集群以协同的方式工作。因此构建大数据硬件环境至关重要。
2. 对内容涉及的数据、技术进行更新,同时介绍新兴技术以及一线教学提出的需求较多的内容,包括:
(1)第1章增加大数据与数字经济;
(2)第2章增加大数据与元宇宙;
(3)将大数据治理移至第3章大数据基础知识;
(7)第7章增加OceanBase数据库;
(8)第8章增加基于统计学方法的数据分析、机器挖掘的方法体系。

内容摘要

        本书详细阐述了培养复合型大数据专业人才所需要的大数据相关知识。全书共10章,内容包括大数据概述、大数据与其他新兴技术的关系、大数据基础知识、大数据的应用、大数据的硬件环境、数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化、大数据分析综合案例。在大数据基础知识部分,本书详细介绍了与培养学生的数据素养相关的知识,包括大数据安全、大数据思维、大数据伦理、数据共享、数据开放、大数据交易和大数据治理。
        本书可以作为高等院校大数据专业的导论课教材,也可供相关技术人员参考。

PPT课件示例

目录

【章目录】
第 1 章 大数据概述
第 2 章 大数据与其他新兴技术的关系
第 3 章 大数据基础知识
第 4 章 大数据的应用
第 5 章 大数据的硬件环境
第 6 章 数据采集与预处理
第 7 章 数据存储与管理
第 8 章 数据处理与分析
第 9 章 数据可视化
第 10 章 大数据分析综合案例

【详细目录】
第 1 章 大数据概述
1.1 数据
1.1.1 数据的概念
1.1.2 数据的类型
1.1.3 数据的组织形式
1.1.4 数据的生命周期
1.1.5 数据的使用
1.1.6 数据的价值
1.1.7 数据爆炸
1.1.8 数商
1.2 大数据时代
1.2.1 第三次信息化浪潮
1.2.2 信息科技为大数据时代提供技术支撑
1.2.3 数据产生方式的变革促成大数据时代的来临
1.3 大数据的发展历程
1.4 世界各国的大数据发展战略
1.4.1 美国
1.4.2 英国
1.4.3 欧盟
1.4.4 韩国
1.4.5 日本
1.4.6 中国
1.5 大数据的概念
1.5.1 数据量大
1.5.2 数据类型繁多
1.5.3 处理速度快
1.5.4 价值密度低
1.6 大数据的影响
1.6.1 大数据对科学研究的影响
1.6.2 大数据对社会发展的影响
1.6.3 大数据对就业市场的影响
1.6.4 大数据对人才培养的影响
1.7 大数据的应用
1.7.1 大数据在各个领域的应用
1.7.2 大数据应用的 3 个层次
1.8 大数据产业
1.9 大数据与数字经济
1.9.1 数字经济
1.9.2 大数据与数字经济的紧密关系
1.10 高校的大数据专业
1.10.1 大数据专业概述
1.10.2 大数据专业体系
1.10.3 大数据专业的编程语言
1.11 本章小结
1.12 习题

第 2 章 大数据与其他新兴技术的关系
2.1 云计算
2.1.1 云计算的概念
2.1.2 云计算的服务模式和类型
2.1.3 云计算数据中心
2.1.4 云计算的应用和产业
2.2 物联网
2.2.1 物联网的概念
2.2.2 物联网的关键技术
2.2.3 物联网的应用
2.2.4 物联网产业链
2.3 大数据与云计算、物联网的关系
2.4 人工智能
2.4.1 人工智能的概念
2.4.2 人工智能的关键技术
2.4.3 人工智能的应用
2.4.4 人工智能产业
2.4.5 大数据与人工智能的关系
2.5 区块链
2.5.1 比特币概述
2.5.2 区块链的原理
2.5.3 区块链的定义和应用
2.5.4 大数据与区块链的关系
2.6 元宇宙
2.6.1 元宇宙的概念
2.6.2 元宇宙的基本特征
2.6.3 元宇宙的核心技术
2.6.4 大数据与元宇宙的关系
2.7 本章小结
2.8 习题

第 3 章 大数据基础知识
3.1 大数据安全
3.1.1 传统数据安全
3.1.2 大数据安全与传统数据安全的不同
3.1.3 大数据时代数据安全面临的挑战
3.1.4 大数据安全问题分类
3.1.5 大数据面临的具体安全威胁
3.1.6 典型案例
3.2 大数据思维
3.2.1 传统的思维方式
3.2.2 大数据时代需要新的思维方式
3.2.3 大数据思维方式
3.2.4 运用大数据思维方式的具体实例
3.3 大数据伦理
3.3.1 大数据伦理的概念
3.3.2 大数据伦理的典型案例
3.3.3 大数据的伦理问题
3.4 数据共享
3.4.1 数据孤岛问题
3.4.2 数据孤岛问题产生的原因
3.4.3 消除数据孤岛的重要意义
3.4.4 实现数据共享所面临的挑战
3.4.5 推进数据共享开放的举措
3.4.6 数据共享案例
3.5 数据开放
3.5.1 政府开放数据的理论基础
3.5.2 政府信息公开与政府数据开放的联系与区别
3.5.3 政府数据开放的重要意义
3.6 大数据交易
3.6.1 大数据交易概述
3.6.2 大数据交易的发展现状
3.6.3 大数据交易平台
3.7 大数据治理
3.7.1 概述
3.7.2 大数据治理要素和治理原则
3.7.3 大数据治理的范围
3.8 本章小结
3.9 习题

第 4 章 大数据的应用
4.1 大数据在互联网领域的应用
4.2 大数据在生物医学领域的应用
4.2.1 流行病预测
4.2.2 智慧医疗
4.2.3 生物信息学
4.3 大数据在物流领域的应用
4.3.1 智能物流的概念
4.3.2 大数据是智能物流的关键
4.3.3 中国智能物流骨干网 — 菜鸟
4.4 大数据在城市管理领域的应用
4.4.1 智能交通
4.4.2 环保监测
4.4.3 城市规划
4.4.4 安防
4.5 大数据在金融领域的应用
4.5.1 高频交易
4.5.2 市场情绪分析
4.5.3 信贷风险分析
4.5.4 大数据征信
4.6 大数据在汽车领域的应用
4.7 大数据在零售领域的应用
4.7.1 发现关联购买行为
4.7.2 客户群体细分
4.7.3 供应链管理
4.8 大数据在餐饮领域的应用
4.8.1 餐饮领域拥抱大数据
4.8.2 餐饮 O2O
4.9 大数据在电信和能源领域的应用
4.10 大数据在体育和娱乐领域的应用
4.10.1 训练球队
4.10.2 投拍影视作品
4.10.3 预测比赛结果
4.11 大数据在安全领域的应用
4.11.1 大数据与国家安全
4.11.2 应用大数据技术防御网络攻击
4.11.3 警察应用大数据工具预防犯罪
4.12 大数据在日常生活中的应用
4.13 本章小结
4.14 习题

第 5 章 大数据的硬件环境
5.1 服务器的性能指标
5.2 服务器的分类及选购
5.3 系统的性能评估
5.3.1 CPU
5.3.2 内存
5.3.3 存储
5.3.4 网卡
5.4 硬件系统分析
5.5 网络设备
5.6 系统组网方案设计
5.6.1 网络需求分析
5.6.2 网络结构设计
5.7 数据中心
5.7.1 数据中心的分类
5.7.2 数据中心的组成
5.7.3 数据中心的上线
5.8 本章小结
5.9 习题

第 6 章 数据采集与预处理
6.1 数据采集
6.1.1 数据采集的概念
6.1.2 数据采集的三大要点
6.1.3 数据采集的数据源
6.1.4 数据采集方法
6.1.5 网络爬虫
6.2 数据清洗
6.2.1 数据清洗的应用领域
6.2.2 数据清洗的实现方式
6.2.3 数据清洗的内容
6.2.4 数据清洗的注意事项
6.2.5 数据清洗的基本流程
6.2.6 数据清洗的评价标准
6.2.7 数据清洗的行业发展
6.3 数据集成和数据转换
6.3.1 数据集成
6.3.2 数据转换
6.4 数据归约
6.5 数据脱敏
6.6 本章小结
6.7 习题

第 7 章 数据存储与管理
7.1 传统的数据存储与管理技术
7.1.1 文件系统
7.1.2 关系数据库
7.1.3 数据仓库
7.1.4 并行数据库
7.2 大数据时代的数据存储与管理技术
7.2.1 分布式文件系统
7.2.2 NewSQL 和 NoSQL 数据库
7.2.3 云数据库
7.2.4 数据湖
7.3 大数据处理架构 Hadoop
7.3.1 Hadoop 的特性
7.3.2 Hadoop 生态系统
7.4 分布式文件系统 HDFS
7.4.1 HDFS 的设计目标
7.4.2 HDFS 的体系结构
7.5 NoSQL 数据库
7.5.1 键值数据库
7.5.2 列族数据库
7.5.3 文档数据库
7.5.4 图数据库
7.6 云数据库
7.6.1 云数据库的概念
7.6.2 云数据库的特性
7.6.3 云数据库与其他数据库的关系
7.6.4 代表性的云数据库产品
7.7 分布式数据库 HBase
7.7.1 Bigtable 概述
7.7.2 HBase 简介
7.7.3 HBase 的数据模型
7.7.4 HBase 的系统架构
7.8 Spanner
7.9 OceanBase
7.10 本章小结
7.11 习题

第 8 章 数据处理与分析
8.1 数据处理与分析的概念
8.2 基于统计学方法的数据分析
8.2.1 常见的数据分析方法
8.2.2 数据分析的主流工具
8.3 机器学习和数据挖掘算法
8.3.1 概述
8.3.2 分类
8.3.3 聚类
8.3.4 回归分析
8.3.5 关联规则
8.3.6 协同过滤
8.4 数据挖掘的方法体系
8.4.1 可挖掘的知识
8.4.2 数据挖掘系统的体系结构
8.4.3 数据挖掘流程
8.5 大数据处理与分析技术
8.5.1 技术分类
8.5.2 流计算
8.5.3 图计算
8.6 大数据处理与分析的代表性产品
8.6.1 分布式计算框架 MapReduce
8.6.2 数据仓库 Hive
8.6.3 数据仓库 Impala
8.6.4 基于内存的分布式计算框架 Spark
8.6.5 机器学习框架 TensorFlowOnSpark
8.6.6 流计算框架 Flink
8.6.7 大数据编程框架 Beam
8.6.8 查询分析系统 Dremel
8.7 本章小结
8.8 习题

第 9 章 数据可视化
9.1 可视化概述
9.1.1 数据可视化简介
9.1.2 可视化的发展历程
9.1.3 可视化的重要作用
9.2 可视化图表
9.3 可视化工具
9.3.1 入门级工具
9.3.2 信息图表工具
9.3.3 地图工具
9.3.4 时间线工具
9.3.5 高级分析工具
9.4 本章小结
9.5 习题

第 10 章 大数据分析综合案例
10.1 案例任务
10.2 系统设计
10.2.1 系统总体设计
10.2.2 数据库设计
10.2.3 系统网站设计
10.2.4 算法设计
10.3 技术选择
10.4 系统实现
10.5 本章小结
10.6 习题
参考文献

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

林子雨,博士,国内高校知名大数据教师,厦门大学计算机科学与技术系副教授,厦门大学计算机科学与技术系数据库实验室负责人,中国计算机学会数据库专委会委员,中国计算机学会信息系统专委会委员,入选“2021年高校计算机专业优秀教师奖励计划”,荣获“2022 年福建省高等教育教学成果奖特等奖(个人排名第一)”和“2018 年福建省高等教育教学成果奖二等奖(个人排名第一)”,出版 12 本大数据系列教材,被国内 500 多所高校采用,建设了国内高校首个大数据课程公共服务平台,平台累计访问量超过 2300 万次,成为全国高校大数据教学知名品牌,主持的“大数据技术原理与应用"课程获评国家精品在线开放课程和国家级线上一流本科课程,主持的“Spark 编程基础课程狭评国家级一流本科课程。

推荐用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部