名校名师精品系列教材

Python数据分析(项目式)

Python数据分析入门,从数据获取到可视化,应用Python轻松实现数据分析和数据处理
分享 推荐 6 收藏 179 阅读 12.5K
刘凯洋 , 刘小华 , 海龙 (主编) 978-7-115-56955-4

关于本书的内容有任何问题,请联系 初美呈

1.本书主要针对高等职业院校学生的特点,以对应岗位需求为锚点,突出技能教育,提高高职学生在数据分析领域的职业素质。
2.本书精心选择大型真实案例数据集,作为贯穿全书知识点的核心骨干,能有效的激发学生的学习兴趣,有助于建立学生的实际岗位代入感。
3.合理平衡理论知识与实践操作,注重主要理论知识的讲解,强调构建核心技能图谱,帮助学生掌握整体思路的基础上同时熟悉操作细节。
4.本书为每个技能点备有针对性的、丰富的、基于实际需求的、适合各个学习阶层的实操练习,拓展学生的课堂所学。
5.本书有机结合“项目驱动”“案例教学”“基于工作过程的教学”等多种教学方法,充分激发学生的学习兴趣,发挥学生学习的主动性,变常规的教学方式为学生为主型的主动学习方式。

内容摘要

本书紧跟数据分析的最新发展趋势,基于Python的数据分析平台和工具,全面介绍数据分析的相关知识与技能。本书共7个项目,分为3部分:基础部分、数据分析部分、机器学习实战部分。基础部分包括项目一和项目二,介绍数据分析环境的搭建,以及NumPy的理论和实践知识;数据分析部分包括项目三~项目六,结合案例介绍数据检查、数据呈现、数据多维化等,涵盖真实数据分析工作的完整流程;机器学习实战部分只包括项目七,利用一个神经网络实战案例呈现机器学习的完整过程。
本书选用真实度高的实践案例,深入浅出地介绍与数据分析相关的理论和实践知识。本书可作为高校数据分析相关课程的教材,也可供刚进入数据分析领域的人员及具有实践经验的从业者学习、参考使用。

目录

基础部分

项目一 数据分析概述与环境配置 1
1.1 项目背景 1
1.2 技能图谱 3
1.3 工具介绍 4
1.3.1 Python介绍 4
1.3.2 核心包介绍 5
1.3.3 辅助工具介绍 6
1.4 工作环境配置 7
1.4.1 安装Python 7
1.4.2 配置虚拟环境 8
1.4.3 安装第三方包 9
1.5 Jupyter Notebook使用入门 10
1.5.1 Notebook架构 10
1.5.2 Notebook启动 10
1.5.3 Notebook主页基本操作 11
1.5.4 Notebook的保存 12
1.6 项目总结 12

项目二 NumPy实战 13
2.1 项目背景 13
2.2 技能图谱 14
2.3 数组介绍 14
2.3.1 创建数组 15
2.3.2 了解数组特性 18
2.3.3 了解广播 20
2.3.4 练习 23
2.4 数组基本操作 24
2.4.1 变换数组 24
2.4.2 访问数组 26
2.4.3 复制数组 29
2.4.4 练习 31
2.5 数组常用操作 32
2.5.1 使用ufunc 32
2.5.2 查询数组 34
2.5.3 排序数组 35
2.5.4 练习 37
2.6 项目总结 38


数据分析部分

项目三 全球气温变化趋势(一)——数据检查 39
3.1 项目背景 39
3.2 技能图谱 40
3.3 数据获取 40
3.3.1 了解获取途径 40
3.3.2 了解项目数据 41
3.3.3 练习 41
3.4 数据读入 41
3.4.1 了解数据格式 42
3.4.2 读入数据文件 42
3.4.3 处理读入异常 43
3.4.4 练习 43
3.5 数据检查 43
3.5.1 查看数据集大小 44
3.5.2 查看列标签和数据类型 44
3.5.3 了解数据结构 45
3.5.4 练习 46
3.6 数据内容访问 47
3.6.1 采用[]方式 47
3.6.2 采用.[i]loc方式 49
3.6.3 采用表达式方式 51
3.6.4 数据可视化 52
3.6.5 练习 53
3.7 项目总结 53

项目四 全球气温变化趋势(二)——数据分析 54
4.1 项目背景 54
4.2 技能图谱 55
4.3 列处理 55
4.3.1 重命名列标签 55
4.3.2 删除、合并列 56
4.3.3 转换日期数据 57
4.3.4 练习 58
4.4 索引处理 58
4.4.1 设置单级索引 59
4.4.2 设置多级索引 60
4.4.3 查询索引 61
4.4.4 练习 63
4.5 统计分析 64
4.5.1 实现数据排序 64
4.5.2 实现简单统计 65
4.5.3 实现分组统计 66
4.5.4 练习 70
4.6 项目总结 71

项目五 全球气温变化趋势(三)——数据呈现 72
5.1 项目背景 72
5.2 技能图谱 73
5.3 数据清洗 73
5.3.1 处理缺失值 74
5.3.2 检测异常值 75
5.3.3 处理异常值 78
5.3.4 练习 81
5.4 数据转换 82
5.4.1 实现数据替换 82
5.4.2 实现离散化 83
5.4.3 实现重取样 83
5.4.4 练习 84
5.5 数据可视化 84
5.5.1 绘制折线图 84
5.5.2 绘制饼图 88
5.5.3 绘制柱状图 89
5.5.4 练习 94
5.6 项目总结 98

项目六 全球气温变化趋势(四)——数据多维化 99
6.1 项目背景 99
6.2 技能图谱 99
6.3 数据拆分与拼接 100
6.3.1 了解轴向 100
6.3.2 拆分数据 101
6.3.3 拼接数据 103
6.3.4 练习 109
6.4 数据透视表 109
6.4.1 了解数据透视表 109
6.4.2 使用pivot_table() 110
6.4.3 使用crosstab() 113
6.4.4 练习 115
6.5 项目总结 115


机器学习实战部分

项目七 机器学习实战——模型的自我学习 117
7.1 项目背景 117
7.2 技能图谱 119
7.3 背景知识介绍 119
7.3.1 了解人工智能 120
7.3.2 了解机器学习 125
7.3.3 了解人工智能实际应用 129
7.3.4 练习 130
7.4 神经网络简介 130
7.4.1 了解神经网络 132
7.4.2 了解常见神经网络 136
7.4.3 了解CNN 139
7.4.4 练习 143
7.5 CNN实战 143
7.5.1 预处理数据 143
7.5.2 构建和训练模型 146
7.5.3 分析模型性能 148
7.5.4 练习 153
7.6 项目总结 155

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

刘凯洋,男,副教授,1978.12出生。 1999.7月毕业于西安交通大学计算机科学系。 1999.7-2004.10 毕业于香港科技大学计算机科学系,获得博士学位。 2005.6-至今 深圳职业技术学院从事教学和科研工作 主持2006年校级科研项目《基于嵌入式的网络安全系统》,参与了2009年国家精品课程《Oracle数据库系统管理》,以第一作者发表论文3篇。主要研究方向为图论、自然语言处理等

推荐用户

同系列书

相关图书

  • PySpark大数据分析与应用

    戴刚 张良均 桂友武 李晓英 李晓丹

    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相...

    ¥69.80
  • Hive大数据存储与处理

    何煌 张良均 孙一铭 胡健 陈翠松

    本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容...

    ¥59.80
  • 人工智能原理及MATLAB实现

    许国根

    本书系统地阐述了人工智能算法的基本原理、实现技术及其应用,基本涵盖了其重要理论和方法,包括了最近发展起来的并被...

    ¥79.80
  • 大数据分析处理(慕课版)

    郭永洪,贺萌

    本书采用理论知识与任务案例相结合的形式,以PyCharm为主要开发工具,系统地阐述了大数据分析处理工作流程中的...

    ¥69.80
  • 大数据应用技术与实践(微课版)

    刘志勇

    本书讲解了一个大数据综合项目——电影市场的预测。本书根据大数据技术在实际工作中的应用过程分为10个工作任务,分...

    ¥42.00
人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部