大数据技术精品系列教材

Python数据分析基础与案例实战

以Python数据分析的常用技术与交通行业真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘技术
分享 推荐 4 收藏 100 阅读 6.2K
杨果仁 , 张良均 (主编) 王海玲 王宁 蔡顺燕 (副主编) 978-7-115-62010-1

关于本书的内容有任何问题,请联系 人邮社-赵亮

⭐融入二十大精神,贯彻立德树人。
⭐ 紧扣交通大数据分析全流程。本书基于数据分析的流程,结合交通大数据讲解流程中的每个环节,详细介绍如何使用Python实现交通大数据分析的完整流程,并通过课后习题帮助读者巩固所学知识。
⭐注重项目实战应用。本书通过讲解实际交通行业的相关项目,让读者明确如何利用所学知识来解决生产、生活中的问题,真正理解并能够应用所学知识。
⭐ 注重启发式教学。全书大部分章节紧扣具体应用展开,不堆积知识点,着重于思路的启发与解决方案的实施。

内容摘要

本书以Python数据分析的常用技术与交通行业真实案例相结合的方式,深入浅出地介绍了Python数据分析与挖掘技术的主要内容。全书共10章,内容包括绪论、Python数据分析简介、数据获取、数据探索、数据预处理、构建模型、运输车辆驾驶行为分析、公交车站点设置优化分析、铁路站点客
流量预测,以及基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析。本书大部分章节包含课后习题,通过练习和操作实践,读者可以巩固所学的内容。
本书可作为高校数据分析相关专业的教材,也可作为交通行业相关的教学、培训教材,还可作为数据分析爱好者的自学用书。

目录

目录

第1章 绪论 1
1.1 了解交通大数据 1
1.1.1 交通大数据的背景 1
1.1.2 交通大数据的应用 4
1.2 认识数据分析 5
1.2.1 掌握数据分析的基本任务 6
1.2.2 熟悉数据分析的基本流程 6
1.3 了解常用的数据分析工具 8
1.4 配置Python开发环境 9
1.4.1 安装Anaconda 9
1.4.2 掌握Jupyter Notebook的使用方法 12
小结 14
课后习题 14
第 2章 Python数据分析简介 16
2.1 入门Python数据分析 16
2.1.1 了解基本命令 16
2.1.2 掌握数据结构 19
2.1.3 函数式编程 21
2.1.4 导入与添加库 23
2.2 了解Python数据分析常用扩展库 24
2.2.1 NumPy 25
2.2.2 SciPy 26
2.2.3 pandas 27
2.2.4 Matplotlib 28
2.2.5 scikit-learn 30
小结 31
课后习题 31
第3章 数据获取 32
3.1 了解常见的数据来源 32
3.2 了解交通信息的采集 33
3.2.1 交通信息的分类与特点 33
3.2.2 常见的交通信息采集技术 34
3.3 了解常见的数据类型 35
3.4 掌握数据的读取方式 37
3.4.1 读取数据库数据 37
3.4.2 读取文件数据 38
小结 40
课后习题 40
第4章 数据探索 41
4.1 分析数据质量 41
4.1.1 分析缺失值 41
4.1.2 分析异常值 42
4.2 分析数据特征 45
4.2.1 分析数据的统计量 45
4.2.2 分析数据的分布情况 48
4.2.3 对比分析数据 53
4.2.4 分析数据的周期性 56
4.2.5 分析数据的相关性 57
小结 60
课后习题 61
第5章 数据预处理 63
5.1 数据清洗 63
5.1.1 处理缺失值 63
5.1.2 处理异常值 66
5.2 数据变换 66
5.2.1 函数变换 66
5.2.2 数据标准化 67
5.2.3 离散化连续型数据 69
5.3 属性构造 72
5.4 属性规约 73
5.5 数据合并 76
5.5.1 多表合并 77
5.5.2 分组聚合数据 84
小结 92
课后习题 92
第6章 构建模型 94
6.1 构建分类与回归模型 94
6.1.1 常用的分类与回归算法 94
6.1.2 了解回归分析 95
6.1.3 了解朴素贝叶斯 99
6.1.4 了解决策树 101
6.1.5 了解人工神经网络 104
6.1.6 评价分类与回归模型 109
6.2 构建聚类模型 113
6.2.1 了解常用的聚类算法 113
6.2.2 了解K-Means聚类 114
6.2.3 了解密度聚类 120
6.2.4 聚类模型评价 124
6.3 构建时间序列模型 126
6.3.1 了解常用的时间序列模型 126
6.3.2 预处理时间序列 127
6.3.3 分析平稳时间序列 128
6.3.4 分析非平稳时间序列 131
小结 140
课后习题 140
第7章 运输车辆驾驶行为分析 142
7.1 分析背景与目标 142
7.1.1 背景 142
7.1.2 数据说明 143
7.1.3 分析目标 144
7.2 数据探索分析 145
7.2.1 分布分析 145
7.2.2 相关性分析 146
7.2.3 异常值检测 147
7.3 驾驶行为聚类分析 149
7.3.1 K-Means聚类 149
7.3.2 层次聚类 152
7.3.3 高斯混合模型聚类 153
7.3.4 谱聚类 154
7.4 构建驾驶行为预测模型 156
7.4.1 构建线性判别分析模型 156
7.4.2 构建朴素贝叶斯模型 157
7.4.3 构建神经网络模型 159
7.5 驾驶行为分析总结与建议 160
小结 160
课后习题 160
第8章 公交车站点设置优化分析 162
8.1 分析背景与目标 162
8.1.1 背景 163
8.1.2 数据说明 163
8.1.3 分析目标 164
8.2 探索公交刷卡数据 165
8.3 预处理公交车载GPS数据与刷卡数据 166
8.3.1 属性规约 166
8.3.2 缺失值处理 166
8.3.3 数据去重 167
8.4 构建DBSCAN模型 168
8.5 公交车站点设置优化分析 170
8.5.1 计算上车人数 170
8.5.2 计算下车人数 172
8.5.3 结果分析 176
小结 177
课后习题 177
第9章 铁路站点客流量预测 179
9.1 分析背景与目标 179
9.1.1 背景 179
9.1.2 数据说明 180
9.1.3 分析目标 180
9.2 预处理客流量数据 181
9.3 探索客流量数据 186
9.3.1 不同站点上下车客流量分布分析 186
9.3.2 不同时段上下车客流量分布分析 187
9.3.3 分析节假日客流量变化 189
9.4 构建模型并预测客流量 192
9.4.1 构建时间序列模型 192
9.4.2 预测非节假日客流量 195
9.4.3 预测节假日客流量 199
小结 206
课后习题 207
第 10章 基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析 208
10.1 Tip DM大数据挖掘建模平台简介 208
10.1.1 模型库 210
10.1.2 数据连接 210
10.1.3 我的数据 210
10.1.4 我的工程 211
10.1.5 系统算法 211
10.1.6 个人算法 213
10.2 实现运输车辆驾驶行为分析 214
10.2.1 数据源配置 214
10.2.2 数据探索分析 217
10.2.3 驾驶行为聚类分析 222
10.2.4 构建驾驶行为预测模型 230
小结 236

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

杨果仁,中共党员,教育学硕士,副教授。现任成都师范学院物理与工程技术学院院长,四川STEAM科创教育科普基地主任,兼任四川省汽车工程学会人才培养工作委员会主任委员,四川省教育厅2020年省级一流专业汽车服务工程专业负责人,四川省教育厅2020年高等学校省级课程思政示范课程、四川省教育厅2021年高等学校省级一流课程《物理学专业导论》主持人。先后承担省级应用型示范课程《汽车营销学》、省级创新创业教育示范课程《单片机原理与应用》《汽车专业课程教学法》《职业教育学》等课程的教学。先后承担和参与四川省教育厅教改项目《新工科背景下大数据驱动汽车服务工程专业创新创业教育改革研究》《众创时代背景下应用型本科高校学生创新创业核心能力提升研究》、教育部2018年第一批产学合作协同育人项目《基于大数据背景下的汽车营销学教学改革》,教育部2017年第二批产学合作协同育人项目《汽车服务工程专业“双创”人才培养模式创新》的研究与改革,主持教育部产学合作协同育人项目2项,主持四川省科技厅项目1项,主持完成四川省教育厅教改项目2项,参编出版《新型本科院校改革探索》《智能网联汽车技术》等专著与教材3本,公开发表学术论文20余篇,授权实用新型专利4项,获四川省高等教育教学成果奖一等奖1项、三等奖1项。

推荐用户

同系列书

  • Python数据分析与应用

    黄红梅 张良均 张凌 施兴 周东平

    本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际...

    ¥49.80
  • Python中文自然语言处理基础与实战

    肖刚 张良均 郑鑫标 罗惠琳 陈晓娜

    本书以Python自然语言处理的常用技术与真实案例相结合的方式,深入浅出地介绍Python自然语言处理的重要内...

    ¥59.80
  • Python网络爬虫技术

    江吉彬 张良均 詹增荣 戴华炜 郭信佑

    本书以任务为导向,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能...

    ¥39.80
  • Python编程基础

    张健 张良均 何燕 张敏 姜鹏辉

    本书采用以任务为导向的编写模式,全面地介绍了Python编程基础及其相关知识的应用,讲解了如何利用Python...

    ¥39.80
  • Spark大数据技术与应用

    肖芳 张良均 汪作文 胡大威 樊哲

    本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述;Sc...

    ¥49.80

相关图书

单击此处加入人邮大数据教师服务群,共同探讨交流。
人邮微信
本地服务
教师服务
教师服务
读者服务
读者服务
返回顶部
返回顶部