Python数据分析、挖掘与可视化

分享 推荐 1 收藏 2 阅读 102
林子雨 (作者) 978-7-115-66088-6

关于本书的内容有任何问题,请联系 孙澍

(1)本书从Python基础知识讲起,由浅入深、递进展开,全面覆盖Python基础知识和高级应用。第1章到第6章全面介绍了Python语言的基础知识,为后面章节学习高级应用铺平道路。
(2)注重数据分析理论和实践的巧妙结合。本书不仅介绍数据分析相关理论,同时注重实践操作,通过大量案例,使读者在理解原理的同时,也能掌握实际应用技巧。通过本书的学习,读者将能够全面提升数据分析技能,为数据分析工作奠定坚实基础。
(3)容易开展上机实践操作。本书采用Windows系统搭建实验环境,入门门槛低,并提供了详细的实验指南,很容易完成书上的各种上机实验。
(4)包含丰富的实验案例。数据分析是一门注重培养学生动手能力的课程,为了提高学生的动手能力,全书提供了丰富的实验案例。
(5)提供丰富的教学配套资源。本书配套如PPT课件、视频课程、教学大纲、教案、实验手册、课程思政案例等,视频课程全部开放供读者观看。
¥69.80 ¥59.33 (8.5 折)
立即购买

内容摘要

数据分析能够帮助人们洞察数据的内在规律和趋势,提取有价值的信息,为决策提供科学依据。在当今信息爆炸的时代,数据分析已成为各行各业不可或缺的技能。本书通过丰富的案例帮助读者快速掌握Python数据分析的核心技能,提高数据处理和分析的能力,从而更好地应对学习和工作中的挑战。本书共10章,内容包括Python概述、基本语法知识、程序控制结构、序列、函数、文件和数据库操作、数据分析基础工具NumPy、基于Matplotlib的数据可视化、基于pandas的数据预处理和分析、基于sklearn的机器学习。
本书可作为高等学校各个专业“数据分析”课程的教材,也可作为对数据分析感兴趣的读者的参考书。

目录

第1章 Python语言概述
1.1 计算机语言
1.1.1 计算机语言的种类
1.1.2 编程语言的选择
1.2 Python简介
1.2.1 什么是Python
1.2.2 Python语言的特点
1.2.3 Python语言的应用
1.2.4 Python的版本
1.3 搭建Python开发环境
1.3.1 安装Python
1.3.2 设置当前工作目录
1.3.3 使用交互式执行环境
1.3.4 运行代码文件
1.3.5 使用IDLE编写代码
1.3.6 第三方开发工具
1.3.7 安装和使用Python扩展模块
1.4 Python规范
1.4.1 注释规则
1.4.2 代码缩进
1.5 本章小结
1.6 习题

第2章 基础语法知识
2.1 关键字和标识符
2.1.1 关键字
2.1.2 标识符
2.2 变量
2.3 基本数据类型
2.3.1 数字
2.3.2 字符串
2.3.3 数据类型转换
2.4 基本输入和输出
2.4.1 使用input()函数输入
2.4.2 使用print()函数输出
2.5 运算符和表达式
2.5.1 算术运算符和表达式
2.5.2 赋值运算符和表达式
2.5.3 比较运算符和表达式
2.5.4 逻辑运算符和表达式
2.5.5 运算符的优先级与结合性
2.6 本章小结
2.7 习题

第3章 程序控制结构
3.1 程序控制结构
3.2 选择语句
3.2.1 if语句
3.2.2 if…else语句
3.2.3 if…elif…else多分支语句
3.2.4 if语句的嵌套
3.3 循环语句
3.3.1 while循环语句
3.3.2 for循环语句
3.3.3 循环嵌套
3.4 跳转语句
3.4.1 break跳转语句
3.4.2 continue跳转语句
3.4.3 pass语句
3.5 综合实例
3.6 本章小结
3.7 习题
实验1 程序控制结构的应用编程实践

第4章 序列
4.1 列表
4.1.1 列表的创建与删除
4.1.2 访问列表元素
4.1.3 添加、删除、修改列表元素
4.1.4 对列表进行统计
4.1.5 对列表进行排序
4.1.6 成员资格判断
4.1.7 切片操作
4.1.8 列表推导式
4.1.9 二维列表
4.2 元组
4.2.1 创建元组
4.2.2 访问元组
4.2.3 修改元组
4.2.4 删除元组
4.2.5 元组推导式
4.2.6 元组的常用内置函数
4.2.7 元组与列表的区别
4.2.8 序列封包和序列解包
4.3 字典
4.3.1 字典的创建与删除
4.3.2 访问字典
4.3.3 添加、修改和删除字典元素
4.3.4 字典推导式
4.4 集合
4.4.1 集合的创建与删除
4.4.2 集合元素的添加与删除
4.4.3 集合的并集、交集与差集操作
4.5 字符串
4.5.1 字符串的基本概念
4.5.2字符串的索引和切片
4.5.3字符串的拼接
4.5.4特殊字符和字符转义
4.5.5原始字符串和格式化字符串
4.5.6字符串的编码
4.5.7字符串的常用操作
4.6 本章小结
4.7 习题
实验2 序列的使用方法初级实践

第5章 函数
5.1 普通函数
5.1.1 基本定义及调用
5.1.2 return语句
5.1.3 变量作用域
5.1.4 函数的递归调用
5.2 匿名函数
5.3 参数传递
5.3.1 给函数传递不可变对象
5.3.2 给函数传递可变对象
5.4 参数类型
5.4.1 位置参数
5.4.2 关键字参数
5.4.3 默认参数
5.4.4 不定长参数
5.4.5 参数传递的序列解包
5.5 本章小结
5.6 习题
实验3 函数的使用方法初级实践

第6章 文件和数据库操作
6.1 文件操作
6.1.1打开文件
6.1.2关闭文件
6.2 文件读写
6.2.1 写数据
6.2.2 读数据(read)
6.2.3 读数据(readlines)
6.2.4 读数据(readline)
6.3 数据库
6.4关系数据库标准语言SQL
6.4.1 SQL简介
6.4.2 常用的SQL语句
6.5 MySQL的安装和使用
6.5.1 安装MySQL
6.5.2 MySQL的使用方法
6.6 使用Python操作MySQL数据库
6.6.1 连接数据库
6.6.2 创建表
6.6.3 插入数据
6.6.4 修改数据
6.6.5 查询数据
6.6.6 删除数据
6.6 本章小结
6.7 习题
实验4 文件和数据库操作初级实践

第7章 数据分析基础工具NumPy
7.1 概述
7.2 基本概念
7.3 数组创建
7.4 数组索引和切片
7.5 数组运算
7.6 数组对象的常用函数
7.6.1 修改数组形状
7.6.2 翻转数组
7.6.3 修改数组维度
7.6.4连接数组
7.6.5拆分数组
7.6.6数组元素的添加、删除与替换
7.6.7 数学计算
7.6.8 排序
7.7 本章小结
7.8 习题
实验5 NumPy数组使用方法初级实践

第8章 基于Matplotlib的数据可视化
8.1 Matplotlib简介
8.2 Matplotlib的安装和导入
8.3 常规绘图方法
8.3.1 绘制简单图形
8.3.2 细节设置
8.3.3 子图
8.3.4 添加标注
8.3.5 添加图例
8.4 常规图表绘制
8.4.1 折线图
8.4.2 柱状图
8.4.3 直方图
8.4.4 饼图
8.4.5 散点图
8.4.6 箱线图
8.4.7 三维曲线
8.4.8 三维曲面
8.4.9 雷达图
8.4.10 词云图
8.5 本章小结
8.6 习题
实验6 使用Matplotlib绘制可视化图表

第9章基于pandas的数据预处理和分析
9.1 数据预处理
9.1.1 数据预处理的任务
9.1.2 数据清洗
9.2 pandas的数据结构
9.2.1 Series
9.2.2 DataFrame
9.2.3 索引对象
9.3 pandas导入导出数据
9.3.1 Excel文件
9.3.2 CSV文件
9.3.3 TXT文件
9.3.4 JSON文件
9.3.5 MySQL数据库
9.4 pandas的基本功能
9.4.1 数据拆分与合并
9.4.2 重新索引
9.4.3 丢弃指定轴上的项
9.4.4 索引、选取和过滤
9.4.5 算术运算
9.4.6 DataFrame和Series之间的运算
9.4.7 函数应用和映射
9.4.8 排序和排名
9.4.9 分组
9.4.10 其他常用函数
9.5 汇总和描述统计
9.5.1 与描述统计相关的函数
9.5.2 唯一值、值计数以及成员资格
9.6 处理缺失数据
9.6.1 检查缺失值
9.6.2 清理/填充缺失值
9.6.3 排除缺少的值
9.7 清洗格式内容
9.7.1 删除字符串中的空格
9.7.2 大小写转换
9.8 透视表与交叉表
9.8.1 透视表
9.8.2 交叉表
9.9数据的正态性分析
9.8.1 正态分布的概念
9.8.2 正态性检验
9.10数据的相关性分析
9.10.1 皮尔逊相关系数
9.10.2 斯皮尔曼秩相关系数
9.11 综合实例
9.11.1 实例1:对食品数据集进行基本操作
9.11.2 实例2:对电影数据集进行清洗
9.11.3 实例3:百度搜索指数分析
9.11.4 实例4:B站数据分析
9.11.5 实例5:电影评分数据分析
9.11.6 实例6:App行为数据预处理
9.12 本章小结
9.13 习题
实验7 pandas数据预处理初级实践

第10章 基于sklearn的机器学习
10.1 机器学习基本概念
10.1.1 什么是机器学习
10.1.2 机器学习的四大类型
10.1.3 机器学习的基本过程
10.2 sklearn简介
10.2.1 sklearn的常用模块
10.2.2 sklearn在机器学习中的应用
10.2.3 sklearn的基础用法
10.3 回归分析
10.3.1 线性回归
10.3.2 岭回归
2.sklearn实现
10.3.3 套索回归
10.3.4 弹性网络回归
10.4 分类
10.4.1 逻辑回归
10.4.2 决策树
10.4.3 随机森林
10.4.4 朴素贝叶斯
10.5 支持向量机
10.5.1 模型原理
10.5.2 sklearn实现
10.6 KNN
10.6.1 模型原理
10.6.2 sklearn实现
10.7 聚类
10.7.1 K-Means
10.7.2层次聚类
10.7.3 DBSCAN
10.8 关联规则
10.8.1 算法原理
10.8.2 代码实现
10.9 交叉验证
10.9.1 方法概述
10.9.2 sklearn实现
10.10 网格搜索
10.10.1 方法概述
10.10.2 sklearn实现
10.11 数据降维
10.11.1 数据降维的步骤
10.11.2 常用的数据降维方法
10.11.3 数据降维的应用和挑战
10.11.4 PCA在sklearn中的实现
10.12 本章小结
10.13 习题
实验8 基于sklearn的机器学习初级实践
参考文献

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

林子雨,国内高校知名大数据教师,厦门大学计算机科学与技术系副教授,厦门大学数据库实验室负责人,中国计算机学会数据库专委会委员,中国计算机学会信息系统专委会委员,入选“2021年高校计算机专业优秀教师奖励计划”,荣获“2022年福建省高等教育教学成果奖特等奖(个人排名第一)”和“2018年福建省高等教育教学成果奖二等奖(个人排名第一)”,编著出版12本大数据系列教材,被国内500多所高校采用,建设了国内高校首个大数据课程公共服务平台,平台累计网络访问量超过2300万次,成为全国高校大数据教学知名品牌,主持的课程《大数据技术原理与应用》获评“2018年国家精品在线开放课程”和“2020年国家级线上一流本科课程”,主持的课程《Spark编程基础》获评“2021年国家级线上一流本科课程”。

相关技术

推荐用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部