关于本书的内容有任何问题,请联系 范博涛
第1章 数据分析概述 1 1.1 数据 1 1.1.1 数据的概念 1 1.1.2 数据的类型 2 1.2 数据分析 2 1.2.1 数据分析的概念 2 1.2.2 数据分析的过程 3 1.2.3 数据分析的作用 5 1.2.4 数据分析的常用工具 6 本章小结 6 思考练习 7 第2章 Python与数据分析 8 2.1 Python简介 8 2.1.1 Python的特点 8 2.1.2 Python解释器 9 2.2 Python与数据分析的关系 9 2.3 Python数据分析常用的库 10 2.4 Python开发环境的搭建 11 2.5 Python集成开发环境的搭建 13 2.5.1 PyCharm的安装与使用 13 2.5.2 Jupyter Notebook的安装与使用 17 项目实践 23 本章小结 24 思考练习 24 第3章 Python基础 25 3.1 Python的基础语法 25 3.1.1 Python的语法规则 25 3.1.2 常量、变量与标准数据类型 29 3.1.3 编写Python程序 30 3.2 Python的数据类型 31 3.2.1 数字 31 3.2.2 字符串 32 3.2.3 Python的数据结构 36 3.2.4 列表 36 3.2.5 元组 41 3.2.6 字典 44 3.2.7 集合 49 3.3 Python的流程控制语句 51 3.3.1 if语句 51 3.3.2 while语句 52 3.3.3 for语句 53 3.3.4 range()函数的作用 54 3.3.5 break、continue、pass语句 55 3.4 Python的函数 56 3.4.1 自定义函数 56 3.4.2 设置函数参数 56 3.4.3 函数返回值 58 3.4.4 调用自定义函数 58 3.4.5 局部变量和全局变量 58 3.4.6 函数嵌套 60 3.4.7 匿名函数 61 项目实践 61 本章小结 63 思考练习 63 第4章 NumPy数组与矢量运算 65 4.1 NumPy概述 65 4.1.1 NumPy简介 65 4.1.2 NumPy的测试与安装 66 4.1.3 SciPy简介及其测试与安装 67 4.1.4 NumPy的简单应用:一维数组 相加 68 4.2 NumPy数组 69 4.2.1 创建数组 69 4.2.2 选取数组元素 70 4.2.3 数组的属性 70 4.2.4 创建数组的其他方法 71 4.2.5 NumPy的数据类型 72 4.3 NumPy数组操作 73 4.3.1 数组的索引和切片 74 4.3.2 修改数组形状 76 4.3.3 数组的展平 77 4.3.4 数组的转置和轴对换 78 4.3.5 数组的连接 79 4.3.6 数组的分割 80 4.3.7 数组转换 81 4.3.8 添加/删除数组元素 81 4.4 NumPy数组的矢量运算 83 4.4.1 数组的运算 83 4.4.2 通用函数 85 4.5 NumPy矩阵的创建、运算及操作 87 4.6 随机数的生成 89 项目实践 91 本章小结 92 思考练习 92 第5章 用NumPy进行简单的统计 分析 94 5.1 文件读写操作 94 5.1.1 使用NumPy读写文本文件 94 5.1.2 使用NumPy读写二进制文件 96 5.1.3 使用NumPy读写多维数据 文件 97 5.2 NumPy常用的统计函数 97 5.3 使用NumPy函数进行统计分析 102 5.3.1 NumPy的排序函数 102 5.3.2 NumPy的去重函数与重复函数 103 5.3.3 NumPy的搜索函数和计数函数 105 5.4 简单的统计分析 106 项目实践 109 本章小结 110 思考练习 110 第6章 数据可视化工具—— Matplotlib 112 6.1 Matplotlib概述 112 6.1.1 Matplotlib简介 112 6.1.2 Matplotlib的测试、安装与 导入 113 6.2 使用pyplot创建图表 114 6.2.1 创建简单的图表 114 6.2.2 创建子图 118 6.3 Matplotlib参数配置 119 6.3.1 matplotlibrc配置文件 119 6.3.2 设置动态rc参数 120 6.4 分析变量间关系 121 6.4.1 绘制散点图 121 6.4.2 绘制折线图 123 6.5 分析变量数据分布和分散状况 125 6.5.1 绘制直方图 125 6.5.2 绘制柱形图 127 6.5.3 绘制饼图 129 6.5.4 绘制箱线图 131 项目实践 132 本章小结 134 思考练习 135 第7章 pandas数据分析基础 136 7.1 pandas概述 136 7.1.1 pandas简介 136 7.1.2 pandas的测试、安装与导入 137 7.2 pandas的数据结构及常用操作 138 7.2.1 Series对象及常用操作 138 7.2.2 DataFrame对象及常用操作 142 7.3 pandas的索引 149 7.3.1 Index对象 149 7.3.2 Index对象的属性和方法 150 7.3.3 重新索引 152 7.3.4 层级索引 153 7.4 pandas数据结构之间的运算 156 7.4.1 算术运算和数据对齐 156 7.4.2 算术运算函数 158 7.4.3 DataFrame与Series对象之间的 运算 158 7.5 pandas的函数应用 159 7.5.1 数据筛选函数 159 7.5.2 apply()函数 160 7.5.3 统计函数 161 7.5.4 DataFrame格式化函数 162 7.5.5 排序和排名 162 7.6 数据的读取与写入 164 7.6.1 读写文本文件 164 7.6.2 读写Excel文件 166 7.6.3 读写数据库文件 168 7.6.4 读写JSON文件 170 7.7 数据分析方法 171 7.7.1 描述性统计分析 172 7.7.2 分组分析 172 7.7.3 分布分析 173 7.7.4 交叉分析 174 7.7.5 结构分析 177 7.7.6 相关分析 178 项目实践 179 本章小结 180 思考练习 180 第8章 用pandas进行数据 预处理 181 8.1 数据清洗 181 8.1.1 重复值的处理 181 8.1.2 缺失值的处理 182 8.1.3 异常值的处理 185 8.2 数据合并 187 8.2.1 按键合并数据 187 8.2.2 沿轴连接数据 189 8.2.3 合并重叠数据 192 8.3 数据抽取 193 8.3.1 字段抽取与拆分 193 8.3.2 记录抽取 195 8.4 重塑层级索引 195 8.5 映射与数据处理 197 8.5.1 用映射替换元素 197 8.5.2 用映射添加元素 198 8.5.3 重命名轴索引 199 8.6 排列与随机抽样 200 8.7 日期转换、日期格式化和日期 抽取 201 8.8 字符串处理 202 8.8.1 内置的字符串处理方法 203 8.8.2 正则表达式 205 8.8.3 矢量化的字符串函数 209 项目实践 211 本章小结 212 思考练习 213 第9章 机器学习库scikit-learn 入门 214 9.1 机器学习概述 214 9.2 scikit-learn概述 216 9.2.1 scikit-learn简介 216 9.2.2 scikit-learn的测试、安装和 导入 217 9.3 第一个机器学习程序 218 9.4 使用scikit-learn进行机器 学习 219 9.4.1 Seaborn绘图 219 9.4.2 准备数据集 224 9.4.3 选择模型 229 9.4.4 调整参数并训练和测试模型 232 项目实践 235 本章小结 237 思考练习 237 第10章 电影数据分析项目 239 10.1 项目描述 239 10.2 准备数据 240 10.3 数据清洗 241 10.4 数据分析与数据可视化 241 本章小结 247 思考练习 247 参考文献 248
本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何...
本书以任务为导向,较为全面地介绍容器技术的相关知识。全书共8 个项目,包括Docker 概述、Docker镜像...
本书全面介绍了金融大数据的应用,并使用Python语言对其进行了编程实践。书中首先带领读者了解数字金融新技术,...
本书全面介绍Python编程基础及其相关知识的应用,讲解如何利用Python解决部分实际问题。全书共10个单元...
人工智能作为科技创新的前沿驱动力,不仅深刻地改变了生产方式,提升了生产效率与质量,还重塑了人们的生活方式,同时...
我要评论