Python医学数据分析(微课版)

数据分析
分享 推荐 0 收藏 5 阅读 345
唐燕 (作者) 978-7-115-67566-8

关于本书的内容有任何问题,请联系 孙澍

1.零基础入门,从Python基础知识讲起,逐步介绍数据分析过程中的数据处理步骤及常用Python库,再深入到机器学习基础及医学领域常用模型。
2.注重实践,理论知识配小案例,每章设置医学实训案例,并设计上机练习作业,强化学生运用Python知识进行医学数据处理与分析的技能。
4.配套资源丰富,提供教学PPT课件、教学大纲、源代码、习题与答案等。

内容摘要

本书全面介绍使用Python进行医学数据分析过程中需要的大数据技术相关的理论知识、Python第三方库及机器学习算法模型。全书共9章,第1章介绍医学数据分析及Python安装;第2章介绍Python基础;第3~6章介绍数据分析过程中的文件操作及常用Python库的运用(使用NumPy进行矩阵运算、使用pandas进行数据预处理及统计分析、使用Matplotlib进行数据可视化分析);第7、8章介绍机器学习基础及医学应用、模型评估及优化;第9章结合前面章节的内容和数据分析流程,介绍进行数据分析实际应用的综合案例。除第7章外,每章都设计了实训案例以提高读者的实战能力,使读者快速上手医学数据分析。
本书适合作为大数据医学类及相关专业大数据分析课程的教材,也可供科研人员及对数据分析感兴趣的读者参考。

目录

目 录
第1章 医学数据分析及Python安装 1
1.1 医学数据分析概述 1
1.1.1 医学数据的特点 1
1.1.2 常用数据分析工具 2
1.1.3 医学数据分析的基本流程 4
1.2 搭建Python开发环境 5
1.2.1 Python开发环境安装 5
1.2.2 Anaconda集成开发环境 6
1.2.3 Python程序的运行 8
1.3 Python库 9
1.3.1 Python标准库 9
1.3.2 Python第三方库 10
本章小结 11
本章习题 11
第2章 Python基础 13
2.1 Python编码规范 13
2.1.1 代码布局与缩进 13
2.1.2 注释 14
2.1.3 命名规则 14
2.2 Python内置数据类型 14
2.2.1 整数类型、浮点数类型、复数类型 14
2.2.2 列表、元组、字典、集合 16
2.2.3 字符串 21
2.3 Python运算符和表达式 24
2.3.1 算术运算符 24
2.3.2 关系运算符 25
2.3.3 逻辑运算符 26
2.3.4 特殊运算符 26
2.4 Python流程控制结构 27
2.4.1 顺序结构 28
2.4.2 选择结构 28
2.4.3 循环结构 29
2.5 Python函数 30
2.5.1 函数的定义 31
2.5.2 函数的调用 31
2.5.3 函数的参数 31
2.5.4 函数的递归与嵌套 33
2.5.5 Lambda匿名函数 34
2.5.6 常用内置函数 35
实训1 Python基础编程实践 38
本章小结 40
本章习题 40
本章上机练习 42
第3章 文件操作 43
3.1 文件操作基础 43
3.1.1 文件操作常用方法 43
3.1.2 with语句 48
3.2 CSV文件读写 49
3.2.1 CSV文件读取 49
3.2.2 CSV文件写入 49
3.3 JSON文件读写 50
3.4 Word、Excel文件读写 51
3.4.1 Word文件读写 51
3.4.2 Excel文件读写 53
实训2 文件操作案例 56
本章小结 59
本章习题 60
本章上机练习 61
第4章 使用NumPy进行矩阵运算 63
4.1 NumPy概述 63
4.1.1 为什么要学习NumPy 63
4.1.2 NumPy的核心优势 64
4.2 NumPy数组对象 64
4.2.1 创建数组 65
4.2.2 生成随机数 65
4.2.3 数组基本操作 67
4.2.4 变换数组形状 68
4.2.5 常用计算和统计函数 69
4.3 NumPy矩阵及常用操作 71
4.3.1 创建矩阵 71
4.3.2 矩阵基本操作 71
4.3.3 计算矩阵的相关系数、方差、协方差、标准差 72
实训3 NumPy数据操作案例 73
本章小结 76
本章习题 76
本章上机练习 77
第5章 使用pandas进行数据预
处理及统计分析 79
5.1 pandas基本数据类型及数据结构 79
5.1.1 pandas基本数据类型 79
5.1.2 Series 80
5.1.3 DataFrame 82
5.2 DataFrame的基本操作 82
5.2.1 查看DataFrame属性 82
5.2.2 在DataFrame中查看、修改、增加、删除数据 84
5.3 使用pandas进行数据读写、预处理及统计分析 87
5.3.1 读写不同数据源的数据 87
5.3.2 数据异常值的处理 89
5.3.3 数据缺失值的处理 91
5.3.4 数据重复值的处理 96
5.3.5 数据分组和聚合 100
5.3.6 数据交叉分析 103
实训4 pandas数据分析案例 104
本章小结 106
本章习题 106
本章上机练习 107
第6章 使用Matplotlib进行数据可视化分析 109
6.1 Matplotlib基本概念及功能 109
6.2 绘制折线图 111
6.3 绘制散点图 114
6.4 绘制柱状图和直方图 115
6.5 绘制饼状图 118
6.6 绘制雷达图 119
6.7 绘制气泡图 120
6.8 绘制热力图 121
6.9 绘制三维曲线(面)图 123
6.10 绘制词云图 125
6.11 绘制图矩阵 126
实训5 数据可视化分析案例 128
本章小结 131
本章习题 131
本章上机练习 133
第7章 机器学习基础及医学应用 134
7.1 机器学习基本概念 134
7.2 scikit-learn库简介及常用API 135
7.2.1 scikit-learn库常用API 135
7.2.2 加载数据集案例实践 137
7.3 线性回归 138
7.3.1 线性回归的基本原理 138
7.3.2 线性回归案例实践 139
7.4 KNN算法 142
7.4.1 KNN算法原理 142
7.4.2 KNN算法案例实践 143
7.5 逻辑回归 144
7.5.1 逻辑回归简介 144
7.5.2 逻辑回归基本原理 145
7.5.3 逻辑回归案例实践 146
7.6 朴素贝叶斯 148
7.6.1 朴素贝叶斯分类器简介 148
7.6.2 朴素贝叶斯算法原理 148
7.6.3 朴素贝叶斯案例实践 149
7.7 决策树与随机森林 151
7.7.1 决策树介绍 151
7.7.2 随机森林介绍 152
7.7.3 决策树与随机森林案例实践 152
7.8 支持向量机算法 157
7.8.1 支持向量机算法原理 157
7.8.2 支持向量机案例实践 159
7.9 关联规则算法 161
7.9.1 关联规则算法原理 161
7.9.2 Apriori算法 163
7.9.3 关联规则算法案例实践 163
7.10 K-means算法 165
7.10.1 K-means算法原理 165
7.10.2 K-means算法案例实践 167
本章小结 170
本章习题 170
本章上机练习 172
第8章 模型评估及优化 173
8.1 模型评估 173
8.1.1 模型评估的概念 173
8.1.2 模型评估指标 173
8.1.3 留出法模型评估 175
8.1.4 交叉验证法模型评估 176
8.2 模型优化及网格搜索 178
8.2.1 模型优化的概念 178
8.2.2 网格搜索法 179
实训6 逻辑回归分析案例 181
实训7 决策树预测分析案例 184
本章小结 186
本章习题 187
本章上机练习 187
第9章 综合案例 188
9.1 案例准备 188
9.1.1 案例任务 188
9.1.2 工具库 188
9.1.3 数据集 188
9.1.4 案例目的 189
9.2 案例步骤 189
9.2.1 导入相关库 190
9.2.2 本地数据集加载 191
9.2.3 描述性统计分析 191
9.2.4 数据处理 193
9.2.5 模型训练 194
9.2.6 模型评估 195
本章小结 197
本章上机练习 197
参考文献 198

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

唐燕,副教授,北京中医药大学健康医疗大数据与信息管理教研室教师。世界中医药学会联合会临床科研统计学专业委员会理事,中国民族医药学会大数据与人工智能分会理事。研究方向为:医学数据分析,人工智能,大数据技术及分析。主持或参加国家级、省部级、市级或校级多项课题,发表论文60余篇。作为主编、副主编或编委编写教材6部。在教学方面,获得北京中医药大学教学成果奖一等奖、教学讲课比赛二等奖、优秀主讲教师等荣誉,2次获得中华医学会优秀教育技术成果奖二等奖。指导学生参加创新创业等各级别比赛并多次获奖,2019年指导学生参加中国高校计算机大赛-人工智能创意赛总决赛二等奖。

相关图书

  • 自然语言处理(微课版)

    魏巍

    本书与深度学习、大语言模型技术紧密结合,确保内容的先进性和实用性。通过系统化的介绍,按照自然语言处理核心任务的...

    ¥52.00
  • Excel数据分析基础与实战(第2版)(微课版)

    徐晓昭 叶小艳 张良均 高凌燕 李恩 林衡

    本书以任务为导向,全面介绍了如何使用Excel进行数据分析,并详细阐述了使用Excel解决企业实际问题的方法。...

    ¥59.80
  • 虚拟化技术与应用(微课版)

    孔令晶 周莹 程东升 黄国伟 王辉静

    本书基于VMware vSphere虚拟化平台,以项目-任务的形式讲解虚拟化技术相关知识,注重培养读者的动手操...

    ¥59.80
  • 计算机科学概论(微课版)

    冯丹

    本书以计算机系统能力培养为核心,结合计算机系统详细介绍了计算机科学的概念、原理和方法,同时融入大量关于大数据、...

    ¥59.80
  • Python数据分析任务驱动教程

    黑马程序员 王宇翔 杨顺 张士兵 王佳丽

    本书以Anaconda为主要开发工具,采用任务驱动的编写方式,系统、全面地介绍Python在数据分析中的应用。...

    ¥69.80
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部