机器学习实践指南

出版时间:2018-04-01  出版社:机械工业出版社  作者:[英] 阿图尔·特里帕蒂(Atul Tripathi) 著,  ISBN:9787111592129  页码:350
机器学习实践指南

内容简介

机器学习应用遍及人工智能的各个领域,是众多数学科学家需要学习的内容。本书第壹部分提供了一个相当复杂的机器学习系统,以帮助读者提高其效率。第二部分重点介绍了三个不同的基于现实世界的数据的案例研究,并提供相应解决方案。全书通过知识介绍,使读者了解收集数据、准备使用数据、训练模型、评估模型的性能,以及改进模型的性能的方法;通过对实际问题解决的讲解,帮助读者获得处理机器学习问题的经验。

目录

目  录?Contents

译者序

前言

第1章 机器学习引言 1

1.1 什么是机器学习 1

1.2 分类方法概述 2

1.3 聚类方法概述 2

1.4 监督学习概述 3

1.5 无监督学习概述 4

1.6 增强学习概述 4

1.7 结构化预测概述 5

1.8 神经网络概述 5

1.9 深度学习概述 6

第2章 分类 7

2.1 引言 7

2.2 判别函数分析:地下卤水地质化学测量 8

2.3 多元逻辑回归:理解学生的课程计划选择 15

2.4 Tobit回归:评估学生的学术能力 20

2.5 泊松回归:理解加拉帕戈斯群岛现存物种 27

第3章 聚类 38

3.1 引言 38

3.2 层次聚类:世界银行样本数据集 39

3.3 层次聚类:1999~2010年

亚马逊雨林的烧毁情况 44

3.4 层次聚类:基因聚类 55

3.5 二进制聚类:数学测验 68

3.6 k均值聚类:欧洲各国蛋白质消耗量 75

3.7 k均值聚类:食品 80

第4章 模型选择和正则化 86

4.1 引言 86

4.2 压缩方法:每天消耗的卡路里 87

4.3 降维方法:Delta航空公司航空队 100

4.4 主成分分析:理解世界菜肴 109

第5章 非线性 114

5.1 广义加性模型:衡量新西兰的家庭收入 114

5.2 平滑样条:理解汽车和速度 119

5.3 局部回归:理解干旱警告和影响 129

第6章 监督学习 136

6.1 引言 136

6.2 决策树学习:对胸痛患者的预先医疗护理指示 137

6.3 决策树学习:基于收入的房地产价值分布 145

6.4 决策树学习:预测股票走势方向 154

6.5 朴素贝叶斯:预测股票走势方向 170

6.6 随机森林:货币交易策略 184

6.7 支持向量机:货币交易策略 193

6.8 随机梯度下降:成人收入 201

第7章 无监督学习 208

7.1 引言 208

7.2 自组织映射:可视化热图 209

7.3 矢量量化:图像聚类 212

第8章 增强学习 217

8.1 引言 217

8.2 马尔可夫链:股票区制转移模型 218

8.3 马尔可夫链:多渠道归因模型 229

8.4 马尔可夫链:汽车租赁代理服务 239

8.5 连续马尔可夫链:加油站的车辆服务 243

8.6 蒙特卡罗模拟:校准Hull-White短期利率 247

第9章 结构化预测 257

9.1 引言 257

9.2 隐马尔可夫模型:欧元和美元 257

9.3 隐马尔可夫模型:区制检测 263

第10章 神经网络 270

10.1 引言 270

10.2 为S&P 500建模 270

10.3 衡量失业率 278

第11章 深度学习 292

11.1 引言 292

11.2 循环神经网络:预测周期信号 292

第12章 案例研究:探索世界银行数据 299

12.1 引言 299

12.2 探索世界银行数据 299

第13章 案例研究:再保险合同定价 316

13.1 引言 316

13.2 再保险合同定价 316

第14章 案例研究:用电量预测 329

14.1 引言 329

14.2 用电量测量 329

前言/序言

Preface?前  言当今世界,数据已经成为新的“价值金矿”并以指数级的速度增长着。这种增长既包括现存数据的增长,也包括新数据的增长,这些新的数据以结构化和非结构化的形式展现,并来源于社交媒体、互联网、文档文献以及物联网等多种多样的数据源。数据流必须实时地收集、处理、分析,并最终展现出来以确保数据的使用者能够在如今快速变化的环境中做出理性且明智的决定。机器学习技术将待解决问题的上下文信息应用于这些数据上,用统计学技术确保不断快速到达的复杂数据能够以科学的方式加以分析。并利用机器学习算法从数据中进行迭代学习,发现数据中的隐藏模式和规律。机器学习的这种迭代学习的模式是非常重要的,正因如此,当机器学习模型被暴露在新的数据中时,它们才能从新的数据集中独立地适应和学习以产出可靠的结论。

我们将首先介绍本书中包含的多种不同的机器学习主题,随后,基于现实世界的问题在不同的章节中对各个主题进行一一探讨,例如分类、聚类、模型选择和正则化、非线性问题、监督学习、无监督学习、增强学习、结构化预测、神经网络、深度学习,还有最后的案例研究。本书的机器学习算法以R语言作为编程语言。本书适用于R语言的初学者,但是熟悉R语言对理解和使用本书的代码肯定是会有所帮助的。

你将学习如何合理地决定使用哪类算法以及如何应用这些算法得到最佳的效果。如果你想要对图像、文字、语音或者其他形式的数据都建立有意义的多功能的应用,本书绝对会成为你的得力助手。

本书的主要内容第1章涵盖了机器学习的各种概念。本章使读者初步了解本书涵盖的各个主题。

第2章包括以下算法:判别函数分析、多元逻辑回归、Tobit回归、泊松回归。

第3章包括以下主题和算法:层次聚类、二进制聚类、k均值聚类。

第4章包括以下主题和算法:压缩方法、降维方法和主成分分析。

第5章包括以下主题和算法:广义加性模型、平滑样条、局部回归。

第6章包括以下主题和算法:决策树学习、朴素贝叶斯、随机森林、支持向量机、随机梯度下降。

第7章包括以下主题和算法:自组织映射和矢量量化。

第8章包括以下主题和算法:马尔可夫链、蒙特卡洛模拟。

第9章包括以下主题和算法:隐马尔可夫模型。

第10章包括以下主题和算法:神经网络。

第11章包括以下主题和算法:递归神经网络。

第12章包括世界银行数据分析。

第13章包括再保险合同定价。

第14章包括用电量预测。

本书的重点本书的重点是用R语言构建基于机器学习的应用。我们已经使用R语言构建过各种解决方案。我们的重点是利用R语言库和函数以最佳方式来克服现实世界的挑战。我们尽量保持所有代码的友好性和可读性。我们认为这将使读者能够很容易地理解代码,并在不同的场景中随时使用它。

本书的目标读者本书是为想构建实用的基于机器学习的应用的专业人士,以及统计、数据分析、机器学习、计算机科学或其他专业的学生和专业人士准备的。本书适用于R语言的初学者,但是熟悉R语言对理解和使用本书的代码肯定是会有所帮助的。对于那些希望在现有技术栈中探索机器学习技术的有经验的R语言程序员来说,本书也将是非常有用的。

特殊章节在本书中,你将频繁看到如下小节:准备工作和具体实施步骤。

为了更加清晰地说明怎样完成一个机器学习方法,我们使用了如下特殊章节。

准备工作该节告诉你机器学习方法需要哪些准备,并描述了如何设置该机器学习方法所要求的软件或其他先决条件。

具体实施步骤该节包含了机器学习方法的各个具体步骤。

下载示例代码本书的代码位于GitHub上,读者可从https://github.com/PacktPublishing/Practical-Machine-Learning-Cookbook下载。

下载本书的彩图本书还为你提供了一个PDF文件,其中包含了本书的彩图。这些彩图将帮助你更好地理解输出的变化。你能够从地址https://www.packtpub.com/sites/default/files/downloads/PracticalMachineLearningCookbook_ColorImages.pdf下载该文件。
下载地址: 为支持正版打击盗版,本站下架所有电子书。 如确为学习或科研需要,请联系客服QQ:2799170851索取所需内容! 点击这里给我发消息
商家推荐