从零回归到线性回归

2020-06-19 19:06:06

如果你有兴趣继续读下去,如果你不感兴趣,那就自己走吧。🚪。

本文是介绍基本机器学习算法的系列文章的第一篇。每个帖子将被分成两部分。

理念和关键概念-大多数人应该能够阅读本节内容并了解算法是如何工作的🤞。

细节-这是为感兴趣的读者准备的,将包括详细的数学推导,然后用Python🐍实现。

回归是任何接受输入集合并预测输出的算法。如果你还是不跟我走,我会原谅你的。

让我们举个例子,这应该更有意义。比方说,我们正在试图预测🏡在伦敦北部理想地区的一套房子会卖到多少钱。我们可能知道一些关于房子的事实,例如房子🏠的平方英尺,花园🌳的平方英尺,以及是否有车库🚙。

在机器学习中,我们将这些事实称为变量或特征。直观地说,我们可以使用这些特征的组合来评估房子的价值。🏠🌳🚙。

线性回归使用特征的线性组合来预测输出。这仅仅意味着将每个特征值乘以一个数字(称为系数)来表示该特征的重要性,例如。

$$\BEGIN{ALIGNED}\TEXT{房价}&ANP;=(GB1000*\TEXT{🏠})\\&ANP;+(GB 50*\TEXT{🌳})\\&ANP;+(GB1000*\TEXT{🚙?})\END{ALIGNED}$$。

在这个例子中,房价的计算方法是房子每平方英尺1000 GB$,加上花园里每英尺50 GB$,如果有车库的话再加1000美元。如果我们选择一处600美元一平方英尺的漂亮房产,带一个500美元一平方英尺的小花园,没有车库,我们的线性回归模型会预测这所房子的价值是625,000美元。

$$\开始{对齐}\文本{房价}&;=(GB 1000*\文本{🏠})+(GB 50*\文本{🌳})+(GB 1000*\文本{🚙?})\\&;=(GB1000*600)+(GB 50*500)+(GB1000*0)\\&;=GB 625,000\结束{对齐}$$。

这就是线性回归模型的工作原理!现在的问题是如何选择要素的系数,在我们的示例中为$1,000$50$和$1,000$?🤷‍♂️。

一种称为监督学习算法的常见类型的机器学习算法使用训练数据找到这些参数。训练数据只是你已经知道答案的例子。在我们的例子中,它是一个房屋列表,其中我们预先知道房屋的特征🏠🌳🚙和房价💰。以下是带有模型预测的三个训练示例的示例: