一、说点人话:学了“线性回归”有什么卵用?

一个女同学问我:“老师,我想知道有哪些问题是线性回归可以解决的?这样我可能才有动力学下去,不然,我一点都不想学。

是的,明确的知道,线性回归能够解决什么问题,才是我们学习的最好动力。都不知道线性回归能解决什么问题,那干嘛学呢?

在大学里,我们很多学习,都是学了不知道怎么用。例如,学了电子电路,我们大多数人还是不会用单片机做一个遥控小车出来。这样的学习是很没有意义和成就感的。

下面是2个线性回归解决实际问题的例子:

1、房价与房屋面积等有无线性关系

那现在我想知道“线性回归”有卵用?这里举一些例子,作为本章的开始,希望能够将你引入思考的殿堂。

例子1: 房价与房屋面积、地点、朝向、楼层、小区有无线性关系?可否通过房屋面积、地点、朝向、楼层、小区等,推断出某套房子的合理价钱来。

2、电费与毒贩之间有无关系

例子2: 电费与毒贩之间有无关系?美国警方发现,电费用得很多的家庭,很有可能种植了罂粟。他们是怎么发现的呢?

在美国家庭一般都有一套我们中国人羡慕的别墅,在国内,北京至少2千万吧!好受伤:

有的人会在别墅里面每个房间种植罂粟,使用灯光来进行光合作用。为了加速光合作用,他们一天一般会开灯20个小时左右,这就导致,这家人的电费很高。

美国警方通过电费、房屋用途、房间数确定了一个线性模型,用来预测这栋别墅是否有种植毒品的可能,这样极大的提高了美国警方的执法效率。

要知道美国警方是不能随随便便进入居民的房屋的,通过这个线性模型,警方很准确的预测了,哪些房屋有可能种植毒品,从而更大的得到了法院的支持,更快的获得了搜查令。

这确实是一个线性回归激动人心的例子,我不知道你是否感到震撼,当我第一次从朋友那里听说这个事情的时候,我激动得一晚没睡觉。原来我们现在研究的东西有这么多的用途,而这仅仅是一个最简单不过的模型了

二、我对兴趣是最好的老师的理解

好了,说了这些例子,我们来带着兴趣好好学习吧。顺便说一下,我对兴趣是最好的老师的理解:

如果,我们现在15-20岁,ok,兴趣是最好的老师,这句话一点没错。

如果,我们现在20-25岁,那么兴趣是最好的老师这句话就不一定正确了。提高个人的魅力,吸引女孩子喜欢,当然是那些既爱财又爱才的女孩喜欢,我觉得这才是最好的老师,或者说动力。

如果,现在已经25岁+了,那么挣更多的钱,实现自己的人生目标,这才是最重要的动力。想买房子,想天天出去旅游,不努力,不多学习,怎么行。谁告诉我,除了努力提高自己,还有什么方法????

希望,上面对您做了这么多思想工作,能够激起小伙伴们的热情,好好跟我们学习本套课程,坚持下去,那么我们的努力也算没有白费。 以此共勉!!!

当你要放弃的时候,请记住一句话:“我们用了几天时间编写的本章课程,你仅仅只需要45分钟,就学完,你是不是效率比老师高很多呢?老师都比你努力,你还有什么理由不学习呢?

三、线性回归就是确立线性方程中X和Y之间的关系

1、 什么是线性回归

机器学习中应用最多方法的,就是线性回归。 线性回归是什么呢?目前介绍线性回归的资料还是很多,但是能通俗说清楚线性回归的资料却很少。大多数资料将简单的问题复杂化,阻止了很多同学,进入机器学习的大门,

线性回归,就是确定变量X因变量Y之间的线性关系。什么是变量,什么是因变量,如下面的等式。

Y = kX +b

其中X是变量,Y是因变量。这其实就是一个很简单很简单的一元一次方程啊。

2、线性关系

那什么是线性关系,在二维、三维空间中,X和Y绘制出来的图是直线,我们就叫做他们之间是线性关系。

如下图:

理解了什么是线性关系,那么回过来理解什么是线性回归就比较容易了。

3、线性回归之最俗解释

看了上面的概念,也许你还不理解,我们这里详细给大家举一个例子。

例子:年龄与胸部大小的关系?下面是收集的女性年龄与胸部大小关系的统计数据。

年龄(岁) 胸围大小(cm)
0-0.3 40
0.3-0.6 44
0.6-1 48
1-2 50
2-3 52
3-4 54
…… ……
14-15 76
16-20 82
20-26 84
27-29 100
29-50 80
50-.. 70

从数据中可以看到,女孩从0谁到20岁左右,胸部逐渐变大,到了27八岁,到了峰值,一两年后,又逐渐变小,恢复正常,此后,随着年龄的增长,慢慢变小。 如果将这些数据,在数轴中绘制出来,将会有多条折线,它并不是一条纯粹的直线。那这是不是线性回归呢?显然这不是线性回归。 但是如果我们将数据以年龄段进行分开,可以将数据变为3个线性回归模型,如下图。

这就不是简单的线性回归。简单的线性回归是可以用y = kx + b这样一个直线公式来描述的。而上面的图,更像一个分段函数。但是分段函数的每一段都是一个不错的线性回归方程。

好了,经过上面的例子,大家明白了什么是线性回归了吗?我想可能并没有明白。 很多同学主要是没有理解回归的意思。

回归:就是已经很多样本数据,求方程中k和b的值的过程。这有点像从现象回归到本质的一个过程。

最后,要告诉大家的是,我们这里举女孩年龄与胸部大小的关系,不仅仅是要告诉大家什么是线性回归,更重要的告诉大家一个非常重要的经验,这个经验是: 不要一看到大胸女孩,就荷尔蒙分泌过多,想去追,还要看看她是不是处于哺乳期。 为什么女孩为在27,28岁的时候胸部突然变大很多呢?可能还有很多朋友不太了解,觉得女人真是神奇的物种。

男人的某些东西可以变大,但是也最多坚持1个小时,而女人可以坚持1,2年,真是值得崇拜的异类。 关于女人的这种神奇的异能,是怎么解释呢?好像机器学习也无法解释,经验告诉我们,这个女孩有宝宝了,可能处于哺乳期,所以重要的话说2遍: 不要一看到大胸女孩,就荷尔蒙分泌过多,想去追,还要看看她是不是处于哺乳期

没有一部《人工智能》的课程会告诉大家这些重要的知识,而我们会,我想,这就是你支持我们的原因吧。haha。

四、求线性回归中参数a、b的值

前面已经说自变量x与因变量y大体呈直线关系,这就是线性回归。如下面的公式:

y=ax+b

这里我们只要计算出参数a和b就行了,这样对于在定义域中的任意x,我们都能求出一个y来。y就是我们最终要求的值, 求a和b似乎很简单,我们只需要有2组x和y的取值,然后求一个二元一次方程就可以了。 可惜,答案远非这么简单,因为,我们的样本很多,我们一般会给出很多组(x,y)的值。

求一个y=ax+b要满足所有的样本,几乎是不可能的,所以,我们只有得到一条近似的直线,让每个样本尽可能离直线的距离最短,也就是下图中红色线段长度和要最小才行。如下图所示:

上图:小黑点表示样本点,绿色的表示线性回归的直线。红色线段的长度表示样本点和回归直线之间的距离,直白点说,就是样本数据和预测的数据之间的差值,这些差值的和要最小才行。

五、作业时间

作业1: 举一些生活中,可以用线性回归解决的问题。观点要鲜明哦,大家可以在评论区提交作业。