在街上骑车时,我通常可以根据它们的“肢体语言”来判断我前面的车要做什么:它们是如何在自己的车道上定位的。我不知道我能不能很清楚地说出规则是什么,但我可以说出正在发生的事情,我知道我能说出来,因为我在脑海里做出了预测,然后这些预测被汽车的实际表现所证实。(是的,可能存在选择偏差,所以如果我真的想确认,我应该记录我的猜测并检查错误率。随便了。)。
不管怎样,前几天我在想,这怎么会是机器学习的一个例子。没有因果推断(抱歉,朱迪亚!),只是纯粹的预测,而是“机器学习”,因为在过去的几十年里,我的大脑被动地收集关于汽车定位的数据,并在某个时候决定将其与驾驶决策联系起来。我猜这是因为我试图弄清楚在特定情况下该去哪里。因此,在许多方面,这正是我们在讨论人工智能时听到的那种问题,通常的步骤如下:
3.有定义类别的监督学习一旦我意识到之前我一直在被动地进行分类,
4.改进:一旦我知道了这个推理过程的参数,我就可以使用更积极的过程来标记错误分类和模棱两可的预测,并使用这些来改进我的预测(“诊断”和“评估”)。
我在其他问题上读到过这些步骤,从图像识别到犯罪检测。但不知何故,在这个日常例子的背景下,这一切对我来说都变得更加真实。特别是,我知道不同的步骤,从被动的数据收集到通过有意识地使用和改进程序来无意识地识别模式。
这也让我震惊,意识(对人类和动物来说)和,嗯,我不知道该怎么称呼它之间有一个类比。。。也许是机器学习中的“主动编程”。
换句话说。统计方法在构建时是完全有意识的:设计、测量、数据收集、推理:这些都是用户必须选择解决的问题。某些统计程序已经足够自动化,可以在不知不觉中应用:例如,计算机可以计算所有变量对之间的相关性,查看分布和扫描异常值,等等,就像人类或动物的视觉系统可以发现异常,而不是有意识地选择寻找它们一样。
机器学习略有不同。有很多有意识的机器学习过程-用于预测、分类、推理、决策等的各种非参数算法:基本上,这些是统计方法,但我们可能称它们为“机器学习”,因为它们是新的,或者因为它们是非参数的,或者因为它们是由计算机科学家而不是统计学家开发的,或者因为它们与大数据一起工作,等等。但是机器学习和人工智能也与自动的或后台的或无意识的过程相关联,例如在头脑中没有特定目标的大数据的处理(当然,你可能会争辩说,像综合社会调查这样的项目也有这种感觉),或者在背景中寻找模式,就像我的大脑在汽车定位问题上所做的那样。
附注:以上是我的猜测和散漫的想法。很可能会有一部关于这一切的文献。如果是这样的话,请在评论中随时通知我。