这些胡须后面是怎么回事?你的狗摇着尾巴是不是意味着它们很快乐?我们如何理解或解读宠物的情绪呢?
使用人工智能来理解我们的宠物的想法是在拜伦湾科学帐篷的年度音乐节Splendour in the Grass 2019年期间提出的,会上讨论了所有的东西计算,特别是将人工智能用于“好”。
电影节在一场挑战中结束。到“辉煌2020”举办的时候,我们能创建一个宠物情感评估师吗?虽然辉煌因新冠肺炎而推迟,但我们因这一挑战而开发的快乐宠物应用程序现在已经准备就绪。
人类的面部识别已经成为一项主流的,有时也是有争议的技术-我们用它来解锁我们的手机,机场越来越多地使用它作为安全的一部分。
人脸可以告诉我们很多关于人的感受或想法的信息--那么,同样的面部识别技术是否可以用来解读动物的情绪呢?
在我们谈论这项技术之前,让我们先看看我们对面部表情的了解。心理学家和人类学家告诉我们,它们是人类交流最重要的方面之一。
研究人员发现,一些情绪(如快乐、恐惧或惊讶)似乎具有生物学上的“硬连线”人类表情,这些表情贯穿于不同种族和社会,这也是我们这款应用成功的关键。
所以我们的表达方式不是文化学习的结果,而是与达尔文进化论有关。
首先是对我们正在谈论的动物的具体类型进行分类-在这种情况下,宠物。其次,我们需要确定代表潜在情绪的关键特征和模式。人工智能可以帮助我们实现这一点。
目前最先进的图像识别技术一般是卷积神经网络。这些都是深度学习算法,可以接收图像并赋予它们重要性。
神经网络基于我们大脑的工作方式,使用一种称为监督学习的机制。通过有监督的学习,我们了解到什么输出(或标签)应该与什么输入(图像)相匹配。
就像你教孩子区分苹果和梨一样,对于算法,我们调整了将输入转换为输出的函数的权重和参数。
我们一直这样做,直到我们在训练数据上得到最佳结果-也就是说,如果给出一张苹果的照片,算法会给出一个高分,它认为它正在看一个苹果。
它们的工作原理类似于普通的神经网络,但除此之外,它们还具有从图像中提取和识别特征的能力,尽管这是一种被称为卷积的技术。
面部特征--比如拱起的眉毛或傻笑的嘴巴--的问题与其说是它们看起来像什么,不如说是它们可以出现在图像上的“任何地方”。这是因为照片可以无限角度拍摄,使用不同的照明和变焦。
使用过滤机制对此进行校正,并将图像转换为特征地图。
然后可以重复这一过程来创建特征地图的特征地图,直到涉及数百万像素的海量数据被缩减为简洁的特征。然后,AI可以学习这些图像(或特征)的标签。
在我们的移动应用程序中,我们使用从在线资源中提取的图像来进行人工智能,以了解宠物是什么品种-它是贵宾犬还是拉布拉多犬?
但我们也希望它能解释动物当时表达的情绪。
让我们的应用程序正常工作的关键是精心策划和标记涵盖许多很多示例的训练数据,并对大量参数进行调整,以优化神经网络的性能。
结果是Happy Pets,你现在可以在苹果iOS或谷歌Android上免费下载,然后给你的宠物试穿。
我们的应用程序会对任何看不见的图像进行分类-显示最常见的五种动物情绪(高兴、愤怒、中性、悲伤和恐惧)和最可能的品种的百分比。
人工智能根据与每种情感相关的特定面部特征来检测情感,这是它从数千个例子中学到的。例如,如果一只狗收紧眼睛和嘴巴,同时以一种特有的方式改变耳朵的位置,那就是害怕的迹象。
结果有多准确?嗯,我们认为他们相当可靠,已经广泛测试了这款应用,但你应该自己判断。
目前,我们只有有限的品种可供选择,所以如果你的品种不在那里,它可能会被近似到最近的品种。
有趣的是,我们发现猫比狗更难读懂。在未来,我们将讨论除了分析宠物的脸部之外,还将分析宠物的身体,以提高准确性。
总体而言,宠物的情绪可能很难辨别,但我们相当擅长识别人类的情绪。因此,我们是否能将人类的情感与宠物的情感联系起来--它们是否有共同的特征--可能是未来一个令人兴奋的研究领域。
快乐宠物应用程序是墨尔本大学计算与信息系统学院由墨尔本电子研究小组开发的。团队希望得到有关该应用程序潜在扩展的反馈。