感谢您点击我们的点击式标题。可悲的是,说实话,洗碗还是一件事。然而,到目前为止,我们的大多数读者仍然喜欢我们的非标准深度学习教程。
通常,人工智能被演示为解决各种玩具问题。AI下象棋围棋,AI玩电子游戏,AI让人跳舞。是时候停止这种疯狂了,并最终以一种有意义的方式应用人工智能。因此,我们很自豪地推出了DISH-O-TRON。DISH-O-TRON是一个人工智能系统,旨在解决每天影响全球数百万人的实际现实问题:面对社区厨房水槽中的脏盘子。
阅读这一系列博客将使你拥有终极力量,通过使用最先进的AI技术,一劳永逸地解决你社区厨房的这个长期问题。
乍一看,DISH-O-TRON是一个在厨房里观察共享厨房水槽的不起眼的、放置得很好的网络摄像头。在它的自然状态下,DISH-O-TRON只是快乐和享受生活。DISH-O-TRON不在乎你喜欢喝茶还是咖啡,它喜欢各种厨房谈话。然而,有一件事是碟子-o-tron绝对讨厌的:看着某人把脏盘子放到社区的水槽里。
检测到水槽里的脏盘子激怒了热爱和平的碟子-o-tron,以至于它开始发出嘟嘟声。要让它恢复到自然的宁静状态,从而停止噪音,唯一的方法就是承认自己的错误,把社区水槽里所有的脏盘子都移走,让它再次保持整洁。
试图用人工智能解决现实世界的问题通常是从意识到几乎没有可用的数据开始的。这个问题阻碍了许多问题解决者实际解决问题。“如果数据收集早在几年前就开始了!”他们说,“那么我们现在就可以真正解决问题了。”虽然这是一个合理的想法,但它根本无济于事。
安慰目前面临问题的用户说,在我们开始构建解决方案之前,需要收集大量数据很长一段时间,这至少是具有挑战性的。通常,更有希望的方法是构建一个解决问题的系统,该系统能够随着时间的推移而改进。
如此一来,我们不会在第一步便完全解决问题,但我们会立即解决问题,并使自己能够不断调整解决方案,以配合在处理问题时也越来越清晰的要求。
由于我们的问题在某种意义上是独一无二的,即没有现成的Kaggle数据集,因此我们通过尽最大努力为第一个工作系统收集合适的数据集来开始构建DISH-O-TRON的旅程。在这里,我们将制作各种厨房水槽清洁和不清洁的视频,并将它们分成第一个标记的数据集。
通过这种方式,我们开始收集包含数千张图片的脏盘子数据集,我们将在下一篇文章中与您分享这些图片。
不久前,训练人工智能模型是一件单调乏味的事情,需要专业知识。在许多情况下,这在今天仍然是正确的。根据问题的不同,我们必须找出合适的模型体系结构和特征工程,这需要一些实验才能训练出合适的AI模型。这是另一个问题,即使数据可用,问题解决者也无法构建解决整个问题的解决方案。
幸运的是,图像分类是人工智能中最容易理解的用例之一。有许多关于模型体系结构和模型培训的已建立的最佳实践。其中,这导致了两件事:
像Fast.ai这样的高级软件库,抽象了图像分类的大量细节,提供了一种黑匣子式的方法,在这种方法中,只需使用最先进的实践,而不会给用户带来细节负担。
机器学习即服务是各种公共云提供商(如Automl和Rekognition)提供的服务,只需几个简单的步骤即可对自定义数据的图像分类模型进行培训。
这两种方法通常都不会产生绝对最佳的解决方案。然而,在大多数情况下,这并不是必要的,“足够好”就足够了,在花费的时间和金钱与结果之间进行了很好的权衡。对于我们的第一个版本的DISH-o-tron,我们将使用来自Google Cloud的AutoML服务来训练第一个模型。
我们可以使用各种工具来检查模型,并尝试解释黑匣子是否了解了我们的预期。
用AutoML训练AI模型及其技术细节将在后续的博客文章中讨论。
拥有人工智能模型通常不会解决实际生活中的问题。对于可行的解决方案,AI模型必须集成到合适的上下文中。很多时候,这是产生任何价值的关键一步。尽管如此,这一步往往被推迟到“收集高质量数据”和“构建最好的AI模型”之后的遥远未来。这通常是一个错误,因为将模型集成到其上下文中本身就会带来各种挑战。因此,不应忽视这一问题,而应及早解决,以便了解和确定相关的挑战。
在构建DISH-O-TRON时,我们尝试了多个选项来运行模型。我们把它部署在PI Zero上,这是一个非常小而且便宜的设备,可以用一个小电源组粘在任何地方。但是它是相当慢的。我们使用笔记本的网络摄像头和TensorFlow.js在浏览器中运行模型。我们使用的是Google AIY Kit,它比Pi Zero快得多,还带有蜂鸣器和闪光灯(但它相当旧,部署最先进的型号也很麻烦)。最后,我们使用了Google Coral设备,它是为这种工作负载量身定做的,可以很好地集成到Google AutoML中,但是有一个价格标签。
社区厨房是一个特殊的地方。这是一个谣言产生的地方,是八卦产生的地方,也是你可以公开谈论公司最秘密的地方!这就是DISH-O-TRON生活在悬崖边上的原因。边缘设备使您能够运行音频和视频分析,并尊重社区厨房的隐私。不会将任何图像传输到云中。什么都救不了。DISH-O-TRON看得见,却忘得一干二净。
此外,我们为实际构建DISH-O-TRON而考虑和购买的硬件将为我们的解决方案空间建立基本条件。换句话说,我们必须记住,在我们首选的边缘设备上轻松部署AI模型是可能的。对于DISH-O-TRON的第一个版本,我们决定使用Google AIY工具包(参见下面的视频)。对于下一个版本,我们选择了Google Coral Edge设备,它允许我们在一台覆盆子大小的迷你计算机上运行高级计算机视觉任务。幸运的是,AutoML允许我们以可行的格式导出模型。
DISH-O-TRON的建造,包括在珊瑚装置上部署模型,以及它的技术细节将在即将发布的博客文章中讨论。
人工智能研究给我们带来了可以解决以前无法解决的问题的新技术。你看过李开复的“人工智能超级大国”吗?他说,你不再需要成为最好的人工智能研究人员之一,就可以应用人工智能,找到新的商机。您需要收集(大量)数据,并且可以“只”使用现有的算法、服务和开源框架。嗯,在我们看来,构建人工智能解决方案并不容易-但它确实每天都变得越来越容易。
在这里查看在Google AIY工具包上运行的第一个原型(注意框中的绿色/红色LED):
如果您想知道如何在边缘设备上构建和运行这样的模型,请阅读本系列博客。建造DISH-O-TRON将从根本上改变你体验社区厨房的方式。社区厨房将不再是一个经常充满愤怒和敌意的地方,而将成为一个和平的聚会场所,让人们分享想法,与同事建立联系。
在接下来的博客文章中,我们将指导您完成为您的社区厨房水槽建造自己的DISH-O-TRON的过程。因此,我们将解决一个现实世界的问题,并有趣地学习如何从头开始构建和改进人工智能系统。敬请关注!
继续我们系列的第二部分,我们从收集数据开始。