我是在斯特鲁加茨基兄弟的“路边野餐”和“有人居住的岛屿”等书中长大的。
LensAI的想法诞生于去年5月的某个时候。如果你错过了我故事的第一部分,你可以在这里阅读--“我们是如何教会人工智能销售的”。
在我们产品开发的早期阶段,我们对此充满热情,充满活力。我们渴望从现在到永远改变世界。我们觉得我们是业内从未见过的创新者,巨大的变革将伴随我们而来!我们想飞,但我们从以前的创业公司获得的经验让我们停在了地面上。
你又在做梦了。停下来!现在是时候开发一款能让你赚钱的产品了,最好是快点!关于改变世界的思考已经够多了,至少在你看到口袋里有第一个人工智能赚到的1K美元之前,我的脑海里一直在重复着。
在与我内心的批评者和我的搭档谈判后,我们决定按下停止按钮。我们的创业公司选择了一种广为人知、久经考验的商业模式。从那一刻起,人们就再也没有想过要把我们的技术整合到镜片和眼镜上了。我们把重点转移到了识别物体和销售广告上。
我们在做关于竞争对手的研究,但我们的社交媒体追随者也帮了我们很大的忙,因为他们不断向我们发送大量关于各种公司的信息,这些公司以某种方式从事图像或视频中的对象识别。切菜板。
康斯坦丁和我都是不安分的人,被无尽的疑虑折磨着。我们有那么多未回答的问题。
为什么所有这些相互竞争的公司都有数百万和数亿美元的价值,但其中没有独角兽公司?为什么他们的技术在互联网上如此罕见?为什么?为什么?为什么?我经常问自己,都快把我逼疯了。
为了进一步推进我们的想法,我们必须找到答案。使用视觉搜索和广告作为关键词,我们能够找到与我们的想法或多或少相关的公司。我们把他们都聚集在我们的切菜板上,拿出一把刀,开始了凌乱的检查过程。
通过对一家又一家公司的分析,我们注意到两大相似之处:有限的广告库存和有限的广告展示。所有这些项目都经过了改进,可以与狭窄的产品圈合作。不仅如此,它们中的一些只适用于单一类别的产品或一个品牌。此外,要显示广告,必须提供与产品相同的匹配项。这个前提对我们来说似乎太严格了。
由于所使用的商业模式,许多项目都有局限性。它们要么是B2B(企业对企业),非常复杂,要么是B2C(企业对消费者),在我们看来是不可行的。例如,一些项目需要与产品植入机构互动,才能在智能电视上流式播放的视频中显示广告。
所有项目都有相同的“鸡和蛋”问题。“发生这种情况的原因是,当时正在销售的产品数据不足,即使广告商愿意付费为这些产品做广告,也可以在相关的视觉内容中显示出来。”
我们的砧板帮助我们确定了三个主要问题,如果我们想要成功,我们需要比我们的竞争对手更有效地解决这些问题:
无论内容首次发布的日期是什么,产品/服务的广告都必须与检测到的视觉内容的对象高度相关。
我们必须将广告直接投放到检测到的对象中,并以一种不会严格依赖于相似性算法的方式显示广告投放决策。同时,我们不希望用户质疑我们的广告投放或广告选择。
我们必须为一台机器提供广泛和相关的广告库存,我们必须定期收到这些库存。这样,机器就可以应用各种显示广告算法。
我们必须让这台机器在浏览的那一刻完全像一个人一样思考。例如:
这家伙穿的衬衫真可爱,我知道一块男士手表会配得上它的!
众所周知,人脑的思维过程由于其情感上的无能为力,很难被计算机复制。但我们决定试一试,训练这台机器进行联想决策。
我们第一次尝试制定可检测的对象、实体、人和其他特征之间的所有需求和链接关系,结果看起来像是某个未知的怪物,要求我们分析所有可能和不可能的数据。
通过多次测试和大脑中的痛苦,我们能够收集到我们所拥有的所有可以分析的数据。“下面的图片清晰了:
我们将整个动物园的数据系统化成一张影响力地图,该地图导航了每个实体如何影响那个特定场景中的其他每个实体。让我向您展示它是如何在一个框架内工作的。例如,一旦环境被确定为厨房,厨房用具等广告类别的物品的影响力就增加了。厨房护理产品,厨房护理产品,厨房护理用品,餐具,餐具等广告类别中的对象的影响力都增加了。(注:厨房用品是厨房用品,厨房用品是厨房用品,厨房护理产品,厨房护理用品,餐具,餐具等广告类别中的对象的影响力也增加了。)。
因此,我们构建了一个影响图,您可以在下面看到它的一个版本。(我们故意扭曲了它,因为它包含了对我们有价值的算法参数。)。
在此图像中,您可以看到我们操作的实体以及所有实体是如何相互影响的,同时分析图像和上下文的过程正在运行,以显示最相关的广告。
任务被成功定义:根据特征特征确定对象和实体与广告类别的关系。
完成后,下一步是在两个实体之间建立连接:类别和对象。
对象关系是一个对象与某个分类范畴有明显联系的方式。换言之,从分类学的角度来看,每种对象关系都可以描述为对象对产品的某种影响。也就是说,当我们在图像中看到一个物体时,我们可以假设这个物体是一个中心物体,我们需要根据一些特征找到与这个物体相关的产品。
在处理任务时,需要应用以下关系(表征特征):
工具我们需要两个元素来处理大量数据和实体之间的各种类型的关系,它们是:
一种工具,可以帮助这些人将他们的知识转移到机器上,在我们的例子中,就是识别对象之间关系的特定知识。
猜猜哪一个更难找到?(剧透警报!这是第一个。)。
我们在互联网上找遍了,但没有找到能满足我们要求的工具。我们别无选择,只能创造我们自己的。我们汇集了处理海量数据和连接类型的能力。请注意,每个可能的联系都必须有自己的影响力。
此外,所有这些联系都必须由不同的人建立,这些人可以捕捉机器制造的错误,然后纠正它们。因此,我们得到了一个具有两个面板的数据管理器,它具有广泛的功能集,并且能够处理关系数据库和图形数据库。
产品开发的这个阶段几乎让我们筋疲力尽。康斯坦丁和我都没有经历过项目开始时的那种兴奋。在我们看来,处理和连接如此大量的数据是不可能的。我们确定物体之间关系的任务即将失败。
为了感受我们的痛苦,想象一下我们必须处理的几个过程,比如将可检测到的对象与广告类别联系起来,收集可检测到的对象的所有可能的变体,将行业和上下文主题与广告类别联系起来……。
我们没有统计所有这些进程,但它们有几十万个。感觉就像地狱一样。我们知道现在是委派的时候了,所以自从创建了五个人的小组以来,两个数据都只有一个目的,就是将所有实体链接在一起。这是我们拍到的照片。
您可以在上图中看到各种实体的关系。最后一张显示了一个场景,也就是单个图像中多个实体的影响。
我们能够实现这样的场景:在框架对象中检测到的对象总是争夺要显示的权利,而算法的工作是确定在每个框架中显示哪个广告。例如,在三个广告中显示哪一个(茶壶、咖啡机或家具店品牌)的最终决定权完全落在算法的肩上。
如今,你不能用物体识别软件让任何人感到惊讶,但凭借高准确率的识别,你可以做到。
下一步是确定我们的模型工作有多精确,如果机器是错的,就给它们F。在进行这项工作的同时,我们还手动测试了我们在完成任务时建立的一些关系,以确定实体之间的关系。
结果,我们得到了一大堆由机器算法完成的分类错误。我们在数以千计的电影图像和视频画面中发现了它们。为了纠正错误,我们的两个数据,因为小组必须手动标记它们,然后逐个分类。
有近30种不同类别的错误。我将在下面列出一些最大的。请注意,这些错误类中的每个错误类最多包括十个子类。
我们继续努力,离我们的目标越来越近。下一步是发布一个公开演示,这样您就可以评估我们的工作或指出我们需要修复的缺点。
我们承诺将以高质量的内容、我们项目的最新进展和关于机器学习的各种有趣的故事来取悦您。
LensAI是一个联盟营销平台,可以在正确的时间自动在正确的地点投放正确的广告!🎯。
我们正在构建一种广告格式,将视觉内容转变为无缝的购物体验-在浏览和销售之间没有更多的差距。