通货膨胀是一种货币现象,是印钞的功能。但它也部分是一种社会现象,是大众心理的一种功能。如果足够多的正确的人相信通货膨胀将会发生,它就会发生。因此,当通货膨胀发生时,通常会推动审查通货膨胀本身的讨论,理由是讨论问题实际上是首先引起的。这正是过去十年在阿根廷和委内瑞拉发生的事情。这就是为什么世界需要一个全球性的、去中心化的、抗审查的通胀仪表板。在接下来的 90 天内,我们将接受此项目的提交。如果您最终创办了一家公司,我们将向最佳进入者投资 10 万美元,并可能来自 @Sergeynazarov、@APompliano、@RussellOkung 和 @RajGokal 的后续投资。此外,如果最好的仪表板使用 Chainlink 的加密预言机技术在链上获取相关数据,他们将有资格获得额外 10 万美元的 LINK 代币赠款。阅读条款和条件并在此处提交您的条目。在这篇文章中,我们将讨论为什么应该存在这样的仪表板,人们可以如何构建它,以及如果您做出了很好的努力,我们将如何为其提供资金。为什么我们需要通货膨胀仪表板?因为去年印刷了数万亿美元——而且不仅仅是美元。除美国外,许多国家已经打印菲亚特像疯了一样向COVID响应资助。十年前震惊和震惊的数字(787B 美元用于救助!)今天不再值得成为头条新闻,尽管它们很可能在明天成为头条新闻。如果通货膨胀是由政府引起的问题,我们就不一定依赖于 CPI 等政府统计数据来诊断或补救它。事实上,在通货膨胀率高的地方,审查和否认是规则而不是例外。因此,我们想要构建的简短版本是麻省理工学院的 Billion Prices Project 的最大程度独立于政府的、链上的、开源的、加密预言机版本,该项目使用来自许多不同在线商家的原始数据来提供公开、透明、可重复和国际上有用的通货膨胀率计算。将其视为 coinmarketcap.com,但对于通货膨胀:世界各地的加密货币人每天都会刷新的下一个仪表板。
获取价格数据。这实际上是困难的部分之一!有关更多详细信息,请参见下文,但简而言之,获得好的数据并不容易。因此,如果您选择参加比赛,您的数据采集和验证管道将是您提交的重要组成部分。确定一大篮子商品。为了论证起见,让我们假设您可以获得经过验证的价格数据。一个好的数据源应该允许您使用来自不同来源的可靠数据来隔离大量(但有限)的商品。就像 Coinmarketcap.com 在不同国家的许多交易所随着时间的推移跟踪 10000 多种数字资产的价格一样,您希望随着时间的推移跟踪不同国家的许多商家的 N 个篮子商品的价格。为了进行比较,以下是美国消费者价格指数 (CPI) 跟踪的一些商品。将价格数据上链。一旦您拥有良好的价格数据,您就需要多个抗审查、分散、适度可用的数据存储来存储该数据的各种版本,以供审计之用。精炼后的数据可以在链上,原始价格数据可以在 IPFS 或等效物上,任何带有商品价格的原始 URL 也可以使用诸如 archive.is 或 web.archive.org 之类的服务进行冗余备份。数据可以定期下载(如 MIT BPP)并散列到其他链上(例如通过 Merkle 树),这样如果有人怀疑任何条目,他们可以运行许多不同的加密完整性检查。可以依赖 BitTorrent 等现有技术进行数据集分发,如下所述,Chainlink 的去中心化预言机网络可用于对链上的数据进行加密签名和传输。原始价格的多元时间序列。如果数据被解析为关系格式,则可以使用 UPC(或更可能是其内部版本)来连接不同来源的价格数据。这将为所有商品的价格提供一个全局仪表板;您可以将中国商店中茶叶的价格与不同地区或不同时间的完全相同茶叶的价格进行比较,以开始可视化价格随时间变化的轨迹。理想情况下,您应该对每个价格数据点(零售和批发等)的原始存档数据源进行可点击的归因。计算通货膨胀的智能合约。我们还希望在智能合约中实现透明的逻辑、开源和理想的链上,将分散数据存储中的价格数据转换为各种通胀估计。一种进行个性化通货膨胀计算的方法。智能合约的最终版本将允许您选择一些加权的一篮子商品来获得个人通货膨胀计算器。是您的想象,还是您个人在汽油、食品、房租、教育和医疗保健方面的成本一直在上涨?一种不依赖于政府统计数据的计算。这可能不言而喻,但所有这一切都应该是自下而上的通货膨胀计算,仅使用人们在网络和移动应用程序上支付的原始价格作为输入。政府消费者价格指数 (CPI) 数据仅用作比较,不应作为任何计算的输入。
一个有安全意识的开发过程。有充分的理由以化名进行该项目,因为如果仪表板最终成为审查目标,这可能会有所帮助。但是,为了颁发奖品和进行投资,我们可能需要出于 KYC 目的了解您的身份。我们认识到这是一个矛盾,但将尽最大努力与获奖者合作,在遵守所有适用法律的同时保护他们的隐私。请注意,您也可以选择使用您的真实姓名,但只需将仪表板分散到您无法控制的程度。以上是我们希望看到的内容的快速总结。但是,构建一个开源的、抗审查的、链上通胀仪表板有几个困难的部分。也许最困难的部分首先涉及实际获取价格数据。使用新工具,在链上发布并计算个性化、可验证的通胀估计并不难。为了计算与通货膨胀有关的任何事情,您需要收集许多商品随时间推移的价格数据。至少有两种方法可以做到这一点: 选项 B:与零售商(如亚马逊和阿里巴巴)或加密商户服务提供商(如 BitPay 和 Coinbase Commerce)合作,其中,第二种可能是最可行的。为了理解这一点,让我们讨论一下为什么抓取并不像看起来那么容易。构建通货膨胀仪表板的显而易见的方法是编写代码,从许多不同的网站和移动应用程序中收集许多不同商品的价格。天真的方法将依赖于通用产品代码 (UPC) 的概念,使不同商品的价格在供应商和时间段之间具有可比性。您可以从亚马逊等零售网站(向最终用户销售产品)和阿里巴巴等批发网站(面向企业买家的批量价格)获取价格。为了这个项目的目的,你将所有代码开源。为什么抓取方法有问题 当您出于任何原因试图抓取价格时,您就进入了零售商和价格抓取者之间的军备竞赛。零售商知道刮刀,并总是试图要么玩弄它们,要么直接阻止它们。
推动整个抓取工具与零售商进行军备竞赛的核心动力是:零售商希望通过任何必要的方式让用户访问网站,而抓取工具通常构建搜索引擎。虽然搜索引擎只想将用户发送到“最佳”零售商处进行特定查询,但强烈鼓励零售商脱颖而出,不惜一切代价让人们访问他们的网站。一旦您到达现场,即使您来的东西缺货,他们也可以尝试向您出售升级、配件或您正在寻找的东西的替代品。这具有许多含义,甚至适用于将价格数据用于不同目的的通货膨胀饲料刮刀。问题:从页面中提取数据 首先,因为零售商总是试图玩价格抓取游戏,即使从页面中获取数据并对其进行解析也很重要。您不能依赖 OpenGraph 标签或站点标记来提供结构化数据。这可能意味着使用 XPATH 选择器和 Regex 维护许多特定于站点的抓取工具。零售商将大量更改他们的标记以调整这些页面,以便您的所有 XPATH 查询中断,而他们这样做只是为了挫败抓取工具。有一些技术可以解决这个问题,比如包装器归纳和更新的基于机器学习的技术。问题:处理自动对策 接下来,首先是从商家页面实际获取原始 HTML 的机制。不仅解析页面并非易事,而且首先获取页面内容并不总是微不足道的。商家页面的 robots.txt 文件通常会禁止任何未命名为 GoogleBot 的爬虫,Cloudflare 等服务提供 Scrape Shield 等工具,亚马逊和阿里巴巴等大型网站有许多针对爬虫的自定义防御。问题:维护网络爬虫 运行网络爬虫进行抓取可能是一项昂贵的固定成本。它让您直接置身于搜索引擎和零售商之间的军备竞赛中,在那里您不断尝试与零售商争夺准确性。他们不会知道你是一个通货膨胀饲料——他们会认为你的刮板是一个比较购物的刮板并阻止它。
问题:检测虚假的库存状态 为了让用户到场,零售商会不惜一切代价让您在 Google 或某些外部引擎中查看商品时看起来像是有库存。这个想法是,即使您点击的商品实际上缺货,一旦他们将您带到现场,您就可以通过其他方式进行营销。这是一个搜索结果示例:他们声称上面的斧头有货,但是当您点击该网站时,您会看到:如您所见,您无法选择要添加到购物车的变体,这意味着它实际上不是可用的。这只是一个随机的零售商,但像这样的技巧在网上比比皆是。这种库存状态操纵对于通货膨胀价格刮刀意味着什么,即使是不是广泛可用的物品也可能以某个(虚假)价格显示为有库存,其中明显的库存状态和价格被操纵的唯一目的是为了吸在来自搜索和比较购物引擎的用户中。如果您只想通过从库存清单中抓取真实世界的市场价格来确保准确,这就会出现问题。问题:解析难以确定的单位 通货膨胀饲料刮刀的另一个大问题是基于数量的定价。如果您想为三文鱼片定价,您需要知道列出的价格是每磅还是每盎司。这对于通货膨胀饲料尤其重要。但与价格数据本身一样,这些数据很难获得,跨站点不一致,并且通常需要 XPATH 查询。看看这个鲑鱼列表和标记:那里有一个有用的 itemprop 属性,它为您提供标价和销售价格,但没有 itemprop 为您提供单位数量。如果需要,您需要先 XPATH,然后是 REGEX。问题:捕捉隐藏的运费 运费是在线零售商玩游戏来吸引用户的另一个重要领域。您会看到大量明显的定价差异,这完全是运输估算的函数。许多零售商会宣传较低的标题价格,然后大幅增加运费以弥补差额。以下是 Google 购物首页的一个最近示例:
您可以看到第一个站点正在尝试交付以在按价格排序时将其列表置于顶部。点击进一步显示,运费实际上是不同的,他们列出了谷歌 15.99 美元的低端:同样,这一切都是为了对谷歌有吸引力并让用户在现场。问题:消除 UPC 和 SKU 的歧义 您可能想比较跨站点的刮取价格,但一般而言,UPC 数据在网上非常稀少。如果幸运的话,您会得到一个 SKU 或其他一些代码,但通常不清楚它是制造商提供的还是零售商本身的内部代码。 UPC 和其他跨站点标准化号码很少可用,或者即使存在,也不可靠。此外,产品的不同变体将具有不同的 UPC、SKU 和其他编号。例如,有多种颜色可供选择的办公椅,每种颜色都有一套不同的代码。铲屎官很难弄清楚这些产品仅仅是同一产品的颜色或尺寸变体。您可能仍然决定编写一个刮板。但是您应该在开始之前了解这些问题。刮擦的替代方法是合作。如上所述,至少有两种方法可以做到这一点: 第一种方法很难。较大的商家通常没有动力与您合作,而较小的商家可能没有计算适当的通货膨胀饲料所需的广泛选择。
第二种方法更有趣,它是加密商务的一种新颖应用。在过去几年中,接受加密货币进行在线支付的业务悄然增长,但增长迅速。在 Bitpay 和 Coinbase Commerce 之间,超过 10000 家商家的累计销售额超过了 3B 美元。一组相关的公司是允许使用加密货币支持信用卡购买的公司,例如 Coinbase(再次)、Gemini、Crypto.com、Wirex 和 Blockfi。这些也可能具有以加密货币形式表示的商品价格的历史信息。与其中一家公司合作获得以加密货币报价的价格数据库的优势在于:(a) 他们更有可能了解比特币解决的问题,以及 (b) 每个公司都有一个单一一致的历史价格数据库可以使用(通过一些努力)建立历史通货膨胀饲料的各种各样的商人。缺点是历史上可以用加密货币购买的商品类型相对于传统的市场篮子来说是有偏差的;重电子和技术,轻消费必需品。话虽如此,结合这两种方法可能是值得的:一些来自抓取的价格数据,一些来自合作。您甚至可以为零售商创建某种加密机制,让他们自愿(或许化名)提交合法的、具有代表性的价格数据,而不会冒失去竞争优势的风险。获得价格数据后,您希望将其放到链上以使其具有抗审查性。也许并非所有这些都在链上——这可能很昂贵——但应该有足够的链上让持怀疑态度的用户尽可能多地进行验证。 Chainlink 是一个广泛使用的预言机,它为大多数去中心化金融提供动力,我们认为这将是该指数的一个很好的工具,并结合了以下工具:(a)价格数据的多个独立发布者,(b)该数据的计算聚合,(c ) 一个简单的 data.eth 命名空间来确定数据源和 (d) 与链下资源(从 Chainlink 2.0 开始)来回双向通信。特别是,他们有以下教程: 一个成功的通胀仪表板可能成为下一个 coinmarketcap.com 或 defipulse.com——一个看似简单但全球有用的应用程序。
我们已经在上面概述了我们想要看到的大部分内容。如果您最终创办了一家公司,我们将对最佳进入者进行 10 万美元的种子投资,并可能从 @Sergeynazarov、@APompliano、@RussellOkung 和 @RajGokal 进行后续投资。如果您在项目中使用 Chainlink 的预言机技术,最好的仪表板将有资格获得 10 万美元的 LINK 代币赠款。请注意,条款和条件确实适用,并且在某些司法管辖区可能无法获得任何潜在的资金或赠款。我们将在接下来的 90 天内接受提交。准备就绪后,只需在下方提交您的项目以供评估。