假冒产品是一个数十亿英镑的在线产业。鞋类和服装是品牌整合其标志和徽标的最常见场所,使它们成为世界上复制量最大的商品。
根据经济合作与发展组织(OECD)的数据,鞋类占2016年海关查获假冒商品总价值的22%,其次是服装,占16%。尽管我们许多人已经看到这些商品在世界各地的街头市场上出售,但其中许多商品现已转移到网上,根据经合组织的数据,每年价值达5900亿美元。
假冒商品会降低其原版商品的价值。它们以便宜的材料制成,质量控制较低而臭名昭著,并经常助长犯罪活动。品牌试图通过分别针对未授权交易者来在内部打击假冒产品。除了困难之外,这是耗时且昂贵的过程。
Web抓取是一种更高效的解决方案,将高度复杂的数据技术与自动化相结合,可以持续监控在线品牌的存在。
随着黄金季度的到来以及黑色星期五和圣诞节等季节性购物活动的临近,至关重要的是企业必须采取行动来保护其品牌的完整性。他们可以做的是:
Web抓取使用“机器人”-脚本,可在几秒钟内抓取Web并从数百个网站中提取数据。这是一种获取大量原始公共信息的有效方法,然后可以对其进行清理和分析,以提取见解。如果是假冒商品,网络抓取可以扫描互联网以查找销售假冒品牌产品的网站。传统上,这是一个非常劳动密集型的过程–实际访问要出售这些产品的市场和仓库。 Web抓取可在几秒钟内检索到此信息。
识别具有宝贵公共情报的目标网站是抓取网页的基本第一步。然后在考虑网站的情况下构建网络抓取逻辑。 HTTP标头和/或代理以及HTML布局的特定使用和接受。
利用AI和机器学习的代理将以“智能方式”修改对给定网站的数据请求,从而降低了此过程的复杂性。所有网站的编码都不同,智能工具可以适应不断变化的网站结构,从而以高效的方式提取数据并提高成功率。
在执行抓取过程之前,必须定义将由抓取机制用于查找要提取的数据的任何关键字。由于找出谁出售设计师复制品相当容易,因此这通常是一个简单的过程。
包含品牌名称,商品类型和特定型号的关键字对于抓取以下步骤所需的数据至关重要。例如“劳力士(Rolex)潜水表”,“古奇·狄俄尼索斯(Gucci Dionysus)包”或“雷朋·威法尔(Ray-Ban Wayfarer)”。
收集完数据后,需要对其进行分类,分析和组织,以确定哪些假冒产品正在销售以及由谁出售。
编制了未经授权的交易商列表后,下一步就是为每个销售假冒产品的网站提交DMCA,或使用其他可用的法律补救措施来有效应对已发现的滥用行为。
最后一步需要向Bing,Yahoo和Google等最大的搜索引擎报告请求,以将其网站从索引中删除。删除网站意味着,除非有直接链接,否则潜在客户将永远找不到这些物品。
虽然网络抓取似乎很简单,但实际过程却并非如此。 Web抓取是一个复杂的过程,需要详细的技术知识才能成功执行。幸运的是,就实时爬网以有效方式提取数据的工具而言,该行业已经走了很长一段路。
除了抓取假冒商品外,网络抓取对于获取公开可用的信息(例如价格信息,监控竞争,发现竞争对手的库存和运输信息,监控消费者情绪,跟踪品牌的社交媒体提及等等)也是必不可少的。
黄金季度是黑色星期五和圣诞节前夕之类的零售活动的代名词,因为消费者可以利用必需品的潜在大幅折扣。
品牌产品的高品质做工对许多客户来说是一大吸引力,但是仿冒产品正逐渐占据这一市场份额。
尝试使用手动技术嗅探这些供应商的方法既昂贵又无效。网络抓取是根除这些未经授权的交易者的最先进技术。使用这项创新技术可以帮助从互联网上删除这些站点,从而确保零售商在一年中最繁忙的交易期间能够公平竞争。