如何使用无头浏览器查找厕纸?

2020-05-28 14:36:56

几乎每个人都直接或间接地受到冠状病毒的影响。我们不得不用很多不同的方式改变我们的习惯。其中之一,就是我们买厕纸的方式!找不到必需品的焦虑现在成了我们生活的一部分。

那么,让我们来看看如何利用0Browser(一种无头浏览器作为服务)来自动执行在Internet上查找卫生纸的任务!

我们都有自己最喜欢的应用程序,可以在上面购物,或者有自己喜欢的搜索引擎,可以经常在上面搜索。不管我们最喜欢的是什么,在这样的情况下,我们想要快速浏览尽可能多的来源,以获得黄金!

一旦我们找到它,我们想要确保它是可用的,而且发货人不会花太长时间送卫生纸,当然,最后但同样重要的是价格。现在我们知道了我们的标准,让我们开始寻找我们完美的卫生纸吧!

通常,考虑这个系统最简单的方式是模仿一个人在搜索卫生纸时会做什么。

我们通常从搜索关键字开始。让我们键入“卫生纸”,然后按Enter键。

好啦!在下面的屏幕截图中,我们可以在页面顶部看到一些结果,但它们并不是我们真正想要的。

让我们导航到Shopping选项卡,在那里事情变得更有趣了。如下面的屏幕截图所示,在左侧(绿色虚线部分),我们有一组过滤器可供选择。我们还在右侧看到一组有趣的结果(蓝色虚线部分)。

谷歌上的搜索过滤器是上下文感知的。根据我们要找的产品,它们会有所不同。就卫生纸而言,我们可以根据价格、品牌、数量、厚度、状况、发货和销售商进行过滤。在我们的设计中,我们可以将其中一些设置为动态的,但为了简单起见,让我们使用默认选择。

Google鼓励所有网站遵循语义Web设计标准,因为它使Web Crawler查找所有网站细节的任务变得容易得多。令人震惊的是,谷歌没有听从自己的建议!所以我们很不幸在Google的搜索结果集中找不到任何语义网组件。

此外,搜索结果还分为赞助链接和真实网络搜索结果。让我们把重点放在这里的主要搜索结果上。

让我们确定用户可以从一个页面导航到另一个页面的不同方式。

2.用户可以单击搜索结果,转到另一个网站查找有关该项目的更多信息。

正如您在上面的屏幕截图中看到的,初始产品单击只会展开卡片组件以显示更多信息。它还激活了产品的外部链接。下次我们点击产品标题时,我们将被带到一个外部网站。

3.用户可以通过左侧的过滤面板进行过滤,如上图所示,也可以使用Google在购物搜索结果底部提供的可视化过滤组件进行过滤,如下图所示。

4.用户导航和处理页面数据的最后一种方式是使用Sort(排序)下拉菜单来确定项目显示顺序的优先顺序,如下所示。

要将我们讨论的所有内容放在实际环境中,我们可以查看一个演示,演示0Browser(一种作为服务的无头浏览器)如何在GitHub上找到所需的厕纸。

您可以随意使用您想要的任何编程语言,但我们使用的是Java-Script和Node。

在这段代码中,我们开始获取所有处于新状态的“厕纸”,并免费发货。我们根据复习分数对结果进行排序。然后解析结果页以获取所有找到的卫生纸,并将标题、图片、要购买的url和价格保存在我们认为合适的内存、文本文件、SQL、NoSQL DB等中。然后,我们将再浏览5个页面,并获取所有结果详细信息以保存。我们还通过rest API端点提供了这些获取的结果,因此您可以在这里看到它们: