我的乱七八糟的分析分手

2020-05-30 00:35:59

创建一个网站--即使是像这样一个简单的博客--也会伴随着很多决定。选择前端框架、托管提供商、域名和布局都会让人精疲力竭,这是在坐下来写任何东西之前。

但是有一个决定我没有多想,那就是安装Google Analytics。作为各种规模网站的事实上的分析标准,谷歌分析(Google Analytics)是添加到数字墨迹(Digital Inkling)中的轻而易举的事情,这样我就可以知道有多少人在访问该网站,并在每次有人阅读文章时获得一点多巴胺。但在过去的几个月里,我对这个愚蠢的决定比其他所有的决定考虑得都要多得多。使用Google Analytics在隐私和技术垄断力量方面都有一些令人不安的影响,所以几周前,我决定采取原则性的立场,与Google Analytics分手。我建立了自己的分析服务,现在我在Digital Inkling上运行,总体上感觉相当成功。但是我和Google Analytics的分手,就像所有的分手一样,远不是一刀切的,我自己的道德困惑已经成为思考互联网上更大的隐私问题的宝贵视角。

我将从解释Google Analytics带来的问题开始这篇文章,然后讨论我向运营自己的个人分析服务的过渡,以及由此带来的更广泛的问题。将来某个时候,我会写一篇关于我如何构建分析服务的技术后续文章,希望在自己的网站上构建类似服务的读者可能会感兴趣,或者希望看到一个极其简朴的微服务方法示例的读者可能会感兴趣。

谷歌在隐私方面的记录远非出色,但直到最近,我从未考虑过在我的网站上使用谷歌分析会带来什么令人不安的影响。我将尽可能简单地解释它是如何工作的,然后列出问题。

作为一名开发人员,安装Google Analytics再简单不过了:只需在Google上创建一个帐户,然后将所提供的小代码片段添加到您网站的每个页面即可。当你第一次使用Google Analytics在网上冲浪时访问一个网站时,这段代码会运行并安装一个cookie。Cookie是一个有趣的名字,指的是网站存储在你的互联网浏览器上的一小段信息,这样它就可以记住关于你的一些事情。Cookie通常是无害和有价值的-例如,许多网站会在您第一次登录时保存包含帐户信息的Cookie,以便将来可以检查Cookie以验证您的身份,而不是让您再次登录。2个。

Google Analytics也使用其cookie来识别您的身份,但目的不同。一旦安装了Cookie,每次您加载运行Google Analytics的页面时,之前的相同代码片段将读取您的Cookie,识别您的身份,并向Google发送一条消息,让他们知道您访问了该页面。然后,谷歌清理数据,创建漂亮的仪表盘,开发者(真的是你的)可以用来获得多巴胺。

不需要数据科学家就能知道我什么时候使用这个仪表板发布了一篇文章。

从表面上看,这似乎不是一个问题。但当我们考虑到Google Analytics的规模时,无论是从广度还是深度来看,其影响都变得可怕起来。

首先,Google Analytics捕获的数据深度惊人。我提到谷歌记录了你是谁,你访问了哪些页面,但它们也记录了你正在使用什么设备,你在网站上停留了多长时间,你点击了什么,你的地理位置,以及你来自什么网站。谷歌实时了解任何运行Analytics的网站上发生的一切。而且由于他们的cookie,他们可以在运行Google Analytics的不同网站之间跟踪用户,向他们展示人们在网络上生活的更完整的图景。

当我们讨论谷歌覆盖的广度时,数据的深度变得更加令人担忧。在全球排名前10万的网站中,超过85%的网站都在使用谷歌分析(Google Analytics)。几乎每次你加载互联网页面时,谷歌都会读取你浏览器中的cookie,并保存有关你访问该页面的全面数据。

考虑到物理世界的类比,可以正确地看待这个巨大的规模。想象一下,你所在城市85%的地点无论是公共的还是私人的,室内的还是室外的,餐馆,家庭,医生办公室,每个角落都有一个间谍站在角落里,胸前有一个对讲机和一个巨大的谷歌标志。3每当你进入一个地方,谷歌间谍就会要求查看你的驾照,通过无线电向谷歌总部报告你刚刚到达的情况,并通过无线电不断更新谷歌的所有行动,直到你离开该地点。

这是令人毛骨悚然的,但这正是我们的在线世界的运作方式。谷歌随时都知道每个人在整个互联网上的位置,几乎没有漏洞。我以前已经写过关于在线隐私的重要性以及当我们失去它时对社会造成的损害,所以我觉得我不需要在这里再次提出这样的理由。但是,即使没有在线个人隐私不会让你感到困扰,谷歌无所不能的互联网眼睛也带来了另一个问题。谷歌分析是免费的,正如经典格言所说:

谷歌分析并不是出于一种慈善意识。每有一个新网站加入谷歌分析,谷歌对互联网数据的垄断就会加强。谷歌可以查看你访问的每个网站的数据,并使用这些数据向你展示定向广告,或者以无情的精确度向你销售产品,而没有同样数据的公司永远不会希望与之匹敌。谷歌已经是科技领域的垄断巨头,谷歌分析提供的海量数据给谷歌带来了竞争优势,几乎确保了它永远不会被赶下台。在短期内赢得市场可能是无害的,但即使是一家完全仁慈的公司实现永久的市场主导地位也是令人担忧的-而谷歌远不是一家完全仁慈的公司。

数字墨迹只是互联网浩瀚海洋中的一个水分子。如果互联网是纽约市,这个网站将是皇后区的一个凌乱的报摊,你经常会停下来吃块糖果,与店主闲聊,事后想知道它是如何在飞涨的租金中生存下来的。尽管它很小,但它是我的报摊,该死的(!),我不会再为谷歌的霸权做贡献了。是时候和Google Analytics分手了。但这场分手一如既往地揭示出,事情并不像看起来的那样黑白分明,而且有很多责任可供指责。5个。

我将省去我构建的分析服务的血淋淋的技术细节,但最终产品,网站访问者的实时图表,在这里是公开可见的,我在下面提供了一个屏幕截图。

如果你将我的服务与Google Analytics进行比较,你会注意到一件主要的事情--我的服务很烂。它只跟踪一个指标,页面加载,并且只能按您查看的页面和您的IP地址进行划分(这是我的唯一用户的代理,有点容易出错)。与谷歌相比,谷歌会告诉你用户的设备、位置、之前访问过的网站等等。我的服务的图表很难看,而且与谷歌的仪表板不同,我不能轻松地将它们调整到我想要的任何时间段,或者聚合一段时间内的结果。我没有能力知道在任何给定的时间有多少人在活跃地查看这个网站,而且我仍然在日期和时间上有问题。从字面上看,世界上没有人会说我的服务比Google Analytics“更好”。

这在一定程度上是由于懒惰6-例如,我会在需要的时候修复图表缩放,但现在它对我来说已经足够好了。但这种平庸在很大程度上是故意的。出于对用户隐私的尊重,我明确表示不想使用cookie,也不想保存用户位置或用户来自哪些网站。我只想记录足够的数据来知道人们正在阅读哪些文章,并确保我知道网站是否关闭了。我想象我的脱衣服务就像一个剃光头的僧侣,一种苦行僧的分析形式,伴随着对过度和道德优越感的所有拒绝。

一旦我完成了新服务并进行了部署,就到了最终与谷歌划清界限的时候了。但在此之前,我想同时运行这两项服务一周,以便将我的新分析数据与谷歌进行比较,并确保它是正确的。但后来一周变成了两周,然后是三周,我还在谷歌分析(Google Analytics)上查看仪表盘。我最终被迫承认自己的虚伪--尽管我有隐私的原则,但能够访问谷歌给我的深度数据是一件令人着迷的事情,我不想放弃它。上个月在欧洲有人读了我的博客,这很有趣。发布一篇新文章,并看到有多少人实时阅读它,这是一件令人兴奋的事情。知道读者最初在互联网上哪里找到了文章是很有帮助的。

我不能切断这条线可能只是因为缺乏哲学上的主心骨,但对于由企业运营的高流量网站来说,放弃分析数据基本上是不可能的。如果在市场上竞争的每家公司都只能访问我有限的页面加载分析数据,那就不成问题了。但是,一旦每个人都可以获得更深层次的数据,为了“用户隐私”等愚蠢的事情而放弃这些有价值的信息,将是一种竞争性的自杀。一旦个人数据精灵从瓶子里出来,就很难再把他放回去了。

这也意味着,在可预见的未来,谷歌几乎肯定会继续成为互联网的“万能之眼”。作为一家企业,您的首要任务是以最少的成本和麻烦获取所需的数据。据我所知,创建自己的服务要么不能提供所需的数据,要么工作量巨大,要么(很可能)两者兼而有之。除非出现更好的竞争对手产品(很可能具有相同的间谍商业模式),否则你将选择谷歌的标准即插即用选项,因为它从85%的互联网流量中学习,它的产品将变得更强大。这个精灵很难放回瓶子里。

我们有没有可能在没有谷歌或其他任何人的全能眼睛的情况下进入互联网呢?一些人认为,我们需要政府来规范在线跟踪和数字广告。这是欧洲通过GDPR监管所走的路线,我希望我们能从它的成功和失败中吸取教训。但考虑到美国政府在数字隐私方面的表现比大多数公司差得多,我不完全相信他们能解决这个问题。一个更好的方法是给个人提供工具来控制他们的数据和在线隐私。许多强大的技术已经存在-阻止追踪器的扩展,模糊位置的VPN,通信技术中的端到端加密,以及匿名支付的加密货币。但与公司类似,人们也希望以最少的努力从互联网中获得最大价值,其中许多工具很像我的分析服务-令人困惑,难以使用,有时甚至会出现问题。为了看到变化,我们需要一波采用这些技术并使其使用起来令人愉快的产品浪潮,让人们能够强大地和私人地使用互联网。

当我继续在数字墨迹上运行谷歌分析时,我自己的虚伪怎么办?我一直在想,对于像我这样的个人网站来说,只要不与谷歌这样的大型聚合器共享,收集一些我认为有趣和有价值的深层数据是否合适。这更符合我们的隐私物理模型,在这种模式下,店主知道你在他的店里呆了多久,你来自哪个方向,但不会把这些信息交给市政府,让政府把这些信息汇总到每个人的行动地图上。如果将Google Analytics从我博客的小报摊上移除完全不会对Google的数据主导地位产生任何影响,这真的很重要吗?一个有原则的立场是好的,但当我的服务不可避免地崩溃时,不必修复它就省去了我的头疼,这也很好。这里没有明确的寓意,就像所有的分手一样。但希望我们都能从这段关系中学到一些东西-谷歌了解到你读了这篇文章,我也了解到原则禁欲主义,在网络开发中,就像在生活中一样,并不是很有趣。

非常感谢哈里森·斯蒂德曼、贝克·莫兰和我伟大的母亲阅读了这篇文章的草稿。

2.这就是为什么清除你的cookies,相当于关闭并重新打开它的互联网浏览器,会让你从所有网站上注销。

3.我在想象一个肌肉发达的保镖,但考虑到这应该类似于一段代码,可能更好的做法是把它想象成和你一起上高中的书呆子或者一只真正聪明的柯基犬。

4.如果这真的是您的立场,请阅读链接的文章并与我联系。我很想从不同的角度听到关于这一点的争论。

5.我在这里混合了我的比喻,这是写作的大罪,但正如我已经说过的,这是我的报摊,该死的!

6.我用一种简洁的方式使用懒惰--让这些图表变得漂亮并不像我余生中的大多数时间那样优先考虑,所以它可能会在很长一段时间内变得丑陋。