Kindle收集了数量惊人的大量数据

2020-08-26 02:04:14

作为一名狂热的读者,我已经拥有了几代Kindle设备,从最初的Kindle设备到PaperWhite设备,我喜欢每一代设备。

然而,我也一直密切关注新格式可能被滥用的情况。因为从技术上讲,亚马逊拥有您查看的内容,所以他们可以随时将其撤销。亚马逊从客户账户(和Kindle)中移除特定书籍的案例已经发生过。更糟糕的是,亚马逊还撤销了用户账户,并取消了所有购买图书的权限。

Kindle服务利用阅读数据来提供一些传统图书无法提供的好功能:在设备之间维护书签和笔记,使所有设备与最后阅读的页面保持同步,等等。它还显示了在Kindle上阅读下一本书的广告和推荐。

我很想知道Kindle是否只发送这些服务所需的数据,或者是否正在发送关于我的其他数据。

Kindle会发送设备信息、使用元数据,以及在使用时与设备(或应用程序)进行的每次交互的详细信息。所有这些都直接链接到读者帐户。

打开应用程序,阅读一本书,翻几页,然后合上书,就会向亚马逊服务器发送100多个请求。

打开页面的时间(当您翻到新页面时,会生成一个时间戳)。

页面上的第一个字符(这可能类似于书中的字符7705,这是确切位置)

{";CREATED_TIMESTAMP";:1597743233808,";有效负载";:{";上下文";:";正在读取";,";CONTINUINE_SCROLL_STATE";:";禁用";,";结束位置";:4708,";IS_SCROLDED_OVER_SPAN";:FALSE,";SPAN_TYPE";:文本";,";开始位置";:4193},";架构名称";:";Kindle_Position_Consumer_v2";,";架构_版本";:0,";已发送时间戳";:1597743233855,";序列号";:26}。

每次阅读会话还将生成以不同模式阅读了多少页的摘要:

{";CREATED_TIMESTAMP";:1597743255324,";有效负载";:{";ACTION_TYPE";:";PageTurn";,";BOOK_LENGTH";:2003478,";上下文";:";正在阅读";,";计数";:10,";导航结束位置";:7884,";:";水平";,";导航开始位置";:3599},";架构名称";:";阅读器_入_书_导航_v2";,";架构_版本";:0,";已发送时间戳";:1597743265854,";序列号";:36}。

类似的数据集被发送用于打开应用程序,无论是打开应用程序时在后台,打开或关闭图书时,以及更改字体大小等设置时。突出显示或点击任何单词都会将请求与文本一起发送到必应翻译和维基百科,并返回给亚马逊。

这些请求似乎都没有用于客户功能,如上次读取位置。取而代之的是,高亮显示、最后一次读取位置和其他信息被周期性地第二次发送到不同的端点,而信息的粒度要小得多。

每个请求在生成后也不会立即发送。许多这样的记录被创建并存储在本地,然后上载(请注意SEQUENCE_NUMBER字段)。即使一个人在阅读时处于离线状态,重新连接时也会存储和发送此数据。

Kindle还包含更多的个人信息,我希望它不要这样做:

尝试获取本地网络上的IP地址(10..地址,这对我来说是不正确的)

设备信息和版本(屏幕尺寸、制造商和型号(iPhone与Android和Kindle)、软件版本。

其中一些可能会帮助亚马逊了解用户是如何使用这款应用程序的,这样他们就可以根据这些使用案例对其进行改进。本地IP是这里唯一困扰我的项目,尽管我找不到任何其他有问题的本地网络信息。

Kindle远不是我见过的最具侵犯性的隐私应用,但它记录了很多我不喜欢的行为阅读信息。在过去一年左右的时间里,我一直在努力摆脱Kindle生态系统,现在我用Marvin在我的iPhone上阅读。我不再使用Kindle设备,尽管我非常想念e-Ink。

不幸的是,为了使用非Kindle应用程序,我必须购买无DRM的图书。要找到它们并不总是那么容易,尽管Kobo书店和小型利基供应商经常提供它们,有些甚至可以在亚马逊上找到。