这是 ONES Piece 翻译计划的第 119 篇译文。本文原载于 veekaybee.github.io,作者 Vicki Boykis,由 ONES Piece 翻译计划 方文溢 翻译。ONES Piece 是一个由 ONES Ventures 发起的非营利翻译计划,聚焦科技创新、生活方式和未来商业。如果您希望得到更「湿」的信息,我们也有播客节目「迟早更新」供您收听。 前言隐私——有人觉得它至高无上,属于基本人权,受宪法保护;也有人觉得「我坦坦荡荡,没什么事情需要遮掩」;也有人始终搞不清楚它到底为何物。以研究都市问题而著名的作家 Jane Jacobs 曾经说过,「只有当城市是被所有人一起创造出来的时候,它才有能力为所有人都提供些什么。也只因为前者,后者才得以成立。」这个逻辑在互联网世界也说得通。只不过在实体的城市里,人们通过缴纳税收来补贴公用,而在虚拟空间里的「税收」,便是我们的隐私。 本期隐私专题的三篇文章,分别从历史、现状和未来,以不同的角度阐述、分析和想象了「隐私」这个概念以及它与我们的关系。但无论如何,大多数情况下,就像英超利物浦队的队歌所唱的那样,「你将永不独行(You’ll Never Walk Alone )」。你的身边,总有眼睛看着你。
TL; DR:Facebook 能千方百计来收集你的个人信息。完全避免使用 Facebook 是非常困难的;但通过了解它所收集的数据,你能明白使用 Facebook 的潜在风险,并在使用中更加谨慎。 目录: Facebook 如何收集数据 在你发布状态之前 Facebook 已经知道哪些信息 发帖之后,Facebook 收集哪些信息 Facebook 内部如何使用你的信息: 影子档案 Facebook 与广告商有着怎样的关系 Facebook 把哪些数据给了政府 你离开 Facebook 后它还会追踪什么信息 如果不想 Facebook 掌握你的信息,你应该怎么做 Facebook 或多或少已经成了我们的虚拟客厅、线上第三空间。我们在此与朋友聊天、对新闻各抒己见、组织活动、哀悼离世的人,也在此庆祝新生婴儿、订婚、新工作、新发型以及假期。 作为社交平台,Facebook 已经占据了我们很大一部分注意力,甚至变成我们的冥想盆 。正因如此,一旦我们将自己的希望、梦想、政治声明以及孩子照片交给 Facebook,了解它作为一家商业公司是如何处理这些数据就显得至关重要了。 Facebook 确实在收集数据。2014 年,Facebook 的工程师自称每天大约能收集到 600TB 的数据。 作为对比,《战争与和平》的文本大小是 3.1MB。1966 年苏联版的《战争与和平》电影时长为 7 小时,大小为 8GB。 所以,每天 Facebook 用户上传的数据总量,相当于 19,000 万本《战争与和平》小说,或者 75,000 部《战争与和平》电影。 Facebook 的数据使用政策概述了数据收集的范围以及用途。然而,像大部分公司一样,政策里并没有清楚地告诉用户真实情况究竟如何。 我每发布一条 Facebook 状态更新,就在猜测每一次输入的信息去向哪里。持续的猜测让我困扰不不堪,于是我决定进行一番研究。以下所有信息都来自科技媒体、学术期刊,以及作为 Facebook 用户从客户角度获取到的信息。以从事十多年用户数据相关工作的数据专家角度出发,我在文章中加入了个人见解。 欢迎任何 Facebook 员工对本文提出指正。如果能知道你们没有收集和处理如下文指出的那么多数据,我将会非常高兴。 Facebook 如何收集数据 为了理解 Facebook 收集数据的过程,我做了如下的简易示意图。你从应用界面输入数据。这是属于前端的部分。 这些数据接着被纳入 Facebook 的数据库(Facebook 有很多数据库)。这是属于后端的部分。 你在前端看到的只是后端数据的一部分。
如果你对于技术细节感兴趣,j2直播,Google上能搜索到许多相关的架构示意图。Facebook 的大数据处理技术非常先进,他们工具栈包括 Hive、Hadoop、HBase、BigPipe、MySQL、Memcached 和 Thrift 等。所有这些都存放在 Facebook 众多大规模数据中心里,比如位于俄勒冈州普赖恩维尔市的数据中心。 在发布状态前 Facebook 所了解的 在你按下「发送」之前,Facebook 可能就已经开始收集数据了。你在遣词造句的时候,Facebook 已经收集了你输入的每个字符。 Facebook 曾使用这些数据来研究自我审查(Self Censorship)。
一位研究员写道: (责任编辑:本港台直播) |