隐私的流失

April 25th, 2012

上个月月底的时候,QQ圈子忽然成为了一个火热的关注点。一个很有可能的说法是,腾讯分析了海量用户的备注名称、分组概况和所属群信息,对每个用户进行了实名的估计,然后推送给与其可能相关的用户。接下来的几天,这个功能以及背后的用户隐私成为了大家,特别是IT/互联网工作者激烈讨论的话题。

我觉得这个问题十分有趣,而且社会对其界定和认识还十分模糊。好比说,在移动设备高速发展,网络渗透到生活每个角落的今天,怎样的数据算是用户隐私,怎样的行为算是公认的侵犯用户隐私而容易引起公愤和唾弃的都还没有达成一致的共识。当我发现很难直接地想清楚这些问题时,我就在一个原本分享Idea的讨论组里发起了一个相对随意的讨论。没有Problem Definition/formulation,也不涉及任何法律制定和裁判问题,只是基于大家对社会伦理的简单常识来讨论“隐私”这个比较宽泛、繁琐的问题。

 

好的议题往往由一个例子来抛砖引玉:“有个问题是这样,好比说,我和我朋友在一个QQ讨论组里的聊天记录,应该是受保护吧,聊天内容不应该是public available吧(我认为这个应该是共识吧,如果说连聊天记录也不算隐私的话,那隐私的范围就需要重新探讨了)。但是问题就来了,既然不是 public available,但获取权限肯定不只我和我的朋友们,腾讯负责QQ开发或是运营的项目组肯定也有权限(纯属个人猜测,如果不对请原谅我的无知),甚至他们的其他部门,甚至客服小姐,那么这个权限的边界应该在哪里。这是第一个问题。其二,如果腾讯某个小组或是团队拥有获取这些聊天记录的权限,然后把海量聊天记录拿出来做 data mining,接而获得一些有趣的结果,最后把这个结果make public available,这样做是否算是扩大了获取聊天记录内容的权限范围?举两个这样的实例,第一个就是QQ圈子,它获取了很多备注和分类信息,这些信息本来不应该是 public available的,但是QQ对他们做了分析,把得到的结果做了定向推送,算是一种把用户隐私数据的衍生产品推向了public,结果,招来了一阵反对。第二个例子是前一阵子(情人节后)淘宝做的‘各个地方的人在情人节喜欢买什么’的数据分析。同样的,用户的购买记录和个人信息也应该被保密,但是汇总以后的分析结果在面向公众公布以后就得到了广泛关注,甚至是好评。我觉得其中很重要的一个原因是,很多用户并没有觉得自己的隐私信息被泄露了。这是两个将私人信息的衍生物(分析结果)推向public的例子,但是反应却不一样,关键在于得到的结果和受保护信息之间的关系,这样的关系是否可以定量的被界定呢?划定多少程度的衍生信息可以被公开,多少程度之内的不允许,这就是个问题。”

这个例子同时也提出了一个很复杂的问题,先没有讨论哪些内容属于用户隐私哪些不属于,而是对于假想中大众公认的用户隐私,怎样深度的挖掘结果,怎样的公布方式,可以不再属于隐私范围。

在讨论这个问题之前,必须对例子里的先决条件做出有效性论证。因为我在说第一个例子的同时也带出了第二个例子,隐性的默认了第二个例子里的数据也是公认的隐私数据,即淘宝抓取用户的购买信息。Daniex童鞋敏锐的指出了论证的必要性,然后我们就淘宝这个平台本身进行了一番探讨。

 

“淘宝人民警察论”: 很多用户买了会寄个自己对吧,那么淘宝其实知道绝大多数买家的详细地址,这比知道用户的名字跟某些聊天记录在某种程度上来说更加接近公安系统。

谈到公安系统,就不得不说到酒店开房记录的问题。因为之前在豆瓣看到过一个帖子,说跟一个人相亲,然后对方动用关系找在公安的朋友查了他的开房记录(全国范围内),然后问他为啥去开了房,和那些人是什么关系等等。让这位豆友感到十分恐慌。这个隐私受侵犯的问题我貌似不只一次在网上看到讨论,但政府和公安系统有没有兴趣来解决却不得而知。假设酒店登记时提供部分个人信息属于必要(貌似全球都这样做),那这些隐私信息该如何被对待呢?还有,公安系统能查到你的所有家庭信息,犯罪记录,这些记录应该被共享么?

出于安全和侦破考量,我觉得是有必要的。但要注意的问题也很简单,就是权限和传播限制。很简单的例子,一个公民的开房记录,任意一个民警就能查得到么?起码目前看来,中国的某些地区的实际情况是这样的。但按情理来说应该这样么(不牵扯法律范畴的问题)?当然不。但是这应该记录么?当然是的,追捕逃犯的时候这个信息不能说毫无用处。其二,如果我是刑警大队某个案件负责人,我为了办案需要追踪某个人的开房记录,那我获得了权限去查,查完以后我就要对这个信息负责,不能任意传播。就像理论上任何人购买下载了一首有版权的mp3,不能随意传给没有购买的人一样。另外,H童鞋指出很多公安系统才应该有的数据库资料在坊间完全可以以不到1人民币的价格购买到其中一部分表格信息。

 

“淘宝写字楼开发商论”: 比如一个开发商造了栋写字楼,租给许许多多形形色色的小公司。其中一个公司是卖药的,那那个公司所保留的药品销售记录也需要对这个开发商公开么。淘宝作为一个C2C平台(即Customer卖给Customer),角色就类似于写字楼、办公场地所有者。

在举到这个例子时,H童鞋认为淘宝有权利拿的某些信息,他陈述说:“就像房东一样,你租房子的人,客人什么的哪里来的,背景总要调查清楚的吧。”  我:“我觉得租房子的情况,更像是淘宝对待卖家的情形吧。因为有卖家来这里开店,你要做好调查,他卖的东西正不正规,是否不违法之类的。而不是调查买家。” Daniex童鞋补充:“好比你是房客,那你买了魔力电动棒,你房东也有权知道?” (太犀利了)

但如果淘宝把这项权利写在开店协议里呢,当你注册一家新店,甚至注册一个新用户的时候,淘宝就在Agreement里写明了他有权获取并分析你的购买记录,当然他也会提供什么所谓的隐私保护条款之类的,但制约性有效性有多大,就不得而知了。那这种协议是否属于“霸王条款”呢。百度百科里说,霸王条款的存在条件有二:一、生产者和经营者处于垄断地位,消费者别无选择;二、信息不对称,消费者不知道可以选择什么。根据09年的数据:国内类似淘宝的C2C平台网站主要包括淘宝、易趣和拍拍,三大平台所占据的市场份额接近90%。易趣已然承认在中国的失败,拍拍更是难以与淘宝竞争。也就是说用户其实并没有第二个C2C平台可供选择,开放自己的购买记录实属无奈。

 

在进行了一份实例讨论后,我再次抛砖,认为可以把虚拟数据的隐私归约成三个方面:1,权限问题,即谁获取这些数据   2. 责任人问题,获取这些数据的受众被禁止向非授权人输出数据  3,数据分析问题,获取数据的受众对于数据进行分析的目的需要受限制。

H童鞋提出后两者可以合并为“数据本身以及数据分析结果的受众范围问题”。关于这两个方面我们又进行了摆事实讲道理相结合的论证。比如Gmail服务现在会对用户的邮件内容进行自动分析,比如X童鞋在邮件里跟我们说他想购买某某神油,那么几分钟后这款神油的广告就会出现在他的Gmail页面里,甚至他之前在Google Search里查询的关键字相关的广告,也会投放到其他Google服务的页面里。但是不知道腾讯现在是否也会做这样的广告定向投放,因为在聊天对话窗口的周边是存在广告链接的,QQ完全可以分析每一个用户,每一段对话的聊天记录然后做customized advertising. 再回到刚才淘宝购买记录的问题,S童鞋认为根据我的购买记录来推荐商品还是挺便利的,所以她觉得向淘宝或者其他B2C的平台公开购买数据是可以接受的。但我们一致认为淘宝可以提供更加保护用户隐私的选择,比如在用户每次购买的时候让用户勾选是否同意让淘宝分析此次购买记录。就类似于我们平时使用Visual Studio或者MS Word的时候微软也会询问你是否愿意分享用户体验,如果你勾选不愿意,理论上他就不能分析你的用户数据。但是,这样一来淘宝必然会损失许多的用户数据,接而影响到后端的数据分析和更好的个性化用户推荐等服务。

 

既要保护用户的隐私数据,又要使用这些数据带来更多的分析,提供更好的服务(这些数据的原始目的之一),仍是一个棘手的难题。在当下中国的法治氛围和条件下,也只能依靠互联网大佬们的自律了。

“说白了,隐私不就是想隐藏点龌龊的事么,把好形象摆在外面 ”,“最好的提倡是大家诚实做人么”。以H童鞋和Daniex童鞋的观点作为结束语再好不过了。虽然隐私的细节因人而异,好比我觉得我今天几点起床当然也是隐私,怎么能随便被人拿去广而告之。

 

当我们在亲切友好的氛围下结束对隐私问题的会谈后,我们就一个浙大mm寝室卧谈讨论杨幂整形的事情进行了讨论,强烈谴责了某些程序员把“整形”打成“整型”的做法。最后,我们总结了这次会议,认为它展现了社会主义网民的新风貌,高素质,为我国网络社会主义精神文明建设树立了良好的榜样。

 

 

最后传一张Daniex童鞋的QQ分组,曝光一下他的隐私:

Windows 8 preview

March 8th, 2012

 
 
windows 8 beta测试出来的第二天我就在VMware Workstation 8里折腾了一个,小窥了一番。但在发觉没有啥新鲜特别、激动人心的体验后,就再也没打开把玩过。

 
 

由于又支持PC,又支持Tablet,所以你可以用local user account登录,也可以用windows store的ID登录,然后许多数据就可以在云端储存。其实,这样子有点把我弄晕了。

 
 

Start 界面变成了这般模样,这也是先前大多数win8 系统的宣传画。按Windows键就会跳转到这个页面。

 
 

然后当你点击Desktop,就会跳转到传统而又熟悉的windows桌面。大家有没有发现最明显的不同?
就是“开始”按钮不见了…… 因为Start 变成了一个独立的界面(见上图)。
装完beta版,占用了12G+的硬盘,不知道这在Tablet界属于怎样的水平。当然在如今的PC配置里,系统占用硬盘12G基本没有人再Care了,但在Tablet里开机就发现12G木有了… 会不会让人有坑爹的赶脚…
 
 

打开Store,东西果然少地可怜。看了一部Hugo的Trailer,不知道是因为在虚拟机里跑CPU跟不上的缘故还是Store提供的质量太差,反正画质是挺难让人接受的。

为什么今年没有写年度小结

February 16th, 2012

我搜肠刮肚找了一堆借口,总结如下:

 

1. 主要原因是太忙了。从去年年底开始写一份50多页的Paper,到今天下午总算结束答辩,但还是要继续修改文章。再加上中间去了趟普吉,过了个年,得知一篇Paper被拒,又给另外一篇写了Rebuttal继续等待结果。虽然时间的海绵还没挤干,但剩下的水都拿来嬉戏荒废以防猝死了。

 

2. 清醒的时候不习惯好好思考人生了。过往的磁带不断卡壳难以追忆,当下的思绪也是一团乱麻无法整理。还是驱解忧愁吧。晚来夜色明昭焕,良宵把酒话佳期。再见了,空瓶!

 

Dreams and Reality

January 23rd, 2012

 
 
前天是大年二八,正好之前听说 National Museum of Singapore 有个 Dreams and Reality 的画展。有展出梵高的《Starry Night Over the Rhone》,塞尚的《The Card Players》,卡巴内尔的《The Birth of Venus》,还有几幅莫奈、米勒,毕沙罗,埃德加·德加,居斯塔夫·库尔贝的画。反正学生不收门票,就去围观了一圈。

 
 
 

Light is a thing that cannot be reproduced, but must be represented by something else – by color.
Paul Cezanne
 
 
 


Color is my day-long obsession, joy and torment.
Claude Monet
 
 
 


Like music, the vibrations of colour touch the universal, omnipresent, widespread inner power of nature.
Paul Gaugain
 
 
 


For my part I know nothing with any certainty, but the sight of the stars makes me dream.
Vincent van Gogh
 
 
 
这几个都是印象派,后印象派的大师。一想到他们的画我时常无法欣赏时,就有一阵难以自抑的激动!其实我还是喜欢 Jean-François Millet 的《Le Printemps》,又美又写实,又不写实。

啊普吉岛

January 17th, 2012

 
早在大半年前就买了去普吉岛的Deal,一直排到了上周末才凑出合适的时间去玩。
不过泰国的海岛真是度假天堂!

 


坐船去皮皮岛,这是蔚蓝的 Andaman Sea
 
 

我穿的很蓝吧
 
 


Khai Island 很小的岛,浮潜第一站,水超级清。
 
 


热带鱼就是这么近!
 
 


皮皮岛上卖萌的猫
 
 


每一阵风过,阳光和浪花都相互致意。但没有人,听得懂他们的言语。
 
 


每个地方的海都不一样。
 
 


皮糙肉厚的大象真是太萌了!
 
 


看,人妖们!
 
 

记录 2011· 二 我看过

January 1st, 2012

按时间倒序

下半年:
Mission: Impossible – Ghost Protocol
艋舺
失恋33天
喜剧之王
Reservoir Dogs
那些年,我們一起追的女孩
国产凌凌漆
Real Steel
名探偵コナン 沈黙の15分
The Smurfs
Johnny English Reborn
Horrible Bosses
Cars 2
Legends of the Fall
窃听风云2
Randy Pausch’s Last Lecture
Source Code
Harry Potter and the Deathly Hallows: Part 2
Unthinkable
Tom and Jerry: Shiver Me Whiskers

上半年:
单身男女
Identity
西游记第一百零一回之月光宝盒
告白
Kung Fu Panda 2
Pirates of the Caribbean: On Stranger Tides
Catch Me If You Can
Water for Elephants
西游记大结局之仙履奇缘
Fast Five
此间的少年
Triangle
True Grit
Rio
The Lost Thing
武林外传
Just Go with It
Sherlock
The Prestige
72家租客
大笑江湖
Fight Club
もののけ姫

 

2011 年,我看了 64 部电影,打出 8.1 的平均分。除去十多部滞后的mark,貌似也就平均一个星期看一部的样子吧。

记录 2011· 一 我读过

January 1st, 2012

 

按时间倒序

下半年:
许三观卖血记
嫌疑人X的献身
三体Ⅲ
三体Ⅱ
三体
煮酒探西游
美国宪政历程

 

上半年:
博尔赫斯小说集
事後:本土文化誌
盛世
我怎样毁了我的一生
文明的冲突与世界秩序的重建
男人来自火星 女人来自金星
无人生还
雨季不再来
梦里花落知多少
中国历代政治得失
鲤· 孤独

 

每年都会总结读过的书,今年读得特别少,尤其是下半年,基本算是0阅读量了。但也不能抱怨什么,搞不清到底是什么占据了我的时间,是工作还是其他。从豆瓣把“我读过”贴过来,数出个数字然后无奈地在脑海里翻翻明年的台历,悲观地觉得兴许还不如今年。但这样的问题想了多遍,就不会再叹惋什么了。

旅梦乱随蝴蝶散,离魂渐逐杜鹃飞。

 

啊旧金山· 二

December 24th, 2011

 
12月5日
今天的行程是渔人码头,九曲花街,金门大桥,艺术宫和卡斯特罗区。


Fisherman Wharf
 


从这里看金门大桥
 


红砖房子和加州阳光
 


鳄鱼面包
 


对面是恶魔岛
 


看到海豹了!最喜欢趴在墙上的动物。
 


仔细看,好多海豹,不过听说很臭……
 


是谁说蓝色就等于忧伤,你看看天空和海洋。
 


九曲花街的另一头,我们是从这个坡硬生生爬上来的。
 


从上往下看 Lombard Street
 


远处有 Bay Bridge
 


大冬天没有花的九曲花街
 


Golden Gate Bridge
看着挺普通的金门大桥为什么这么有名呢?传说是因为以前坐船从太平洋来的移民,首先看到的就是这座暗红色的大桥,他们一看到便会兴奋地扔帽子大喊“America”,就像1900船客们里看到自由女神像时候的反应。
 


Palace of Fine Arts
 


两只大白鹅
 


这是天鹅么?碰到特写还害羞了……
 

 


彩虹旗!
 


位于Chinatown的总支部!
 


真和谐~

啊旧金山· 一

December 22nd, 2011

 
12月4日
8:10   从McCarran机场起飞
9:45   到达SFO
12:30  出发去Chinatown吃午饭,吃到了到US后最好吃的一顿中餐……


消防楼梯!
 


远处就是海了。
爬这个坡爬得累死……
 

15:00   去围观Citylight


Jack Kerouac
 


不显眼的书店
 

16:00   接下来去 Museum of Modern Art


downtown的白天
 


downtown的晚上
 


摄像机的进化史
 


达利
 


好多人
 


这行注释很有趣
 


一个人静坐
 

 


正门
 


Union Square

啊大峡谷

December 22nd, 2011

 
12月3日
从拉斯维加斯出发去科罗拉多大峡谷。本来是要去south rim的,但当天早晨被告知由于南边雪下得太大只好去west rim。

 


其实我们是离开内华达去亚利桑那。
 


看到这个场景耳边瞬间就响起了 “take me home, country roads”。

 


沿路都是奇奇怪怪的植物
 


这就是典型的大峡谷的山。
 


西边也下雪了,在山上差点冻死。
 


交三百美刀可以坐直升机围观大峡谷。
 

 


印第安人养的牛马羊,马儿你不冷么?
 


到大峡谷了!
 


悬崖旁没有栏杆,老美真是爱刺激。
 


那一片是在下雨还是下雪呢?
 


底下是科罗拉多河
 


远处雾气昭昭
 


不敢离崖边太近,下面没有小龙女。
 


太阳出来了
 


积雪还没有化
 


阳光下真美。


|2|left