编者按:本文来自微信公众号“赵继成频道”(ID:zhaojcpd),作者:赵继成频道,36氪经授权发布。
这几天,上海车展上特斯拉车主维权事件备受关注。
通过媒体报道我们知道,双方矛盾激化最核心的分歧,竟然是车主主张特斯拉提供事发前30分钟的行驶数据,而特斯拉坚持不提供。最后在舆论压力和监管部门的介入下,特斯拉提供了相关数据,并且向媒体公布,但车主方又认为公之于众侵害了隐私权。
车主的行驶数据所有权到底归谁,车主还是特斯拉公司?特斯拉该不该向车主提供?作为一起社会关注度极高的公众事件,特斯拉该不该将相关信息向媒体公开?
这些都是数字化时代带来的新问题、新挑战,也是学术研究的“无人区”,或者说是还没有达成广泛共识、仍然存在争议的领域。
4月20日,博鳌亚洲论坛期间,全球开放型研究机构罗汉堂发布了一份《了解大数据:数字时代的数据和隐私》报告,联合海内外知名学者,就数字时代的数据和隐私问题进行了研究,并得出了一些“不太一样”的结论。我第一时间阅读了这份77页的报告,发现很有价值和启发。
罗汉堂研究的问题、研究的方法和研究的成果,我总结有4个特点:
一研究的命题都是数字化时代最前沿的问题,或者说最关乎痛痒、关注度最高的话题;二研究的方法不是“黑板经济学”,而是依托企业数字化生态资源,从实战中来,研究真问题,推演真结论;三汇聚了海内外顶级的专家学者资源,有跨文化、跨学科研究、交流、碰撞的优势;四结论往往与人们惯常印象中的“不太一样”。
这份数据和隐私报告也体现了这4个特点。
首先是研究真问题。
这份报告开宗明义,在序言中就明确了要研究三个问题——如何在大数据时代保护个人隐私?数据使用带来的福利所有权归谁所有,该如何分配以及如何理解数据使用产生的风险?大数据应用是否会妨碍竞争,损害消费者和整个社会的利益?
这三个问题确实是关注度极高的三个真问题。围绕着数字时代的数据和隐私,还有太多的问题没有理清,还缺乏研究和看待问题的方法论和工具,甚至基本的概念都还缺乏共识,所以推进这个领域的研究,既是研究人员的责任所在,也是真价值的体现。
其次,这份报告中的许多研究方法和结论,不是“黑板经济学”,而是“用大数据研究大数据”,尤其是借助支付宝平台的海量数据和用户,进行实证研究。
举一个例子,报告第2章提到的隐私悖论,罗汉堂不是简单的采用国外的研究数据和结论,而是利用支付宝数据,进行了至今规模最大的关于隐私决策的大数据研究。支付宝活跃用户超过10亿,并且平台上有几百万个小程序,要使用这些小程序,用户要许可分享自己的个人数据,也可以通过撤销许可退出。
罗汉堂研究了小程序用户的授权和退出行为,观察用户的实际决策,发现了很多有价值的、细颗粒度的规律。比如男性、教育水平高和年轻用户分享个人信息的整体意愿更高,拥有本科(以上)学历的用户接受小程序的意愿更高等等。
这就引出了罗汉堂研究的第三个特点,就是罗汉堂的实证研究,相比学院派的研究,总是能得出一些“不太一样”的发现和结论。
如刚才提到的拥有本科(以上)学历的用户接受小程序的意愿更高,与通常的猜测——不了解隐私泄露严重后果的用户更容易分享信息——恰恰相反。而这一点为隐私悖论的真实存在提供了一个有说服力的支持。
最后一点,这份报告的作者群体,同样体现了罗汉堂一贯的高水准、跨学科、跨国别的特点。研究人员既有罗汉堂内部的专家团队,也有来自哥伦比亚大学、麻省理工学院、哈佛大学、斯坦福大学、伦敦政治经济学院等名校的一流学者,以及来自国际货币基金组织的专家。
要讨论数字时代的数据与隐私问题,我认为有一个前提命题是需要首先去研究的,那就是数据分享和流动的价值究竟是什么。
回顾历史,在印第安人的时代,人们通过燃烧木头来取暖、获取能量,同时来传递信号,木头就是当时的主要能量来源;到了200年前的工业革命时代,煤炭和化石燃料成为核心的能量来源。
今天数字化时代,数据已经成为核心的能量来源,而且相比木头、煤炭、石油,数据是非排他性的,不会说你用了我就没有了,而且是只有使用起来才有价值,用的人越多越有价值,并且在数据的交换与流动中能创造新的价值。
这种价值可以从三个维度来看:连接,决策和信任。数字化连接让人们进行信息分享与协作的水平达到了前所未有的高度,比如传统线下贸易最多辐射10公里半径 ,淘宝买卖双方平均购物距离接近1000公里;数据分享能够优化决策,信息流算法推荐已经极为寻常,电商也越来越多使用推荐系统帮助消费者更快触达想要的产品,帮助商家增收;数据分享还能够建立信任,比如电商上的商家都有评分,滴滴司机也有评分,这些都是数据建立的新信用体系。
认识到数据分享和流动的价值后,我们再来讨论隐私风险问题。报告中提到了两个有价值的概念、框架,或者叫切入口、方法论。一个是上文提到的隐私悖论,一个是数据演算。
这两个概念的价值,就是提供了一个讨论问题很好的“入口”,通过这个“入口”,可以推演出许多有价值的结论。
先说隐私悖论。
正如报告第2章所用的题目“揭秘隐私悖论:一个权衡的视角”,隐私悖论是讨论隐私保护关键问题的一个重要视角。比如,隐私保护到底什么程度算是足够的?人们是不是愿意为了保护隐私,而真的愿意牺牲自由和福利?能不能通过政策上的、技术上的、规则上的设计,既保护隐私,又能扩大公众和整个社会的福利?
这就要先从隐私悖论这个词说起。简单的说,就是在隐私保护这个问题上,人们往往嘴上说的和实际行动存在矛盾或者叫悖论。如果你要问消费者,绝大多数人都会说自己非常在意隐私,但你要是看行动,会发现大多数人常常在免费的甚至很少补偿的情况下,分享了自己的个人信息。
这种言行不一,不光在中国有,而是一个全球性现象。Eurobarometer调查显示,欧盟地区67%的公众担忧自己在互联网上无法控制个人信息,但同时越来越多的人承认分享个人信息的必要性;Athey等发现,大多数参加实验的人愿意用一块比萨,就交换自己朋友的邮件信息。
罗汉堂的实证研究发现,即便在用户有自主选择权的情况下,大部分消费者还是会选择分享一定的个人信息,从而享受新的数字服务。数据显示,支付宝上不同类型消费者小程序的授权率达到64%~86%,平均授权率超过了75%。而且,小程序的整体退出率非常低,2016年到2019年每月只有1.2‰的退出率,这意味着人们并没有后悔自己的选择。
隐私悖论的真实存在,为我们看待、分析和解决隐私问题,提供了一个关键的实证基础——一方面要考虑消费者对隐私的担忧,另一方面也要考虑到消费者对于分享的真实需求,用更加整体性的分析框架,更加全面、平衡的来看待数据分享带来的福利以及隐私风险。
再来说说数据演算。
罗汉堂提出数据演算这个整体性框架,一个很重要的原因是,大家对大数据的很多讨论,并没有弄清楚大数据的本质和我们实际面临的权衡究竟是什么。
这份报告提出了一个简单的数据三角模型,围绕着大数据进行了角色区分:数据主体,数据生产者和数据使用。数据主体是指产生数据的各方,比如支付宝上的消费者;数据生产者是指收集、处理、存储或分发数据的各方,比如特斯拉维权事件中的特斯拉公司;数据使用是指在现实生活中产生、处理和利用数据的各种场景。
这种角色区分的好处,是方便我们讨论和理清数据和隐私保护的所有权、责任方。比如说,车主是创造数据的人,但记录、保管、利用数据的却是特斯拉公司,如果没有特斯拉公司对数据的记录和保管,靠车主个人一般是无法生产、记录和保管行驶数据的,对数据进行清洗和利用就更难了。所以,如果我们把数据的所有权单一的赋予数据主体,也就是车主,并不科学,而且也不利于数据的利用。
对此,罗汉堂提出,“有意义且可持续的方法,并非通过单一所有权来锁定数据,而是向所有能够为有用数据的产生和共享作出贡献的参与者提供激励,同时保护他们的隐私和安全。”
而且,鉴于数据的价值往往是在使用的过程当中才会产生,并且通过恰当的机制设计和先进的技术,有可能实现风险和收益之间的平衡,所以,数字时代的关键挑战不是实现一个非此即彼的绝对目标,而是找到一块中间地带,使消费者既在数字革命中获益,又能最大限度的减少隐私和安全风险。
通过上文提到的数据演算整体性框架,报告第6章用了一整个章节的篇幅,讨论了数据治理的问题,指出大数据的兴起催生了以技术和数据为驱动力的全新商业模式,促进了更有活力的竞争,提升了供需匹配颗粒度,促进了市场竞争和创新。
这给我们带来哪些启示呢?我认为有三点:
第一,看问题不要极端化,极端强调隐私保护、极端强调数据所有权归单纯某一方所有,和极端强调公开一样有害;
第二,关于数字化的许多研究,应该从实践出发,从真实的场景研究出发,而不能坐而论道,否则太容易想当然,走极端;
第三,要相信技术的问题往往可以通过技术的方式来解决,随着技术的进步,数据分享与隐私安全不一定不可兼得,对此不必过于悲观。
总之,这是一份“不太一样”的报告,这种“不太一样”,不仅体现在研究方法上,也体现在研究结论上。不管我们是否赞成这份报告得出来的结论,从“真理越辩越明”的角度来看,这份报告无疑是值得重视的。
相关推荐
从特斯拉事件到隐私报告,探寻数据和隐私真相
特斯拉曝出安全Bug:旧零件在二手网站贱卖,上边全是用户隐私数据
特斯拉数据疑泄露,二手车信息组件未清除用户隐私
CCPA等数据隐私保护条例生效,为5家数据隐私初创公司带来利好
是谁,让我们的隐私数据在“裸奔”?
隐私泄露、数据孤岛、数据滥用……「隐私计算」如何解决大数据行业共性挑战?
探寻5G高速下载真相:限速、绑定与谎言
科技公司为用户数据和隐私付费,可能会使情况更糟
在互联网中,我们的隐私数据单价不到一分钱
欧洲隐私数据保护法催生1.3亿美元罚款,通告16万起侵权行为
网址: 从特斯拉事件到隐私报告,探寻数据和隐私真相 http://m.xishuta.com/newsview42319.html