学术研究 | 反垄断法视角下的反用户公开数据抓取行为
- 发布时间:2020-09-20
- 发布者:武汉知识产权研究会
反垄断法视角下的反用户公开数据抓取行为
—以美国hiQ诉LinkedIn案为起点
夏梦妍,蔡祖国
(1.中南财经政法大学知识产权研究中心;2.武汉科技大学文法与经济学院)
摘要
在美国hiQ诉LinkedIn案中,法官对用户公开数据的属性认定与反公开数据抓取行为的反垄断分析存有不合理处。不同于公共数据,用户的公开数据非公共产品,乃个人私有财产。在无明确的数据权属安排下,用户所在平台运营商不拥有用户公开数据的所有权,有权访问的数据抓取第三方也无商业化利用之资格。数据驱动型企业往往为独占数据优势与经济利益,会滥用在相关数据分析市场中的优势力量或支配地位,拒绝与其具有竞争关系的第三方主体抓取数据,从而构成反垄断法意义上的“垄断”。
关键词
反垄断;反用户公开数据抓取;hiQ诉LinkedIn案
二十一世纪是数据经济时代。数据成为生产资料,大数据位列下一个创新、竞争、生产力提高的前沿。Viktor Mayer-Schnberger直言我们正从“金融资本主义”时代迈向“数据资本主义”时代。由谁以及怎样收集、拥有和使用什么样的数据,事关一场根本性变革的方向。用户公开数据作为特殊的生产性资源,具有重要的战略经济意义。大型数据驱动型平台为维持、强化自身的竞争优势,往往会拒绝他人抓取用户的公开数据。这种反用户公开数据抓取行为客观上抑制了社会竞争,破坏了公平竞争秩序,损害了网络用户利益与公共利益。
我国目前主要从反不正当竞争法路径对数据抓取行为进行规制,规制客体仅是网络平台内部数据,而无关反垄断研究视角与用户公开数据。由于互联网平台拒绝其他市场主体抓取数据的行为客观上导致了数据独占这一事实,易造成企业对数据原材料市场的控制,进而形成相关数据衍生商品市场的进入壁垒并排除、限制竞争,损害市场竞争秩序,从而产生垄断法层面的“垄断”忧虑。因此,本文欲以域外反公共数据抓取行为第一案—美国hiQ诉LinkedIn案为出发点,通过检视其司法判断之缺陷,尝试从反垄断法研究进路判断反公开数据抓取行为的垄断可能性。
反用户公开数据抓取行为概述
(一)用户公开数据的私有属性
在大数据领域,私有数据一直都是行业竞争激烈的红海,公开数据更被强调是最有价值的。价值源于特殊,公开数据的价值与其公开性紧密相关。数据公开既是数据流动利用的第一步,也是共享经济发展的根本立足点。
以数据的开放性为标准,可将个人数据分为个人内部数据与个人公开数据。个人内部数据由相关主体完全控制,其他人不可接触。与个人内部数据相对,个人公开数据是网络用户同意对外开放的个人数据。换言之,是用户根据用户协议主动对全网开放开放,且其他人均可以访问的信息。那么,个人公开数据的“全网开放”是否意味着用户个人对该数据的完全“捐献”—成为社会公共产品,因而丧失所有权?是否意味着其他互联网商业主体均可以免费获取相关公开数据,进而完全自主地商业化加工与销售?欲回答这些问题,需从个人公开数据的产品特性与产权归属分析出发。
个人数据原则上归属于个人所有。在肯定个人数据的财产与身份的双重属性下,若不存在用户与网络平台间的数据买卖、转让等数据所有权安排协议,个人数据当然归个人所有。一方面,个人数据的财产属性正在不断强化,并已成为必然趋势。这种财产性不仅体现为个人数据本身的使用价值,还体现为转让价值。当前甚至出现了一种新的商业模式,即服务商从用户处直接有偿购买个人数据后,转售给其他数据需求方变现。这种互联网商业模式建立在个人数据的对价基础上,个人数据的财产价值是隐形的。另一方面,就个人数据的身份属性而言,用户的隐私担忧与日剧增。虽然用户自主选择对外开放个人数据是“自由处分”,但依一般理性人的标准,其范围应限于允许他人访问,而非赞成其他市场主体的商业化盈利使用行为。同时,也应尊重个人用户的意思自治。若用户同意他人对个人信息进行商业化利用,则该商业化使用当属合理。
就用户公开数据的经济属性而言,其既不同于传统的公共产品,也不同于原处于非专有领域的公共信息。经典微观经济学理论在个人产品、公共产品与俱乐部产品的产品分类基础上,用公共产品指代既无排他性又无竞争性的产品和服务。用户公开数据仅具有表象公共性,即具有公共产品非排他性与非竞争性的假象特征。一方面,任何人均可以同时访问用户公开数据,而不能排除他人对相同数据进行查看,符合公共产品的非排他性。另一方面,他人对用户公开数据的利用也不会减损数据的数量与质量,即公共产品的非竞争性。但公开数据的非竞争性与非排他性是由信息产品的非物质性本质决定的。任何数据均具有非竞争性与非物质性,内部数据也一样。通过人为技术保护措施形成的封闭性内部数据,仅具有相对意义上的排他性。一旦外部抓取技术越过原有的技术保护措施,便打破了防止进一步利用数据的物理障碍,可获取相关内部数据。
本质上,用户个人数据的私有属性决定了公开数据的私人性。用户公开数据属于个人数据,为用户个人所有,而非公共产品,为社会所共有。同时,应承认对外开放的个人数据所代表的可访问性。但未经用户明示同意,他人不可无权或越权地商业化利用公开数据。
(二)反用户公开数据抓取行为的垄断忧患
2017年,《经济学人》一篇文章将数据比作“未来的石油”,以形容数据所蕴含的巨经济价值与发展驱动力。数据一旦成为生产要素,便是企业走向数据驱动性商业模式最关键的竞争性要素,对横向或纵向竞争的数据驱动型企业都很重要。数据的巨大经济价值激发了数据驱型企业的大规模需求。除通过自身提供服务获得数据外,各大数据驱动型企业对数据的需求进一步向外围扩展,不仅进行以买卖、共享为特征的数据交易,还直接抓取其他平台的用户数据,特别是用户的公开数据。
资源利用的前提在于占有。平台的数据独占主要表现为对数据的秘而不宣与独家控制、分析和使用。拒绝数据抓取是平台数据独占的结果。掌握了海量数据的大型数据驱动型平台为保持、增强其竞争优势,通常会拒绝其他平台抓取自我平台上的数据。有学者注意到了数据的秘而不宣导致所导致的数据垄断,并指出竞争法视角下数据垄断主要有三种:(1)数据造成的进入性壁垒或扩张性壁垒;(2)数据资本或数据服务的市场支配地位并滥用:(3)数据寡头的垄断协议。Maurice Stucke和Allen Grunes教授也指出,数据驱动型大型企业的垄断做法不仅会降低对用户数据隐私保护的重视度,阻碍其他能为广大用户提供更安全的隐私保护企业进入,也缺少自身改进服务质量的外来动力。
根据我国反垄断法,市场支配地位是指经营者在相关市场内具有能够控制商品价格、数量或者其他交易条件,或者能够阻碍、影响其他经营者进入相关市场能力的市场地位。滥用市场支配地位,是企业获得支配性市场地位后滥用这种地位,对其他市场主体进行不公平交易或排斥竞争对手的行为。大型数据驱动型平台由于拥有大量用户数据,在相关数据市场拥有核心竞争力,若能阻碍、影响其他经营者进入相关市场,便拥有了反垄断意义上的市场支配地位。也就是说,大型数据驱动型平台通过独占用户数据而拒绝其他企业的抓取,可能扰乱市场竞争秩序,进而构成“滥用市场配地位”的垄断行为。
此前,国内反数据抓取行为主要集中于平台内部数据,而不涉用户的公开数据。也仅通过反不正当法进行规制,而未扩展到反垄断法,如2016年新浪微博诉脉脉不正当竞争案和大众点评诉百度不正当竞争案,2017年深圳谷米诉武汉元光不正当竞争纠纷案。此三案确立了三个基本观点:(1)企业对于其收集积累的数据享有竞争法意义上的财产权利。(2)数据的财产权利的行使应当受制于数据主体的人身权利。也就是说,对用户的个人数据进行共享和授权使用须获得用户的事前同意和授权。(3)搭便车行为受到规制。其中,数据的财产性利用受制于数据身份属性的判断与本文关于用户公开数据属性的分析一致。
由于国内缺乏对反公共数据抓取行为的关注,也未出现相关垄断纠纷,域外案件可为该问题的判断提供新视角。在美国hiQ诉LinkedIn案中,法官关于公开数据法律属性的判断与反公开数据抓取行为垄断性的分析值得批判性思考。
美国hiQ诉LinkedIn案及其判决问题
(一)基本案情
本案被告LinkedIn公司是微软旗下一家专注于商业客户的社交网络运营商,为全球最大的职业社交网站。当用户在网站上创建个人资料时,可以选择各种不同级别的隐私保护,若选择“整个公众可见”,包括Google等搜索引擎在内的任何人都可以在线查看他们的个人资料,即全网可见。本案原告hiQ公司则是一家有偿销售相关人力资源信息的专业数据服务提供商。其主要通过相关软件与技术手段从LinkedIn页面中刮取或自动收集获得用户公开的职业数据,在对LinkedIn用户的公开职业数据进行深度、专业化的分析与处理后,通过销售相应高端定制化的职业数据报告盈利。
2012年5月23日,LinkedIn公司在多年容忍hiQ访问和抓取自己网站的数据后,告知hiQ公司其未经同意抓取LinkedIn用户公开职业数据的行为其违反《美国计算机欺诈和滥用法案》(以下简称“CFAA”),并切断了hiQ公司对LinkedIn页面的访问可能。在未能协商一致的情况下,hiQ向加利福利亚北部地区法院起诉了LinkedIn公司,诉称LinkedIn公司阻止其访问用户公开数据的行为是将数据私有财产化的不公平商业行为,违反了托拉斯法与加州反不正当竞争法。
此案的诉争关键有二:(1)hiQ公司的公开数据抓取行为是否合法;(2)LinkedIn公司的反公共数据抓取行为是否构成垄断。hiQ公司的公开数据抓取行为与LinkedIn公司的反公开数据抓取行为作为同一硬币的正反两面,核心在于公开数据的法律属性判断与反公开数据抓取行为的垄断性分析。
(二)法院观点
1. hiQ公司访问公开数据行为具有合理性
公开数据抓取行为合理性的判断前提在于“访问合法”与“抓取合法”。有权访问是有权抓取的隐藏性基础门槛,只有有权访问,才能深入到下一层的抓取合法判断。如果前置性的访问是非法的,那么数据抓取行为便无须讨论,可直接进行违法判断。
首先,法官依据CFAA第1030条第一款第二项第三目的规定,以Musacchio诉美国案为依据,认定非法访问的“非法”包括两种情形:无权与不正当使用权限。后又遵循美国诉Nosa ǁ案与Facebook诉Power Ventures案的司法判断,认为非法访问中的“访问”仅指身份、资格,而非具体的访问方式。也就是说,网站的授权访问只意味着对访问身份的认可,而不能限制具体的访问方式。访问资格说通过控制身份验证的过程达到了保护私人数据的目的。
其次,确定了公开数据的公共属性。依据物理空间类比原则,现实物理空间中,未经许可进入私人住宅的行为通常是违法的的,但商店在白天营业时开店门意味着“欢迎光临”—任何人均可进入商店。将观察视角从现实物理空间转移到互联网空间。本案法官认为,由于网络通常被认为是天生开放的,那么任何人在不需要认证的情况下即可访问用户选择公开的信息。可以理解为:公开数据的全网开放决定了任何人都拥有访问的资格,而无须获得用户的事先授权。所以,hiQ公司在未经同意的情况下,对LinkedIn用户公开职业数据的访问是合法的。
此外,法官并未分析iQ公司通过技术手段主动抓取LinkedIn用户公开数据行为的合理性。因为抓取行为的合理性和反抓取行为的违法性为同一问题,只要确定了反公开数据抓取行为的垄断性与否,便可知公开数据抓取行为合理性之有无。
2. LinkedIn公司反公开数据抓取行为构成垄断
第一,LinkedIn公司行为违反了反托拉斯法,属于市场主体利用垄断权力阻止竞争或获得竞争优势,或摧毁竞争对手的垄断行为。hiQ公司作为一家人力资源数据分析型企业,完全由LinkedIn用户的职业信息数据驱动。LinkedIn用户主动公开的职业数据成为维持hiQ公司生存的必须资源。而LinkedIn终止hiQ对其用户公开数据访问,在很大程度上是希望通过独占、控制公开数据以发展与hiQ产品直接竞争的数据分析产品。LinkedIn公司利用其在专业网络市场的主导地位,确保了自己在数据分析市场中获得不合理的先发竞争优势。
第二,社会利益衡量。LinkedIn反公开数据抓取行为不仅可能造成相关数据分析服务提供商破产,被驱逐出局的威胁足以造成不可挽回的伤害。还会阻止他人以任何理由访问其网站上公开信息,从而对公众话语和自由流动构成威胁,损害公众福利。
(三)评析
本案的判决亮点是将非法访问限定在访问资格的认证必要性上,而未采取访问方式说,从而阻止了非法访问认定的泛化。但Edward M. Chen法官关于公开数据的公共属性定性与反公开数据抓取行为的垄断性分析存在可讨论的空间。
1.公开数据非属公共产品
hiQ诉LinkedIn案的特殊性在于客体的公开性。本案法官依据网络公共空间理论,认为被公开后的数据就存于公共空间中,任何人均可访问、利用。与其以公共空间形容公开数据,毋宁说法官本意在于将公开数据视为公共产品,为全社会免费利用。虽然前有美国最高法的理性判断—互联网已成为现代公共广场,但用户的公开数据是一种实实在在的信息符号,是无形物,是虚拟财产,而非现代公共广场中的开放共享空间。用户公开数据不是公共产品,具有私人产品属性。在无明确的相反安排下,个人数据的“全网开放”应限于他人的访问、查看,而非商业性利用。
法官还缺乏对网络用户心理需求的尊重。LinkedIn作为一个商业社交平台,其个人用户基本为职场人士(排除LinkedIn公司相关数据信息产品的购买客户),用户的个人资料相当于个人工作履历,个人用户的需求是为了寻找到更适合自己的雇主。但hiQ公司的主营产品却将LinkedIn用户的求职信息经过处理后,销售给LinkedIn用户的现雇主,从而让LinkedIn用户的现雇主对己方人力资源状况有更为明晰的了解。作为一个理性的市场人,谁也不愿自己的求职动态被现任雇主瞄准,从而遭受可能的报复与损害。hiQ公司抓取LinkedIn用户的公开个人数据进行商业化利用是违背用户公开数据的本意与初衷的,具有不合理性。
2.反公开数据抓取行为垄断性判断逻辑不清
反垄断法分析进路下,对企业滥用市场支配地位的认定主要从两方面进行:(1)企业是否在相关市场形成市场支配地位;(2)拥有市场支配地位的企业是否滥用了该市场支配地位,导致排除、限制竞争等损害市场竞争秩序的结果。分析市场主体是否滥用市场支配地位的前提在于对相关市场及市场支配地位的界定。
但本案中,法官虽也是从以上两方面进行的认定,但模糊化处理了具体因素的认定。在缺失对相关市场的界定前提下,对被告市场支配地位的认识源于其在免费市场(商务社交网络)的存在感,对被告滥用市场支配地位的判断受原告对被告的完全业务依赖的影响。直接以“LinkedIn公司是全球最大商务社交网络,在专业网络市场拥有主导地位”为由,认定被告具有支配地位。
二十一世纪是数据经济时代。数据成为生产资料,大数据位列下一个创新、竞争、生产力提高的前沿。Viktor Mayer-Schnberger直言我们正从“金融资本主义”时代迈向“数据资本主义”时代。由谁以及怎样收集、拥有和使用什么样的数据,事关一场根本性变革的方向。用户公开数据作为特殊的生产性资源,具有重要的战略经济意义。大型数据驱动型平台为维持、强化自身的竞争优势,往往会拒绝他人抓取用户的公开数据。这种反用户公开数据抓取行为客观上抑制了社会竞争,破坏了公平竞争秩序,损害了网络用户利益与公共利益。
我国目前主要从反不正当竞争法路径对数据抓取行为进行规制,规制客体仅是网络平台内部数据,而无关反垄断研究视角与用户公开数据。由于互联网平台拒绝其他市场主体抓取数据的行为客观上导致了数据独占这一事实,易造成企业对数据原材料市场的控制,进而形成相关数据衍生商品市场的进入壁垒并排除、限制竞争,损害市场竞争秩序,从而产生垄断法层面的“垄断”忧虑。因此,本文欲以域外反公共数据抓取行为第一案—美国hiQ诉LinkedIn案为出发点,通过检视其司法判断之缺陷,尝试从反垄断法研究进路判断反公开数据抓取行为的垄断可能性。
反用户公开数据抓取行为的垄断性分析
hiQ诉LinkedIn案的模糊判断表明了反垄断法对大数据经济发展中各类新型商业行为的不适应。数据驱动型商业模式下,反垄断法不仅要明确数据的产权归属问题,还要回应互联网平台所具有的双边市场、交叉网络外部性、非对称性价格结构、数据优势跨界传导等经济特征给传统反垄断法理论带来的冲击。但传统反垄断法理论目前并不过时,基本的反垄断分析方法对反用户公开数据行为问题依然具有可适用性。
小结 参考文献