当前位置: 您当前的位置 : 瓯海检察院  ->  法学苑地  -> 正文法学苑地

大数据:应用、冲突、规制

分享到:
发布时间:2018年11月27日 来源:

  徐凡

  2015年5月,阿里巴巴创始人马云贵阳召开的数博会上,围绕大数据与经济社会的关系发表了演讲。演讲中,马云断言未来30年数据将取代石油,成为制造业最强大的能源。上溯到2012年,奥巴马政府启动“大数据研究和发展计划”,将数据视作“未来的新石油”。“一个国家拥有数据资料的规模和解释运用的能力,已成为一个国家的核心资产和国力指标。”[胡世忠:《云端时代杀手级应用:大数据分析》,人民邮电出版社2013年版,第26页]域内外,从国家到企业,普遍关注到大数据潜在的巨大价值,意识到大数据将深刻改变个人、社会乃至国家的生存发展方式。

  一、大数据应用

  (一)大数据涵义

  根据MBA智库百科的解释,大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。数据(data)这个词在拉丁文里是“已知”的意思,也可以理解为“事实”,从词源上可以理解为数据是对事实的一种陈述。笔者认为,大数据(Big Data)就是海量数据,与传统意义上的数据相比,其来源之广泛、形式之宽泛不可同日而语,或言之,大数据是对实在世界的数字描述,是信息数字化的必然结果。以往的数据和数据库系统侧重数与量的记录,直观体现事物发展的过程,或以评估和预测行为结果。要达到这些目的,需要按照事先设定的格式或结构对数据进行收集、整理,这些结构化数据存留在关系数据库内,而数据分析的重点是数据表之间的关联性。传统的结构化数据极大便利了对日常活动的管理,但是局限性明显,如诸多数据库之间相对独立,数据信息被拆分在不同的数据库里,数据分析需要耗费大量时间和资源,整个过程容易因数据失真而出现偏差。为克服传统数据的结构化陷阱,大数据充分利用现代计算机高速运算优势,尤其是云计算在计算资源和数据资源方面的集结能力,使巨量的数据在不断产生、收集的同时被提取、处理、分析,分析结果可以是即时的、“可视化”[数据可视化,主要指的是利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。美国联邦政府意识到数据可视化的战略意义,2004年联邦政府在国土安全部成立了国家可视化分析中心(NVAC),专门推动该项技术在政府部门的应用,特别是在情报分析领域的应用。可视化技术通过数据整合之后形成统一的、多元的数据仓库,再根据用户的需要,重新取出若干数据子集,或构建多维立方体(Clube)进行联机分析,或进行数据挖掘,发现潜在的规律和趋势。]的和系统性的。

  (二)数字化进程

  数据通过记录、分析、重组的方式描述着实在世界,并以量化形式存在,而数字化则是这个过程的催化剂。“数据是对信息数字化的记录,信息是指把数据放置到一定的背景下,对数字进行解释、赋予意义。”[涂子沛:《大数据:正在到来的数据革命》,广西师范大学出版社2012年版,第35页]人类文明发展的过程,实质上就是信息存储和传递方式不断革新、超越的进程。从文字演变为数字,数字化引领新的信息革命,并因此构建出一个数字化的虚拟世界,数字和虚拟共同构成信息时代的基本特征。一是前所未有的实现信息传递的即时性。无论是通讯、社交还是商务等活动,信息即时到达,交流不受时空限制,实时感、沉浸感是数字化时代社会存在的基本状态。二是数字化还实现了虚拟空间的构建。数字化被视为第二次文明革命,不仅在于是信息系统在现实世界中实现巨量、即时传递,更是符号空间、思维空间、感知空间上的巨大跨越。数字化虚拟空间是实在世界的衍生和映射,亦是独立的存在。在虚拟空间,所有参与者的身份映像、空间行为准则都独具特质,为我们观察和解决现实世界问题提供了更多的选择,因与现实的这种关系,数字化虚拟空间也被称为第四维空间。三是数字化不仅是现实世界的反映,还增强我们的现实拓展能力。随着数字化虚拟化技术的深入,人工智能系统、云计算、物联网等应用领域不断呈现新的发展态势,为数字虚拟技术更深介入现实提供可能性。

  数字化的巨大意义是使机器开始“读懂”信息,机器成为信息迅即传递、处理的主要载体。在数字化的推动下,机器不再仅仅是人类肢体能力的延伸,开始拥有“思考能力”而辅助人类的智力劳动。现代计算机是大数据时代的物质基础,计算机被利用于加工、记录巨量信息,这些被存储于计算机介质的信息被称为数据。人类可以利用计算机的帮助将巨量的信息用最集约的方式存储并用最便捷的方式提取应用。有了机器的帮助,人类的智力拓展得到前所未有的进步,尤其是原来视为极其艰巨的大量计算成为可能。2016年6月中国推出的“神威·太湖之光”超级计算机系统运算速度高达十亿亿次,意味着它1分钟的计算量相当于全球72亿人同时用计算器不间断计算32年。计算能力的飞跃促成了大数据时代的来临和广阔的应用前景,并从其诞生之初就显现出无与伦比的优势。

  (三)大数据优势

  1、大数据独具巨量分析的优势。“一旦世界被数据化,就只有你想不到的,没有信息做不到的事情了。”[[英]迈尔﹒舍恩伯格,库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第124页]大数据时代,数据采集的广度和深度前所未有,使现实世界可以被精准分析或“定制”,或言之,大数据的应用“是指一种把现象转变为可制表分析的量化形式的过程”。[[英]迈尔﹒舍恩伯格,库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第104页]大数据通常有以下几个来源:一是传统的数据源,诸如大量经济组织、公共服务部门都存在记录日常活动信息的关系数据库。二是大数据时代大量的非结构化数据,包括网页内容、社交网站、电子邮件、点击数等数据源。“这些数据的格式与结构化数据不一样,数据格式多元且繁杂,却占据全世界所有数据的85%。”[胡世忠:《云端时代杀手级应用:大数据分析》,人民邮电出版社2013年版,第207页]这些数据的最大特点是“杂乱”而无格式,但其中蕴含的能量是极其巨大的。三是实时变动的流动性数据(data in motion)。得益于计算能力、存储能力、图形识别技术的成熟,采集的巨量视频、图片信息被实时存储和处理。丰富的数据来源决定数据巨大的增量,“据IDC出版的研究报告显示,2013年人类产生、复制和消费的数据量达到4.4ZB(Z=10亿T)。而到2020年,数据量将增长10倍,达到44ZB。大数据已经成为当下人类最宝贵的财富。”[百度百家:《2016年,为何是万亿大数据元年》]

  2、大数据具有扁平化、即时性的优势。从横向看,扁平化是大数据的生存形态。小数据时代统计数据需要逐级汇总分析,并且只能得到有限的结果。大数据时代,数据采集、数据处理和数据应用不再束缚于层级关系,借助云计算的动态资源分享,网络的任意节点既可能是数据的采集点,也可以是数据分析中心,既避免了数据失真,也可以大大提高数据使用效率。从纵向看,即时性是指大数据时代数据实现空间、时间上的同步。无论是结构化的数据还是实时变动的流数据,在数据管理和应用各个领域,都不再受到时间限制,实时动态管理已经不再是理想状态而是现实存在。通过数据模型和云计算,我们可以对发生的任何动态精确掌握,“浙江省交通运输厅,在阿里云的帮助下,能够预测出未来1小时内的路况,准确率稳定在91%以上。要知道,浙江全省的高速公路长达1300公里,但是阿里云强大的计算能力,可以在20分钟完成历史数据分析,10秒钟完成实时数据分析。”[百度百家:《2016年,为何是万亿大数据元年》 ]

  3、大数据通过数据挖掘,可以对非关联数据进行深入的关联性分析。大数据发挥如此大的作用,是因为新的大数据系统通过特定算法对数据进行分析,揭示数据当中隐藏的规律和趋势。新的算法可被视为数据挖掘的工具,能从即时或以前的数据中发现新的价值,数据真正意义上成了采掘不尽的资源。微软出版《第四范式》一书,转述了数据库专家格雷(Jim Gray)的一项主张:“科学发展已经走过了‘实验、理论、计算’3个范式,渐渐形成以‘数据’为重点的第4范式。”大数据时代,科学研究运用密集数据技术和流程,进一步提炼、解读数据,以数据代替以往的经验和实验数据积累,尤其是对非关联数据的衍生分析,揭示科学现象和规律。

  (四)大数据应用

  高速网络、大型存储和计算能力共同构成大数据时代的三个因素,手机、智能穿戴设备等移动数据终端的普及则催化了这一进程。2016年被很多前沿科技公司视为大数据应用的落靴之年,阿里云大数据事业部资深总监徐常亮认为:“束缚大数据的技术瓶颈已经被完全打破,数据将从企业的成本中心转变为价值中心,2016年我们将迎来大数据应用的全面落地。”大数据的实际应用涵盖个人空间、商业机构、公共管理部门等几乎所有领域,而且这些数据往往跨界使用,数据价值被不断发现。

  1、大数据在私人领域的作用毋庸置疑。以日常生活中最常用的手机导航为例,我们得到道路指引服务,通过服务器对反馈数据的分析,还可以获得实时的道路交通状况信息,及时规避交通拥堵和施工路段。与早先的专业导航仪不同,安装在移动网络终端的导航软件数据交流是互动双向的,终端用户在得到数据服务的同时,也是数据的采集端,使导航数据实时和精确。

  2、大数据的商业应用价值越来越得到广泛认同。如手机APP软件运营商的获利不在于软件使用本身,而是通过第三方服务和数据资源。终端客户在获得服务的同时,终端使用者的个人信息也被软件运营商获取,包括日常的出行路线、滞留地点、滞留时间等数据,同时,软件界面插入各类消费服务的链接,终端用户可以便捷获得商家服务,而软件运营商从入驻商家获得收益,并进一步获取终端客户的消费习惯、消费能力等数据,这些数据无疑是最有价值的商业资源。

  3、大数据在司法、安全领域的应用前景同样广阔。进入二十一世纪,恐怖主义活动和严重暴力犯罪有愈演愈烈的趋势,安全领域面临更大的挑战。各国都采用了各种手段预防和打击这类极端犯罪,利用新技术进行大数据分析可以提前觉察犯罪活动的发送。

  (1)图形识别、流计算等新技术应用。“图形识别是更大的领域人工智能(AI)的一个方面。图形识别处理高度变化的输入数据,如音频、照片和视频。”[[美]麦考密克:《改变未来的九大算法》,官策译,中信出版社2013年版,第125页]图形识别与流计算与传统的数据查询的根本区别是,数据查询是根据查询指令完成工作,而图形识别通过采集影像等信息经数字化处理后的数据流触发计算引擎来进行数据分析,数据存储前就能完成分析工作。9.11事件后,美国政府加强了机场港口等地的安保工作,“采集旅客的影像后,计算引擎将影像转成可判读信息如旅客脸部特征点(眼口鼻的位置和距离黑斑痣等),把这些特征点和安检数据库中的数据比对。”[胡世忠:《云端时代杀手级应用:大数据分析》,人民邮电出版社2013年版,第214页]在机场港口等人流密集地是各类极端事件发生的高发地,只有高效完成图像的数字化和实时研判才有实际意义,任何的延迟都可能导致严重后果。

  (2)文本分析技术。恐怖主义活动和严重暴力犯罪有利用网络传播信息的趋势,尤其是一些社交网站方便了犯罪分子的煽动和联络。2016年著名社交网站推特(Twitter)被巴黎和布鲁塞尔恐袭案受害者家属告上法庭,他们认为推特未采取足够措施制止激进分子在网站上散布恐怖主义信息,推特应负有“帮助及教唆(aiding and abetting)”恐怖主义的责任。事实上,社交网站亦是双刃剑,安全部门可以利用大数据的文本分析技术从社交平台上获取反恐情报,监控可疑活动。文本分析就是将社交网上的帖子、电子邮件等文本内容通过数字偶合等技术提取有效信息的技术手段。文本分析首先通过关键词提取信息摘要,并分析文件内容对信息进行识别和分类,最后才进行更复杂的情绪分析(计算系统从文字数据中可以甄别出敏感的情绪信息),而这可以发现潜藏在海量信息中的危险信号。

  (3)大数据的预测分析。在犯罪预测、预防方面,大数据的作用将发挥的淋漓尽致。数据管理是现代警务的重要支持,布雷特在纽约警局进行的数据管理实践获得巨大成功被视为警务数据管理的范例。布雷特要求开发一套电子版的犯罪预测图表(Compstar),利用数据的精细化管理和微观管理的优势,预测和预防犯罪的发生。之所以推行这种警务管理模式,是因为布雷特极端认同“破窗理论”,即小的违法行为被姑息纵容,就会被模仿和放大,最后蔓延为成片的犯罪行为。他要求,即使对微小的违法投诉,警方都必须出警做好详细的记录,深究警情发生的原因并设法解决问题。每次出警无论案件大小和案情轻重都纳入数据图表,每次出警记录都在地图所在位置用“圆点”标注。这样做的好处是,每次警情处置都在犯罪地图上直观体现,而且通过警情延时分析,可以评判该点警方行动的有效性,只有当那些代表犯罪的“圆点”逐渐消失而不是转移到另一个区域,才能被肯定成效。“数据收集和数据分析必须成为基层警务部门的一种文化,这种文化代表着基层警务部门一种管理哲学的改变。”[涂子沛:《大数据:正在到来的数据革命》,广西师范大学出版社出版2012年版,第82页]

  二、大数据冲突

  大数据和任何科技进步一样,都有其两面性。数据不仅仅是计量和记录人类活动,通过数据关联、数据挖掘,获得生命、产生智能、散发活力和光彩。大数据催生社会发展的新领域、新视界,但是又对原有社会关系、社会体系产生冲击,现实世界的矛盾和冲突在数字世界以更清晰、更尖锐的方式呈现。

  (一)在国家层面上,不对等关系是主要的法律风险。

  先行国家已经将大数据上升到国家战略的重要地位,在数字化的虚拟空间里,有关数据权的争夺,不仅意味着国家竞争力的消长,还可能对主权独立、民族自决产生影响。民族国家的形成,是基于共同的地域空间、经济生活、文化活动,这些天然的联系在数字空间都被打破。“虚拟的外壳取代了想象中的苍穹天,随着电子通讯系统的发展,距离的消除已经有效地削弱了权力和消费的中心。”[[德]斯洛特·戴克:《资本的内部:全球化的哲学理论》,常晅等译,社会科学文献出版社2014年版,第215页]世界从来未有如此接近,各种联系沟通从未如此简洁,但距离感的消失并没有消除彼此间的疑虑和不安。当代国家间关系建立在法律对等的基础上,但是在大数据领域,这种对等远未形成,围绕大数据主导权、大数据安全与主权的冲突无法避免。欧美发达国家凭借在信息技术上的领先地位获取数据优势,进而获得战略优势。

  围绕的数据安全发生的国家间的法律冲突,是因为大数据的巨大价值决定的。由于数据量足够庞大,通过数据挖掘可以分析出数据间的潜在联系,进而得到需要的情报。“数据审核往往会产生‘1+1﹥2’的效果。两组分别貌似安全的数据,一旦整合相联,可能会产生意想不到的结果,对国家的安全产生威胁。”[涂子沛:《大数据:正在到来的数据革命》,广西师范大学出版社2012年7月版,第205页]单一的数据泄露可能不会造成危害,但只要数据来源足够多,将可以对一个国家的情况进行深度情报分析。“网络是无国界的,但是信息是有国别的,从这个角度看,现在很多信息产品都难言安全”[新华网:《政府采购为何对Win8说不》]当前,更多的信息产品加入到工作学习中来,数据泄露的风险呈几何级增长,数据安全形势将更加紧迫。2013年德国的《明镜》周刊曝光了一份美国国家安全局(NSA)的文档,文件中称NSA在苹果系列产品中植入后台软件,这些软件的功能强大,可以拦截短信和获取手机联系人,并在用户未察觉情况下启动手机麦克风和摄像头获取用户周边的影像声音。斯诺登还披露,苹果手机电池无法自行卸载,因此在关机状态下后台硬件仍能运行,并继续发送手机定位和通讯内容数据。

  (二)在社会层面上,大数据冲突体现在数据的知识产权和数据再利用两个方面的法律风险。

  我们进入信息时代,数据分享、数据共享成为时代特征,大数据能不能作为知识产权保护的对象,在法律上存在争议。一是大数据的边际成本降低、智力持续付出减少。数据采集是个长期、持续的过程,借助计算机和网络,数据采集将越来越自动化,更多数据的收集、存储进而处理、分析所支出的时间、经济成本大大降低,甚至不需要智力的继续付出。二是数据来源对支持大数据知识产权存在疑虑。从目前情况看,数据采集还缺乏足够的法理支持,在使用信息产品时,公众往往在“不太知情”的情况下被收集了大量的个人信息。小数据时代,数据层层统计可以通过授权和明示来保证其正当性,而大数据时代已经不再现实,数据来源和数据形式和巨大的数据处理量已经使任何明确授权的努力不切实际。因此,从获取数据的边际成本还是数据来源正当性,数据拥有者独享大数据的立场总是要受到质疑的,而无偿的共享数据将助长“搭便车”的行为,也不利于社会对大数据的投入。

  数据再利用面对法律冲突。在大数据时代,数据的价值主要体现在未来的潜在用途,这就像是可以无数次挖掘的金矿,而不像矿物资源因开采而枯竭。“只要拥有了数据分析的工具(统计学和算法)以及必须的设备(信息处理器和存储器),我们就可以在更多领域、更快,更大规模地进行数据处理。”[[英]迈尔﹒舍恩伯格,库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第125页]数据分析、数据挖掘可以使我们从原来的数据中发现新价值,再关联到其它数据时,这种价值可以倍增。数据再利用的典型例子是在互联网的搜索领域,用户使用搜索引擎查找信息,大量的搜索关键词和搜索点击量就可以分析用户的喜好、关注点、行为习惯等信息,这些数据可以为商家的精准营销提供支持。但是公众对自己有关数据被再次使用往往毫不知情,如信息产品里各类软件大量地收集我们的数据,虽然软件加载前会告知运营商将采集我们的定位信息、机器识别码、通话记录、通讯录等数据,有些数据与软件功能本身毫无关联,甚至对我们存在潜在的隐患,但为得到软件服务,我们通常会选择忽略这些要求。这些数据如何被使用或再次利用,数据保留的时间等情况我们无从知晓和掌控,而且很可能被使用到与我们初衷相背的情景,因此,明确大数据的法律定义和数据使用规则,尤其对数据的再次使用进行法律规制殊为必要。

  (三)在个人层面上,冲突主要体现在大数据时代个人隐私和自由选择意志的法律保障。

  所谓隐私,是指个人不愿为他人公开或知悉的秘密,包括个人的健康状况、经济活动、社交关系等等一切只要涉及个人隐私的内容。在传统社会,只要有足够的注意,保护个人隐私还是能够做到的,大数据的应用,使保护个人隐私变成难以实现的任务。“而今天,即使是最无害的数据,只要被数据收集器采集到足够的量,也会暴露出个人身份。匿名化或者单纯隐藏已不再适用。”[[英]迈尔﹒舍恩伯格,库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第242页]个人数据资料分散在不同的网站,资料是碎片化、看似无害的,但是大数据可以通过联机分析把不同网站的信息整合后,“还原”出个人的完整资料。公众在不同场合输入的数据不断沉淀,而对这些个人数据保护的法律规范远未形成,甚至缺乏最基本的技术规则,“在关联数据库和数字高速公路的这个年代里个人应该怎样来保护自己,几乎看不到什么文字材料。”[[美]罗森诺:《网络法:关于因特网的法律》,张皋彤等译,中国政法大学出版社2003年版,第217页]

  大数据对个人的自由选择意志也是一种挑战。大数据带给我们的便利的同时,反而约束了我们的自由选择,这个结论让我们始料不及。一是我们的数据自主权被忽视。因为数据包含个人信息,而数据采集范围越广,挖掘越深,价值当然越大,而且大数据价值不仅体现在原本的用途,更多源于它的再次利用,这就吸引了对数据汲取的巨大动力和惯性。二是大数据的“记录”和预测可能使个人被动打上标签和为未发生的事情负责。大数据预测的准确性越来越高,甚至能够预测将来行为的发生,但我们过多依赖大数据的预测将产生消极的作用。大数据使公共机构和其他组织获得关乎个人的数字记录,如失信、失约记录一旦产生而没有严格时间限制和救济手段,这些记录会成为“永久记忆”,使个人被打上不当的标签。这些预设性的标签一旦产生,将对个人选择职业规划、接受商业服务、获取融资资格等社会活动产生不可预估的影响。另外,即使大数据的预测准确度很高,能阻止某些不利事情的发生,但忽视了个人的主观能动和自我选择,这与科学伦理和自由意志的主张存在冲突,“人类的未来必须保留部分空间,允许我们按照自己的愿望进行塑造。否则,大数据将会扭曲人类最本质的东西,既理性思维和自由选择。”[[英]迈尔﹒舍恩伯格,库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第242页]

  三、大数据规制

  大数据能产生的力量是如此之大,它既是一种资源,也是一种工具,使得传统的学说很难完全定义。大数据引发的社会关系变革又是如此复杂,面对大数据引起的各个层面的法律风险和冲突,原有的社会规则、法律体系往往只能软弱应对不断出现的新问题、新情况,“我们的法律就像是在甲板上吧嗒吧嗒挣扎的鱼一样,他们拼命的喘着气,因为数字是个截然不同的地方。”[[美]尼葛洛庞蒂:《数字化生存》,胡冰、范海燕译,海南出版社1997年版,第34页]数据科学的技术权威维克托·迈尔·舍恩伯格指出,再对原有规范的修修补补已经满足不了需要,也不足以抑制大数据带来的风险,我们需要全新的制度规范。

  (一)立法规范

  美国在大数据方面的立法经验非常值得我们借鉴。英美法系的法律渊源既包括各种制定法,也包括判例,而美国在立法的原则和灵活性方面能较好的兼顾。美国法律完备的表现之一是在新领域善于利用法律工具推动新事物发展,在以往特定领域的专门立法的成功经验比比皆是。美国作为互联网和计算机技术最早发端,且是大数据应用最早最充分的国家,非常重视有关大数据应用的立法。世纪初以来,美国先后通过近百个法案法规,就数据的采集、发布、使用和监管等环节制定具体细致的规定,有些规则制定具有一定超前性。更重要的是,这些法规制定后并非一成不变,公民和社会组织可以通过法律诉讼再以判例形式对立法进行修缮,这就解决了立法紧迫性和立法严密的矛盾。结合我们的立法传统和立法背景,可以从几个方面完善大数据立法。

  1、加强在大数据领域的专门立法。与大数据有关的立法活动已经有很大的进展,如《刑法修正案》七、九进一步明确非法获取公民个人信息、非法获取计算机信息系统数据、破坏计算机信息系统等有关数据安全犯罪的刑事责任。2017年6月1日起施行的《中华人民共和国网络安全法》对网络和大数据安全提供了更严密的法律保障,明确部门职责、经营者责任,更是提出进公共数据资源开放、国家和行业标准制定等方面的初设方案。但就大数据超常规发展的现状看,大数据将是改变社会规则的“黑天鹅”,目前大数据在立法范围、立法强度、立法预见性方面难与其地位、作用和意义相适应。首先,大数据立法要厘清大数据的内涵和外延。大数据应该是通过数字化后,由现代计算机以一定数学模式记录的所有现实社会信息,其立法需要涵盖大数据所涉及的行为以及行为可能导致的影响。其次,立法强度需要与大数据的发展相一致。从既有规范看,只有破坏计算机信息系统且后果特别严重的犯罪才明文处五年以上有期徒刑,而对内部人员泄露数据等涉及大数据安全的行为的处罚力度偏弱。另外,对个人数据权的保护还不充分。如《网络安全法》规定:网络运营者不得收集与其提供的服务无关的个人信息,不得违反法律、行政法规的规定和双方的约定收集、使用个人信息,并应当依照法律、行政法规的规定和与用户的约定,处理其保存的个人信息。本法首次就个人数据信息有了较为明确的规定,但是对运营商所要承担的义务和责任还是不很清晰。1995年欧盟通过“保护个人享有的与个人数据处理有关的权利以及个人数据自由流动的指令”,慎重保护个人数据的采集和使用。“仅能为特定、明确和合法之目的搜集个人数据、并且仅能持有具有相关性、准确性和时新性之数据的义务……所有数据处理均须具备正当的法律依据。”[[美]罗森诺:《网络法:关于因特网的法律》,张皋彤等译,中国政法大学出版社2003年版,第222页]大数据关切每个人的安全、隐私需要,还将关乎我们的独立人格,对大数据收集和应用以最严格的规范势在必行。再次,立法预见性还有待加强。如当前立法对数据隐私权如何保护、掌握数据的商业机构如何合理应用大数据、如何分级管理大数据等等都需要被认真对待。

  2、以司法实践完善大数据立法。正因为大数据是个迅速发展的新事物,我们对其作用的认知正不断革新,所以,不应继续纠葛于判例法与成文法的森严,以司法实践作为完善立法的补充。可以预见的是,随着大数据的创新利用,数据价值不断被发现,如有关大数据知识产权的纠纷将会出现,而司法实践中如何对大数据知识产权的认定和保护有关的案例将有助于大数据立法的完善。

  3、通过前瞻性研究引领大数据立法。法律无外乎是社会经验的总结,但在大数据立法方面,这种经验做法可能会遇到难题。维克托·迈尔·舍恩伯格对大数据立法的紧迫性有其独到见解:“随着世界开始迈向大数据时代,社会也将经历类似的地壳运动。在改变我们生活和思维方式的同时,大数据早已在推动我们重新考虑最基本的准则,包括怎样鼓励其增长以及怎样遏制其潜在威胁。然而,不同于印刷革命,我们没有几个世纪的时间去慢慢适应,我们也许只有几年时间。”[新华网:《数据治理,如何打造升级版》]目前情况看,我们在网络和大数据方面的立法还是相对滞后的。我们的大数据立法是分散在各个部门法中,并未形成一个严整的体系,立法也往往迟滞与发展形势和司法实践,缺乏前瞻性。从实践情况看,我们的形势不容乐观,一方面为维护大数据的自主权和安全,亟需在立法上进一步扎好法律的藩篱。我们的大数据安全之前几近不设防,而近年发生的几次大数据威胁事件已经敲响警钟,暴露我们在大数据安全规范方面的滞后性。微软操作系统和苹果通讯设备之所以敢于对客户数据信息“强制性”收集,固然与其技术优势有关,更重要的是我们对大数据安全的危机意识和法律规制不到位,直到《网络安全法》颁布使这种状况有了较大。另一方面为促进大数据发展,需要立法上进一步厘清大数据发展的指引规范。大数据立法的目的是要促进大数据的平稳发展,大数据在公共管理、商业运营方面的价值已经被发现,进而对个人的健康发展方面也会产生巨大的作用,因此有必要对大数据的发展制定指引规范,如促进大数据分享、共享才能使大数据价值最大化。正如美国经济学家曼柯·奥尔逊在《集体行动的逻辑:公共利益和团体理论》(The Logic of Collective Action Public Goods and the Theory of Groups)一书中主张的:“需要建立合适的激励机制,奖励为共同利益作出贡献的组织与个人,而限制和惩罚不愿承担集体行动成本的‘搭便车者’。”可以说,营造关心公共利益的社会文化和运行机制才是大数据时代分享、共享利益的行为准则。

  (二)技术规范

  大数据的规制不仅是法律问题,也是技术问题。数据安全涉及科学研究机构和大量标准、规范的制定,因此,从技术规范的角度规制大数据应用领域是应有之义。对迫切需要规范和调整的新领域,硬法(hard law)供给严重不足,由于立法程序和稳定性要求,运用国家强制力保证实施的法规范往往迟滞于技术的发展,而低层级的不具有国家强制力的法规范软法(soft law)可以较好的弥合立法之前的空窗期,大数据的技术规范可以说是利用软法的灵活性、适应性满足社会对法的需求,并且具有更明显得弹性、开放性和回应性。

  (三)大数据战略

  大数据不仅是工具,更是资源,各国之所以看重大数据的发展前景,是基于数据的创新将成为信息时代经济、社会发展的先导。大数据正在社会资源的合法配置方面发挥举足轻重作用,随着资源配置的改善、高品质的公共服务,大数据带来的直接效益使政府的公信力和民众的认同感进一步增强,这也是各国致力于大数据战略的目的所在。

  1、建立大数据发展中心。发展国家大数据发展中心,集中资源发挥大数据的资源集约优势。“云计算的基本组成单位是数据中心(Warehouse-Scale Computer,WSCs),可通过对数据中心的服务器、存储、网络等资源的集中管理和虚拟化等云计算关键技术的实施,来实现规模经济效益。因此,数据中心就是云计算时代的计算机。”[袁玉宇,刘川意,郭松柳:《云计算时代的数据中心》,电子工业出版社,2012年版,第31页]

  2、建立政企合作的大数据研发模式。不仅国家主导参与大数据的建设,领军级的信息技术企业也是大数据战略的重要组成部分。如谷歌等信息技术企业是美国大数据战略的重要支撑,仅谷歌在美国多个州都建设数据中心,而位于俄勒冈州达勒斯市(Dalles)哥伦比亚河畔的数据中心是全球最大的数据中心。信息企业在科研上本来就站在领域的尖端,企业对技术、市场的天然敏感有助于战略的灵活性和务实性。反观国内,政企合作的条件日渐成熟,如近年国内信息技术企业发展迅猛,在互联网金融、云计算、社交通信等领域开始展现实力。与企业合作将是政府发展大数据战略的必然选择,如《网络安全法》明确了国家支持企业、研究机构、高等学校、网络相关行业组织参与网络安全国家标准、行业标准的制定,可以说为政企合作开启了良好的开端。

  3、建立大数据开放、分享、利益分配机制。在数据资源利用过程中,对数据的分享和所带来利益的分配直接关系到大数据发展前景。如电商获取个人消费数据、导航营运商采集客户的活动数据、社交平台得到客户的社会关系数据、医疗机构提供个人的医疗、健康数据、银行拥有个人信贷等信息,当然公共部门的数据将更加全面,只有将这些数据集以创新的方式进行整合、关联,才能充分释放这些数据的潜在价值。以往大数据之所以没有被更有效率的运用,是因为各个数据来源之间没有一致化的标准,且碍于各自的规则、利益考量,无法实现数据共享。只有在国家层面制定数据使用和收益分配相关规则,才可能打破企业、行业的界限,实现数据融合与发展。

  (作者单位:龙湾区人民检察院)