中国：公安“大数据”系统侵犯隐私、打压异见人士

当局引进自动化系统追踪其视为“威胁”民众

2017年 11月 19日 12:00上午 EST

Human Rights Watch

据人权观察网报道：中国政府应停止建置大量收集分析公民个人信息的警务大数据平台。这种侵犯人权的“警务云”系统，除其他功能外，主要目的在追踪和预测维权人士、异见人士和少数民族人员的动态，包括被当局指称怀抱“极端思想”者。

中国没有保护隐私不受国家监控的有效机制。

“中国当局从数以亿计的普通民众身上收集愈来愈多信息并加以集中处理，借以辨别被政府认为偏离‘正常思想’的人士，然后加以监控，这种做法令人不寒而栗，”人权观察中国部主任索菲・理查森（Sophie Richardson）说。“中国政府应立即停止这种做法，直到中国建立隐私权保障和负责任的警察部队。”

中国政府以惊人数量收集公民信息素有长期记录，现在更积极开发新技术，例如大数据分析和云端计算系统，藉以更有效率地汇集和采掘个人信息。有关当局并试图连结各式各样的数据库，加强不同部门和各级政府之间，以及民间信息源的数据分享和分析。

中国公安部门利用各种应用程序分析大量且多样的数据，包括文字、视频和图像。这些应用程序能提供实时或接近实时的有用分析，例如监测交通流量模式。中国公安部门曾经表示，大数据的运用将强化公安搜捕嫌犯、预测犯罪和迅速反应的能力。

但有些这类系统也能史无前例地帮助公安任意取得普通民众的日常生活信息，包括无涉违规犯罪的人士。

“警务云”系统即是公安部最具企图心且侵犯隐私的大数据项目之一。该系统迅速挖掘个人信息，从就医病历到超市会员资料，乃至邮件投递记录，而这些信息大多可以连系到独一无二的居民身份证号码。“警务云”因此可以追踪个人行踪、同行人员和过往行为，并可对其未来活动做出预测。其目的是通过分析，例如谁曾住在某间酒店或与谁结伴旅行，发掘出公安机关“看不见”的事件与人物关联。它还可以提醒公安人员注意不寻常的活动──例如某人明明在当地拥有住所却经常入住当地酒店。

上述各种系统的设计目的包含追踪当局眼中具有政治或社会威胁的群体，令人高度担忧社会和种族定性（profiling）问题。这些平台宣称可以通过预测式警务（predictive policing）分析相关群体的过往活动模式，向公安机关“提醒或警告”该群体的未来活动，以便“更有效堵截”。总管党国公安、检察、法院机关的孟建柱──前公安部长及现任中共中央政法委书记──曾在2015年指出，大数据的重要性在于从“碎片化”的信息中找到规律，进而“确定一个人身份”。

人权观察已就山东、江苏和天津等地公安厅局的多项招标文件，以及相关学术论文和媒体报导进行分析。人权观察主要关注这三个地区，因为它们的招标文件公开上网，而且山东省和江苏省均自诩拥有全国最先进的警务云建设。山东省招标文件包括济南、泰安和威海等主要城市公安局公布的材料；江苏省的盐城市；天津市的文件则为该市公安局所公布。

相关招标文件均公布于2015年到2017年9月。天津警务云的造价最高──约达4百万美元（人民币2,700万元）。

警务云系统显然是全国性项目。2015年，公安部颁发《公安机关信息共享规定》，下令整合数据建构省级警务云，做为全国警务云数据库的基础。

“当警务云大肆汲取愈来愈多的公民信息，一场完美风暴已见端倪，”理查森说。“随着当局追踪每个人一举一动的能力日益增强，全国民众失去的将不仅仅是个人隐私──还有他们所应享的许多权利。”

整合政府和企业的公民数据

警务云系统指在整合不同形式的信息，包括中国公安部门例行收集的数据，例如住址、亲属关系、节育方法和宗教信仰。警务云平台并可整合酒店、航班和火车记录、生物识别特征、监视器画面，以及来自其他政府部门甚至私营企业的信息。

在山东省威海市，警务云计划整合63种公安数据和来自43个其他政府部门和企业的115种数据（详见清单）。政府收集的数据包括来自国家卫生计生委的病历记录（包括姓名和疾患），来自国家信访局的上访者（向政府申诉者，通常涉及官员侵权）姓名及事由，以及来自司法局的犯罪者姓名地址。警务云也收集企业数据，包括来自电信公司的用户姓名及IP位址，来自网络聊天室的用户姓名及其社交媒体（微信、微博、QQ和电邮）账号，以及来自邮递业者的寄件人／收件人姓名、电话号码和包裹内容申报记录。

在江苏省徐州市，曾有官媒报导提及公安机关从第三方购买企业数据。其所购买的信息包括“互联网上的导航地图数据，大型的互联网企业物流寄递、商品购买交易等。”该文指出，其中部分数据为实时收集，“过去民警上门逐户走访进行采集，每天最多可以采集40户到50户，现在每天24小时可以不间断通过设备进行数据采集。”这类数据包括MAC位址（电脑或其他网络装置的硬件识别码，每件装置的识别码均为独一无二）和网络用户的路由器信息。

大数据系统的侵入性‘洞察力’与预测式警务

警务云系统目的在通过“可视化”处理，使公安机关能够找到隐藏在海量数据中找到潜在的趋势和人物关系。它的介面在山东省称为“警务千度”（谐拟中国流行搜寻引擎“百度”），在天津市称为“天地E搜”，可供公安人员搜寻和监控个人、车辆和相关案件。该系统经调校后，亦可依据数据及其分析得出的模式向公安人员示警特定人物、人际关系和相关事件。例如，济南警务云可以分析其所收集的旅店住宿、车辆动线和包裹递送等数据，向公安人员提示可疑活动──例如某人在当地拥有住所却经常入住当地酒店。

这类系统的一个关键特性，就是挖掘当局以其他方式不易发现的关联。济南警务云将来可供公安人员查出“和重点人员关系密切”的人士。换言之，例如，它可以查出哪些人曾和重点人员“一同上网吧超过两次，或一同旅行至少两次。”查出关联以后，公安机关“可以进一步挖掘、分析关系人[信息]”，还可利用该系统将数据呈现为人际关系图。同样地，泰安市公安云也可透过分析“谁跟谁同行、同住、同事；谁常上网；谁跟谁同一户口；谁跟谁有亲戚关系；以及谁跟谁涉及同一案件，”让公安机关能够将人际关系视觉化。

警务云系统的另一目的是监控公安机关特别关注的人群，例如政府认为最能威胁政权稳定的人士。按照公安部定义，所谓“七类‘重点人员’”包括：重点上访人员、涉恐（恐怖活动）人员、涉稳（不利稳定）人员、涉毒人员、在逃人员、重大刑事犯罪前科人员和可能“肇事肇祸”的精神病人等。

实际上，地方公安机关几乎可以将任何人指定为威胁份子而予加强监控，尤其是被认为破坏稳定的人士。没有任何法律规定要通知被指定监控的当事人，后者也无从提出异议。天津市的一份招标文件说，该市警务云有能力监控“特定民族人员”、“极端思想人员”、“顽固上访人员”和“南疆维族人员”。新疆自治区有1,100万维吾尔穆斯林少数民族，大多居住在该区南半部，其权利普受严厉压制。天津警务云称其可在地图上标定上述各类人员，并追踪其动态。江苏省盐城市警务云的功能包括在地图上“快速回溯”“重点人员车辆、涉毒人员车辆、…[登记在]新疆车辆”的行进轨迹。

这类系统的还有一个特性，就是所谓的“预测式警务”。透过分析过去罪案数据、行为和动态，该系统有办法预测未来的犯罪活动。公安机关可能想要利用这种系统，举例而言，预判其欲防范行为最可能发生的具体时间、地点。

济南警务云招标文件要求，系统须能“分析访问济南的重点人员及其案件…对其进行监视，并综合其民族、犯罪记录及其他特征[向公安机关]警告[他们的动态]。”经过分析后，该系统将产生日报表或周报表，推送到公安人员的手持装置上。

据《山东法制报》报导，山东省警务云每天早晨8点都会向公安人员传送治安预测情报：

“…‘早八点’…汇总昨日辖区警情、案件、民族、籍贯、旅客、网吧、民航等信息，从云数据中分析异常数据和发展趋势…每天早上八点，陆续推送至民警手机…。”

该系统是用来抓捕“重点人员”。该报导引述一名民警说法：

“每天八点…系统会根据我们的辖区位置、订阅选项有针对性地将消息推送给我们，特别是能对进入辖区的涉恐、涉稳人员进行精准预警…。”

该报导并引用实例，对预测式警务做了生动描述：

“2015年9月17日12时53分，吸毒人员买某入住东营区XO 主题酒店，黄河路派出所民警根据‘早八点’短信提示进行了重点核查。经查，该重点人妹妹阿某因‘危害国家安全罪’被国家机关处罚，根据相关机制，随即对买某进行了重点管控。”

该系统显然因为买某被列为吸毒人员而向公安机关示警。该报导并说‘早八点’系统能够“及时获取少数民族、前科人员频繁聚集、长驻线索”等有助引导警力巡逻的信息。

预测式警务计划并能追踪涉恐人员。人权观察曾批评中国有关当局利用侦办恐怖活动为由对和平异见人士进行镇压，特别是维族人士。

在中国公安部门持续建置这类系统的同时，其有效性和功能性却饱受质疑。据学者指出，公安部门在汇整信息时遭到其他政府部门消极抵制；基层民警常无法收集到有用或完整的信息；不同项目收集数据标准不一，难以整合共享；以及有能力在工作中应用大数据分析的警员为数不多。

协助审阅本新闻稿的大数据专家也指出，中国公安机关目前掌握的观察值可能尚不足以对大量人员进行实时追踪。中国公安机关已可取得所有旅馆、航班和铁路记录。证据显示，中国正在开发利用监控视频进行脸部辨识和车牌号码辨识的技术，以便加强追踪人员的能力。公安机关也已经可以取得电信、手机和网络服务商存储的定位数据，至于能否获取实时数据串流则尚无法确知。另一挑战则是，进行这种追踪恐怕必须消耗大量的数据存储、计算与分析资源。

大数据警务在中国法律和国际法上的问题

近年来，中国政府和中国共产党制定了多项指示和法规，以便进行数据收集、整合与分享，加强维护“社会稳定”（透过镇压犯罪与政治异见维护和谐表象的委婉说法）。2014年，公安部颁布《关于做好公安‘十三五’规划编制工作的补充通知》，要求在2016到2020年之间构建智慧人员数据收集系统，做到“加强对关键人员异常行为发出早期预警的能力。”2015年，公安部一领导小组会议通过《关于大力推进基础信息化建设的意见》，强调要在公安工作中大力推动大数据与云计算。同年，中共中央办公厅、国务院办公厅共同发出《关于加强社会治安防控体系建设的意见》，包括利用云计算和大数据等科技手段促进“社会稳定”。各省亦发出同样指令；山东省公安厅曾在2014年发出多项命令，加速数据整合与警务云构建。

中国现行法律也未达到《公民及政治权利国际公约》规定的隐私权国际标准，该公约已由中国签署但尚未批准。按照国际法，为执行警务而收集、存储和使用个人数据，唯当国家安全或公共秩序等公共利益遭受真实威胁时才能采取，且须兼具必要性和相当性，做为达成前述目的之最低侵犯性措施。

中国没有成套的隐私或数据保护法，保护个人身分信息免遭滥用，尤其是政府滥用。公安机关实施监控不需取得任何形式的法院命令，也不必证明被收集数据的人员涉及或参与犯罪活动。公安机关进行监控活动不必向任何其他政府部门报备，也不必公开有关信息。实际上，个人隐私在政府监控面前没有任何保障。公民难以得知政府收集他们哪些信息，又如何使用、分享和存储他们的数据。公民完全无法知道自己是否被归类为“重点人员”，倘若被归类为“重点人员”或相关人员也无法对自己所受待遇提出质疑。若企图调查政府监控，可能被安上“窃取国家秘密”等罪名。

政府方面，却有许多法律授权政府机关和私营企业收集使用公民信息，中央各部委和地方政府也发出无数指示、规则和条例，收集使用各式各样的信息。国家安全相关法规，例如《国家安全法》，赋予公安机关和其他国家安全部门广泛权力“收集有关国家安全情报”。《网络安全法》虽然要求网络服务商保护用户数据，且收集数据前须得用户同意，但也强迫网络业者将用户数据存储在中国境内，并须应安全部门办案需要提供无限制的“技术支持”。

政府对大数据和预测式警务的运用，已使中国原本普遍的隐私权侵犯问题雪上加霜。警务演算法和大数据分析必须以大型数据库为基础。随着愈来愈多公安部门构建云端警务系统，通过日益增加的监控活动，加上与私部门合作，政府收集的个人数据也不断累积。按照计划，警务云系统将建成巨大的全国性与区域性数据库，储存大量人口的敏感信息，并可无限期保存，提供未来不可预知的用途。这种完全不合比例原则的做法，势将侵犯数亿人民的隐私──其中绝大多数根本不会涉及犯罪。

同时面临危险的是无罪推定权和结社权。按政府说法，相关系统是用来追踪、监测及必要时逮捕、起诉“重点人员”以及与之同行、会面或联系的人员。因此，这种预测式警务系统将使所有和“被关注人员”有关系的人都受到怀疑和监控。

基于社交媒体监控和网上活动汇整的大数据分析，也可能对言论自由造成更严重的寒蝉效应。如果用户必须留意自己发出的每一则微博或短信会不会被用来判定他们是否威胁国家安全，网上自我审查必将变本加厉。

这种系统也可能对少数民族等人群产生歧视作用。这种作用部分来自原本设计：中国政府的反恐行动包含对维吾尔少数民族的严厉镇压。各地招标文件显示，警务云系统有一部分就是针对维族和“特定民族人员”进行监控。

除了以上各项人权问题，预测式警务工具能否正确引导警员关注犯罪高发地区也仍有疑问。以美国为例，各级警察单位已开始应用预测式警务系统，对犯罪“热点”或最可能参与犯罪的人员进行定位。但这些系统都是依据过往警方报告的数据进行调校，未必能反映实际风险模式。因此，预测结果往往和警方执法行为惯常指向的目标大同小异，而非实际上最可能产生犯罪行为的地点或人员。

预防犯罪是正当的国家利益，但预测工具通常只是反映既往模式，可能导致警方不断复制同样错误或偏差，例如总是以社经地位偏低人群为目标。这令人不禁怀疑，预测工具的使用究竟能带来多少改变，其对个人权利的侵犯是否具有必要性或相当性。