中央政法委机关报法制日报社主办

您所在的位置:首页 > 法治时评

莫让裁判文书公开被违法爬虫搅局

2019-08-06 22:49:45 来源:法制日报·法治周末

  法治周末特约评论员 舒锐

  据《北京青年报》近日报道,有不少商家均声称出售裁判文书网的数据,其中不少商家声称其数据量超6000万条。而据裁判文书网公开数据显示,目前,裁判文书网上公开的文书总量为7395万余篇,如果商家所称的数量属实,则商家能够提供绝大多数已经公开的文书数据。不少声称能够出售裁判文书网数据的商家在商品文字描述中称,其数据是通过“网络爬虫”的方式获取的。

  就司法本身的层面,裁判文书是司法工作的最终产品,更是公众衡量司法公正性的重要载体,公开裁判文书将在更大范围内实现各界对法院的监督。其实,裁判文书公开的价值远不止于此。

  裁判文书可以为社会诚信体系提供权威素材,弥补信息不对称,为人们在生产、生活中更理性选择交易、交往对象提供参考,引导诚实守信风尚;更可以指引人们的行为模式,帮助人们风险防控,警示人们远离违法陷阱。

  在这种意义上,裁判文书具备着公共产品属性,不仅凝结着法官们的智慧,更产生于全民参与,应当由全社会所有主体无偿共享。正因为如此,近年来,各级法院在司法公开领域作了不少努力,其中最重要的内容之一就是推进裁判文书公开平台的建设。

  2013年7月1日,最高法开通中国裁判文书网,并于2014年1月1日制定《关于人民法院在互联网公布裁判文书的规定》,为此项工作在四级法院全面推进提供了具体平台与制度保障。

  遗憾的是,这个本该为全社会共享的公共产品如今却被大量不良商家进行兜售。何以造成如此尴尬的局面呢?人们放着免费渠道不用,而是选择购买文书,很大原因或许在于通过免费渠道查询较为缓慢。裁判文书网为何缓慢呢?

  根据报道,最高人民法院在其官网回应网友对于裁判文书网运行慢、故障频繁等情况时表示,由于中国裁判文书网公开文书数量和影响力不断增加,访问用户数不断增长。同时,2018年5月初以来,大量技术公司通过爬虫系统无限制并发访问非法获取裁判文书数据,造成网站负荷过大,大量正常用户请求堵塞,访问出现速度慢或部分页面无法显示等现象。

  虽然我们现在无法掌握究竟有多少数据爬虫对文书网进行着实时攻击,但毫无疑问,数据爬虫所占用的流量、自动发起访问的频率,比正常用户访问显然要大得多。一个最简单道理,人的点击速度自然是无法敌过漫无目的、漫天爬取的“爬虫机器人”。

  而这些公司何以要用爬虫非法获取数据呢?因为数据潜藏着利益,最直观的利益则是转卖、兜售。由此,裁判文书的提供与获取就陷入某种死胡同。因为慢,所以有人想买。因为有人想买,所以有人去卖。因为要卖,所以得用爬虫窃取。因为爬虫,所以更慢。所以更多人要买……

  实际上,爬虫作为一种计算机技术具有中立性,该技术本身不被法律所禁止。但正如水果刀本身并不被法律禁止,可是,用来捅人,就不被法律所容忍了。衡量爬虫的使用是否构成违法侵权,至少需考虑以下因素:是否违反网站意愿;是否干扰了被访问网站的正常运营;是否抓取了受到法律保护的特定类型的数据或信息。

  虽然我们不知道文书网是否通过“爬虫协议”宣示禁止爬虫,但该网采用了验证码方式限制爬虫,可以推断被爬取并非网站所愿。爬虫更是影响了该网站的正常访问。更为严重的是,爬虫使用者将所爬取数据改变公共产品的性质,占为私用,甚至牟取私利。

  可见,爬取裁判文书并大肆兜售,不只是不道德的行为。这并非仅仅是在“爬取”,更准确来讲,这是一种“爬窃”,爬取裁判文书本身就涉及违法侵权。公共产品在任何情况下都不能沦为私物。将公共产品非法转卖,从私法的角度,相关合同损害社会公共利益,应认定为无效,购买者有权要求退款。而公法的角度,出卖裁判文书的行为或将构成非法经营的违法行为。有必要上升到维护全民公共产品,维护司法权威的高度,对相关违法行为进行严厉打击。莫再让文书公开给全民带来的福祉被违法爬虫截胡。
 

责编:王硕

关于我们 | 诚聘英才 | 广告征订 | 本站公告 | 法律声明 | 报纸订阅

版权所有 Copyrights © 2014-2019 www.legalweekly.cn ALL RIGHTS Reserved 《法治周末》

京ICP备10019071号-1 京报出证字第0143号

京公网安备 11010502038778号