Redian新闻
>
北京一互联网公司被端,所有开发被全部带走!

北京一互联网公司被端,所有开发被全部带走!

公众号新闻

点击上方“芋道源码”,选择“设为星标

管她前浪,还是后浪?

能浪的浪,才是好浪!

每天 10:33 更新文章,每天掉亿点点头发...

源码精品专栏

 
来源:Hollis(ID:hollischuang)

近日,北京市朝阳公安分局对外公开,按照公安部“净网”专项行动整体部署,朝阳警方深入落实打击网络违法犯罪,在市局网安总队等有关部门的支持下,经过半个多月的缜密侦查,将一个非法获取计算机信息系统数据的犯罪团伙一网打尽,抓获23名犯罪嫌疑人。

其中,大部分都是这家公司招聘来的开发人员。

好好的程序员,怎么就变成犯罪团伙、犯罪嫌疑人了呢?

原来,被查的这家公司主要是通过爬虫,爬取网络直播间的数据,然后再打包售卖牟利的。而被带走的很多程序员都是写爬虫的。

可能有人觉得这些程序员挺冤枉的,就是听老板的话干活,爬取的都是公开的数据,咋就不行了呢?搜索引擎背后不也是爬虫技术吗,咋没人去端百度呢?

没错,爬虫技术本身是没啥毛病的,但是市面上大多数企业中的爬虫的用法,基本都不合规,因为完全合规的爬虫根本没有商业价值。

目前,关于网络爬虫相关的约束,主要是2019年05月28日国家网信办发布的《数据安全管理办法(征求意见稿)》。

基本可以确定的是,如果爬虫使用不当,那么爬虫的开发者是有可能触犯法律的,而根据情况不同,获得的刑罚也有可能有差异。

要看开发和使用爬虫是否犯法,需要从爬什么数据、如何爬取数据以及爬到数据之后怎么用三个方面来判断。

爬什么数据

1、属于著作权法保护的作品

因为有些网站发表的内容,如文章、评论等都是有著作权的,如果只是单纯的通过浏览器查看是不会触犯法律的。

但是,对于有著作权的作品,如果未经著作权人许可,以盈利为目的,对其作品进行复制是会触犯法律的。

如果是使用爬虫技术手段爬取数据之后将其保存下来或者传播,并且进行盈利,这种都是属于犯罪的。

2、用户的个人信息或者个人隐私

个人用户的个人信息,即使是用户自己放到一些网站上进行公开或者部分公开,如微博、微信等,不代表这些数据就可以被其他人随便获取!

所以,如果爬取的数据涉及到个人信息,都是违法的!

还有些爬虫企图绕过权限校验等,爬取用户未公开的信息,如个人私密相册照片等,都是属于侵犯用户的个人隐私的,这种也是违法的。

3、反不正当竞争保护的数据

目前有很多网站中的数据系由用户生成,且该等数据和内容系原告网站的主要竞争力来源。如大众点评上面的店铺评价、评论等信息,携程网上面的关于酒店的评价评论等信息等。

那么,未经允许,爬取其他网站的核心数据,很明显并没有遵守自愿、平等、公平、诚实信用的原则。就违反了反不当竞争法了。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 视频教程:https://doc.iocoder.cn/video/

怎么爬

如果是爬取公开的数据,通常不会被认为是侵权。Google、百度等搜索引擎都是这么爬取的。

那么,到底怎么爬数据是有可能触犯法律的呢,主要考虑是否涉及以下两种行为:

1、未遵守Robots协议

Robots协议是技术界为了解决爬取方和被爬取方之间通过计算机程序完成关于爬取的意愿沟通而产生的一种机制。

无视网站设置的Robots协议而随意抓取网站内容的行为将涉嫌构成对《反不正当竞争法》的第2条的违反,即违反诚实信用原则和商业道德的不正当竞争行为。

2、绕过防护措施对数据的访问,强行突破反爬措施

由于爬虫的批量访问会给网站带来巨大的压力和负担,因此许多网站经营者会采取技术手段,以阻止爬虫批量获取自己网站信息。

所以,很多爬虫工具为了爬取数据,会想办法通过各种手段绕过防护措施,但是,这种行为也是会触犯法律的。

企图通过技术手段,绕过网站的反爬机制,都属于《刑法》中规定的”侵入”,都是要被处罚的。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud
  • 视频教程:https://doc.iocoder.cn/video/

怎么用

很多公司开发的爬虫遵守了Robots协议,也没有爬取不该爬取的数据,难道这样获取到的数据就可以随便使用了吗?其实也不是,如果使用不当,也会触犯法律的。

比如通过爬虫抓取到的数据进行盈利、损害他人利益、造假、诽谤等都是可能触犯法律的。

此外,未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于刑法第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。

所以啊,真正的合规的爬虫不能说没有,但是铤而走险的人还是占大多数。

爬虫一时爽,铁窗泪两行!!!

对于程序员来说,如果你的老板让你开发的爬虫,是用来爬取用户的个人信息或者个人隐私,并且该爬虫未遵循Robots协议、并且有意的躲避反爬机制就可能触犯到法律了。

可千万不要老板让你干啥就干啥,自己一定要长个心眼。毕竟情节严重三年以下,特别严重三年以上,七年以下!



欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

已在知识星球更新源码解析如下:

最近更新《芋道 SpringBoot 2.X 入门》系列,已经 101 余篇,覆盖了 MyBatis、Redis、MongoDB、ES、分库分表、读写分离、SpringMVC、Webflux、权限、WebSocket、Dubbo、RabbitMQ、RocketMQ、Kafka、性能测试等等内容。

提供近 3W 行代码的 SpringBoot 示例,以及超 4W 行代码的电商微服务项目。

获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
计算机、互联网和移动互联网的底层逻辑是什么?中国十二大互联网公司年终盘点中国十二大互联网公司2022年盘点封杀20年,为了这部带血禁片,他尽力了…这个春节,互联网公司不想努力了为什么拼多多是今年表现最好的大型互联网公司?澳19层公寓阳台沙发被大风吹落! 砸烂对面楼窗户, 摔得支离破碎“睡车间”、削减一切,马斯克为SpaceX定制的文化,不能照搬到互联网公司一周内,接连被罚近20亿元!这一互联网巨头,发生了什么?二手家电数码专场,10新币起就能带走!还有闲置苹果手表、全新投影仪...关于古代的冷知识又增加了!这个历史中的古老职业放现代分分钟被带走!成立17载,这家老牌互联网公司为什么却越来越年轻?硅谷上市公司 Confluent 饶军:我能开公司,所有人都有机会 |S6E42 硅谷徐老师推荐一些小而美的互联网公司今天公布的 10 个中国经济大数据;互联网公司春节红包缩水一半中国十二大互联网公司 2022 年盘点:和过去的自己告别互联网公司做零售 一门难啃的生意宇宙人(1128期)嫦娥五号月壤揭示月球年轻火山成因之谜;俄成功发射首颗“球体”项目卫星;印度运载火箭成功发射一网公司互联网卫星58岁女人为什么需要小情人?《悠悠岁月》(6)突发!中金2保代被监管警示,事发北京一公司科创板IPO错误的例子证明错误的结论:论“中国队大胜美国队与中国队大败美国队”均价近4万/㎡,这地有开发商贴出“保价协议”:“我们保证不降价”!啥情况?6万亿股份行首席业务总监被带走!金融反腐持续高压,11月已有多人被查北京一教育公司无证办学被罚1178万6G、人机交互、工业互联网……世界互联网大会乌镇峰会热点聚焦中国十二大互联网公司2022 年盘点:和过去的自己告别26岁模特夺得“英国小姐”选美冠军!甜美可人学历高,却因红发被同学打骂吐口水二十大高尔夫推杆技巧猫头鹰“喝醉了”?还拦路民警,带走!北京一公司规定女员工每天排队吻老板 惊呆了!互联网公司年会奖品:手机、电脑、金条,还有「与董事长聊天一小时」经济发展不好的内在原因省政法委书记在北京西站被带走!曾两天赌输几百万雇佣兵是人道援助还是搅动战争从大前端“穿越”到终端,开发者应该必备什么技能? | 解读终端的 2022
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。