11.8亿条:淘宝数据泄露大案 包含客户ID、手机号等

时间:2021-06-17 10:45:48

导语:爬取的客户的手机号码信息,逯某都提供给黎某了,爬取的淘宝客户ID和淘宝昵称,逯某则存在了自己的电脑硬盘里,没有提供给黎某和外泄。

你有收到过加微信送礼品,或者邀请刷单的信息吗?如果有,那么你的个人信息可能遭到了泄露……近日,商丘市睢阳区人民法院在裁判文书网,公开了一份刑事判决书,显示一名住在河南商丘市的本科毕业的大学生逯某自2019年11月起,对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。

在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。

而被盗取的这11.8亿条数据被拿去做什么了呢?真相是,另一名住在湖南省浏阳市,并仅仅初中毕业的黎某利用这些信息,建了1100个微信群,每个群90-200人不等。每天用机器人在群里发淘宝优惠券,赚取返利,并在短短的8个月内获利34万余元。

到底发生了什么?

两个相隔千里的人,是如何一起合作做下这起惊天大案的呢?

被告人逯某供述称,2017年7月在QQ群里认识了黎某,黎某当时在做“淘宝客”需要一些“淘宝客”软件,其为黎某编了个“微信加人”软件,没收钱,黎某承诺说算其技术入股,等以后成立公司了再与我算钱。

2019年3月份黎某成立了一家名为“浏阳市泰创网络科技”的公司,逯某成为该公司技术员,一直在家远程办公,并领取每月1万元的报酬。

2019年11月份,逯某开始用自己开发的爬虫软件“淘评评”,通过淘宝商品详细信息接口和淘宝信息分享接口,爬取淘宝客户的淘宝数字ID和淘宝昵称,并通过淘宝分享接口可以爬取淘宝客户手机号信息。

其中,爬取的客户的手机号码信息,逯某都提供给黎某了,爬取的淘宝客户ID和淘宝昵称,逯某则存在了自己的电脑硬盘里,没有提供给黎某和外泄。

而黎某,则在收到淘宝客户手机号码之后会把这些信息数据导入“微信加人”软件,加微信好友成功后,拉入建好的微信群,由公司里的员工负责发送广告链接。淘宝用户在该公司的微信群里购买商品之后,该公司将获得佣金。

就这样神不知鬼不觉地进行了8个多月,逯某前前后后爬取了5000多万条信息,并从其他地方下载了11亿多条数据。直到2020年8月14日淘宝(中国)软件有限公司报警称,在2020年7月6日到2020年7月13日时,有黑产人员通过接口,绕过平台风控,批量爬取数据。在7月6日至7月13日之间,平均每天爬取数量500万,爬取内容包括买家用户昵称,用户评价内容,昵称等敏感信息。

最终,逯某和黎某被河南警方逮捕。经过公检方面核查,逯某电脑里通过其开发的软件爬取淘宝客户的数字ID、淘宝昵称、手机号码等淘宝客户信息共计1180738048条。

值得注意得是,被告人逯某表示,这11.8亿的数据通过微信文件的形式发给黎某之后,黎某会转一笔费用给他,整个获利只有六七万或七八万元。

涉及恶意爬取淘宝数据

淘宝联盟曾点名43款违规APP

这并不是淘宝第一次被恶意地爬取淘宝数据。

2019年5月,阿里妈妈在进行违规排查过程中,发现部分淘宝客在无线APP端未经授权爬取淘宝购物车、收藏夹等并恶性宣传做淘宝客推广的行为。这一行为严重违反《淘宝客应用开发者规范》第九条:开发者不得以任何形式爬取任何淘宝数据;违反《阿里妈妈推广者规范》第八条,存在流量劫持的违规行为。

此次专项治理共发现粉象生活、省钱快报、羊毛省钱、返钱宝宝、喵喵折、叮当叮当等此类违规APP共43个。

事实上,不仅淘宝出现这类情况,在2013年时,京东也发生过类似案件。数据外泄包括密码、手机号码、电子邮件地址、用户名。

今年4月,Facebook指责“恶意行为者”泄露了超过5.3亿用户的姓名和电话号码等数据。

第三方大数据公司“人人自危”

众所周知,网络爬虫技术原本是指平台按照一定规则,自动从互联网上提取网络信息的程序或脚本,本为互联网行业的常用技术之一。爬虫技术被广泛应用到各个领域,在大数据分析、舆情检测等,在法律上从未被明令禁止。

但是数据来源合法是网络爬虫活动合法的前提。如未依据《网络安全法》第四十一条取得被收集者同意即自动抓取个人信息,技术使用者即涉嫌构成侵犯公民个人信息罪、非法侵入计算机信息系统罪或非法获取计算机信息系统数据罪等相关罪名。