在当前的大数据时代背景下,每个人的大量社会活动都会被大数据系统记录下来。最近跟小伙伴聊起一件事:大数据扫黄,结果发现大家格外感兴趣。
而我平时呢,也会看【守护解放西】、【孝警阿特】之类的视频,发现相关视频的播放量也特别高,那么今天就来探讨一下:大数据扫黄,是真的吗?
先一个很久之前的说法,看起来就非常假的很,很难不怀疑是大数据分析的广告…
里面第一步获取数据就说不通,销售信息里的数据都是脱敏的,你怎么能确定淘宝名为“帅气的彦祖”并买了100个TT的收件人,背后其实是朱小五?*
通过这种方法去得到“准失足妇女池”,估计还没有警察叔叔自己看后台行政处罚记录快,大部分从事这个行业的人员被抓都不是一次两次了。
比如守护解放西中,每个人口中自己都是第一次,结果发现早就跟派出所快成熟人了。
所以上面所谓的大数据扫黄案例就很离谱,既然某公司有能力拿到电商平台真人匹配的销售数据,那直接去拿开房数据不香吗?
那再极端一步,
直接用支付数据不是更狠嘛!
说到这里,大数据扫黄 2.0 就来了。在最新大家大家转述的故事里,涉黄人员怀疑名单通常是这样确定的。
如果你是一名年龄在20—40岁之间的女性,并且经常在午夜(前一天晚上11点到第二天凌晨3点)收到像289、389等金额的转账或红包,那你将会出现在涉黄人员怀疑名单上。
如果你是一名男性,经常在午夜(前一天晚上11点到第二天凌晨3点)支付像289、389等金额的红包或是转账,你也可能会被列入涉黄怀疑名单。
这个说法听起来就比上一个逻辑强多了,甚至我都一阵恍惚,觉得是不是某公司出的数据分析模拟面试题,让你用SQL或者Python进行数据处理,找出“可疑交易”。
但是,但是,我对这种说法仍持怀疑态度。
第一点,我们先看看实际中办案民警是如何进行“数据分析”的,他们通常是已经确认存在卖淫活动的人员并在立案侦查过程中发现使用微信进行交易。
这时候办案民警需要前往深圳市腾讯公司依法调取了xx年xx月微信交易账单,然后再根据微信交易账单相关数据,分析、核查出“曾交易过人员”的微信号及身份信息,就可以进一步进行依法传讯,从而实现数据分析扫黄。
(以上信息均整理自处罚公告)
再说第二点,前面说的“大数据扫黄”所依赖的逻辑一个是时间(午夜),另一个就是关键点交易金额(289、389),但事实真的是这样吗?
我没有这方面的经历,但最近确实在写一篇相关的文章,先挖个坑。
但是我只能说结论,嫖娼交易金额绝不是289、389这样商品促销的数字。
那么具体是都是什么金额呢?
最高数字是多少呢?
前面说了不少“大数据扫黄”破绽,但是不得不承认,如果数据拥有者真的想去做遍历筛选查询,去做交叉验证,是可以实现的。
但作为普通民众,既感谢警察同志的辛苦付出,也更愿意看到带着“镣铐”执法的行为。
借用半佛老婆的语言说:卖淫组织者和大数据拥有者谁突破的底线更深,本身就是一个难以确定的事实。他们都是出来卖的,我们也都是被白嫖的。
最后,放一个温暖的,正确的大数据使用方式:
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
三、精品Python学习书籍
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、Python练习题
检查学习结果。
七、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。