Ben Welsh 在洛杉矶时报的数据部工作,他在网上开了一个教程,用Jupyter Nootbook教读者如何用Python和Pandas 来分析数据,甚至都开源公布在github上了,这是Data Journalism的里程碑。
加州法律规定在州议会讨论的立法提案都得公开数据,包括背后的支持者和反对者的政治捐款,凡是超过100美元的捐款都得记录,这个数据库叫CA ACCESS。
原始数据有点杂乱无章很难进行关联分析,记者们邀请计算机高手组团一起来进行数据整理,发掘其中的奥秘,项目完成之后,获得了好几个新闻奖。记者们把自己的数据挖掘过程也公布在网上。
比如去年开始,加州的娱乐用大麻合法化。那么谁在背后推动这项立法?2016年11月,娱乐用大麻合法化的法案Prop 64,获得57%的支持率通过,最大额的支持捐款875万美元,来自科技创业新贵 Sean Parker,以及他的信托。最大额的反对捐款,来自一位退休的艺术家。
具体的分析教程在此:https://www.firstpythonnotebook.org
不知道为什么,很多海外华人的微信群里有一股反对大麻的风气,整天在群里危言耸听,觉得大麻店要毁了 社区,大麻会毁了孩子,大麻客会毁了房子。大麻的立法都讨论几十年了,我想57%的投票支持率已经说明了社会公众的态度。
另一个例子,是关于47号提案,也就是盗窃950美元以下不算重罪。不知道为什么,北美华人微信群里经常传播这样的信息,砸车频发,警察不抓。
这明显不是事实,本地社区报纸网站上,四月份还抓到了两个砸车小贼。轻罪和重罪的区别,是入狱不超过一年,罚款不超过10,000 ,并不是不抓。而且这都属于犯罪行为,受到刑法管辖,更轻的是违法行为,由民事法律管辖。
洛杉矶时报的记者也分析了这方面的数据,自从通过这个法律以来,犯罪率并没有明显的上升。
发表评论