巴拿马论文技术显示了最佳数据新闻
大多开源数据分析软件的电池使调查新闻运营成为可能揭示富裕和强大的人如何隐藏资金。
SMA CABRA,调查 - 记者国际财团(ICIJ)的数据和研究单位负责人表示,巴拿马论文项目“让我相信人类,看看记者如何在不相互了解的情况下如何分享。没有技术,我们无法看到这一点。“
泄漏1150万张文件,达到2.6TB的数据,从巴拿马律师事务所Mossack FontieCa到德国报纸SüddeutscheZeitunghit于2016年4月。该项目的BBC和GuardianaSo开采了文档Trove,但该项目的技术Lynch-Pin是基于华盛顿的icij。
该组织成立于1997年,作为公共诚信中心的项目,该组织由1989年Charles Lewis教授创立的调查新闻组织。该项目的特定任务一直是跨境调查,最近对海上经济的关注与英国媒体网点,监护人和英国广播公司共用。
原来的Mossack Fonseca泄漏 - 来自一个身份仍然未知的人 - 是南德德斯·Zeitung的调查记者巴斯蒂安·奥伯纳,他与他的同事弗雷德里克·奥伯尔队前进。
ICIJ将材料存储在图表数据库中,通过Neo4j捐赠Pro Bono,通过使用来自LinkWious的数据可视化软件来渲染IT Visual。
Mar Cabra描述了80多个国家100多个媒体服装的370多名记者已经开采了巴拿马论文材料,并相互共用。
作为一般规则,她说:“我们告诉他们故事是什么,他们决定他们是否想要将资源付诸实施。所有记者都在一起工作。这是一开始的共享成本和调查。“
iCij处理数据 - 来自这个项目和其他项目 - 并且“允许在云中的在线平台,所以记者可以分享带来”。在巴拿马论文实例中,有三个平台Cabra说:“我们自己的'Facebook' - 全球IHUB,基于最初是oxwall约会平台的基础; Apache Solr用于索引和搜索,以及项目Blacklight,这是一个用于文档共享的用户前端;最后,Linkious与Neo4j中的数据一起使用。
“我们尝试使用开源技术,因为我们可以提高和适应,”Cabra说。“约会社交网络工具是一个很好的例子;投射Blacklight,也用于大学图书馆。“
CABRA辩称,该组织开发的技术平台将有助于任何未来的调查项目。“我们住在一个电子世界,我无法想象任何不涉及文件的未来项目。我们有一个流程和模特,我们可以扩大并有数百名记者一起工作;这只是添加用户的问题。但我们不会总是处理数百万个文件的泄漏。“
Cabra将环形和Neo4j描述为不可或缺的组合。“我们的大脑不需要以简单的方式看到视觉上的连接。但世界已连接。而且只需通过单击屏幕上的点,您可以看到您无法看到的连接。“
她给出了ICIJ主机的离岸泄漏数据库的示例。“在出版的第一个月,我们获得了500万游客。出版物的24小时内[2016年5月11日],伦敦时报发现了一个关于Emma Watson [哈利波特女演员]的故事,并根据离岸公司的名义来了解房屋的所有权[在英属维尔京群岛注册],落叶。没有图表数据库,你永远不会做到这一点,或者它会更长的时间。“
她补充说:“看看五角大楼论文[关于越南战争与柬埔寨和老挝的越南战争的扩张],由纽约时报发表[1971年]。这需要在很长一段时间内完成一箱文件。“
当他们在2012年看着他们的第一个大型离岸泄漏时,该团队在Word文件上绘制了纸张的线条,她回忆起。这是一个关于第一次泄漏的博客文章,它首先将她和她的团队放在首位。
Cabra得出结论,ICIJ的出版物出版了上海经济文件和图形数据库和可视化技术的包装,“对人群调查的力量开辟了。我们收到了3500万加页面浏览景观,我们得到了这么多的导致它是一个超过记者正在做的事情。“
这两位苏州朱迪斯·Zeitung记者最初已经发表了一本关于巴拿马文件的书,并有一部电影。“这是一个有趣的是一个合作书。德国人撰写了这本书,但当地记者有一章,在每个国家都有一章,“包括她对西班牙的贡献。