Пособие по журналистике данных
Шрифт:
В дополнение к общему обзорному материалу наш вариант освещения данной темы включал в себя интерактивное новостное приложение, которое давало читателям возможность понять и найти примеры в этом огромном общенациональном наборе данных, имеющие отношение лично к ним. Используя наше новостное приложение, читатель мог легко найти местную школу у себя в районе — скажем, например, Central High School in Newark, N.J., — и сразу же увидеть, насколько хороша эта школа в целом ряде областей. Потом читатель мог нажать кнопку ‘Сравнить по уровню нищеты’, и тут же увидеть другие средние школы, их относительный уровень бедности, в каком объеме они дают продвинутую математику, программы углубленного изучения предметов, и другие важные
Посредством этого примера читатель может использовать что–то, что он знает, с чем он знаком — а именно, местную среднюю школу — для того, чтобы понять что–то, чего он не знает, с чем не знаком — распределение доступа к образованию и степень, в которой бедность населения оказывает воздействие на такой доступ.
Мы также интегрировали приложение с сервисом Facebook, так, чтобы читатели могли залогиниваться в Фэйсбуке, а наше приложении автоматически даст им знать о школах, которые могут представлять для них интерес.
Все наши новостные приложения собирают хороший трафик, и мы особенно гордимся тем, как эти приложения рассказывают сложные истории, раскрывают непростые для понимания темы — и более того, помогают читателям самим создавать конкретные свои истории, актуальные для них самих.
Как это бывает со многими проектами, которые берут свое начало в официальных данных органов власти, данным этим требуется серьезная очистка. Например, хотя всего существует примерно 30 возможных вариантов курсов углубленного изучения предметов, некоторые школы сообщают, что у них таких курсов — сотни. Все это требует большого количества проверок, которые приходится проводить в ручном режиме, а также телефонных звонков в школы для подтверждения или исправления информации.
Мы также действительно упорно поработали над тем, чтобы убедиться, что приложение способно раскрывать материал как в узком, так и в широком смысле. Приложение должно было представлять читателю широкую, абстрактную картину общенациональной ситуации — способ сравнить, как отличается ситуация с доступом к образованию от штата к штату. Но учитывая, что подобные абстракции порой приводят читателя в замешательство, и он не понимает, что те или иные данные значат для него лично, мы также хотели, чтобы читатели имели возможность найти свою собственную местную школу и сравнить ее с более бедными и менее бедными школами в их районе.
Если бы мне пришлось давать совет журналистам, заинтересованным в том, чтобы предпринять такого рода проекты, я бы сказал, что вам нужно в первую очередь знать материал, ориентироваться в нем и быть любознательными, пытливыми и настойчиво любопытными! Все правила, которые применимы к другим видам журналистики, применимы и здесь. Вам нужно правильно набирать фактуру, удостовериться, что материал сделан грамотно и качественно, и что критически важно, убедиться в том, что ваше новостное приложение не противоречит той истории, которую вы излагаете в текстовом материале — потому что если такое случается, это значит, что один из этих продуктов подготовлен неверно.
И кроме того, если вы хотите научиться программировать, хотя бы на элементарном уровне, то самое важное — начать. Вам, возможно, понравиться ходить на уроки или учиться по книгам или видеоинструкциям. Все это доступно и весьма качественно. Но главное — убедитесь в том, что у вас есть по–настоящему хорошая
— Скотт Клейн, ProPublica
9–месячное расследование в отношении Европейских структурных фондов
Рис 28. Расследование в отношении Европейских структурных фондов(Бюро расследовательской журналистики)
В 2010 году газета Financial TimesБюро расследовательской журналистики ( Bureau of Investigative Journalism (BIJ)объединили усилия, чтобы заняться расследованием Европейских структурных фондов. В их намерения входило исследовать то, кем являются бенефициары Европейских структурных фондов, и проверить, должным ли образом используются финансовые средства. Структурные фонды, объем поступлений в которые за 7 лет составил 347 миллиардов долларов, являются второй по величине программой субсидий в Евросоюзе. Программа существовала десятилетиями, но не беря в расчет широкие, очень общие по содержанию обзоры, не было практически никакой прозрачности относительно того, кто же является бенефициаром этих фондов. В рамках смены правил игры в текущем раунде финансирования власти обязаны обнародовать список бенефициаров, включая описания спонсируемых проектов и суммы, полученные по каналам финансирования на национальном уровне и на уровне ЕС.
Команда проекта состояла из 12 журналистов и одного штатного программиста. Сотрудничество длилось 9 месяцев. Только один лишь сбор данных занял несколько месяцев.
Результатом проекта стали пять дней освещения темы в Financial Times и в BIJ, а также документальный фильм на ВВС и еще несколько телевизионных документальных фильмов.
Прежде чем приступить к проекту, требующему подобного уровня усилий, необходимо удостовериться, что все выводы — оригинальны, свежи и подлинны, и что результатом станут сюжеты и материалы, которых не будет больше ни у кого.
Процесс был разбит на ряд отчетливых, обособленных шагов:
1. Определить, кто хранит данные и как они хранятся.
У Генерального директората Европейской комиссии по вопросам региональной политики есть порталс выходом на сайты региональных властей, которые публикуют данные. Мы были уверены, что у комиссии должна быть всеобъемлющая база данных для проекта, к которой мы могли бы либо получить прямой доступ, либо добиться его при помощи запроса на предоставление данных согласно нормам свободы информации. Однако никакой подобной базы, как оказалось, не существует, по крайней мере, настолько подробной, насколько нам требовалось. Мы быстро поняли, что многие из гиперссылок, предоставленных Еврокомиссией, были битыми, неработающими, а также что большинство органов власти публикуют данные в формате PDF, а не в легко поддающихся анализу форматах типа CSV или XML.
Команда из 12 человек работала над решением задачи определения самых свежих данных и превращения ссылок в одну большую таблицу, которую мы использовали для совместной работы. Так как графы и столбцы с данными не были однообразными (например, заголовки часто были на разных языках, в некоторых наборах данных использовалась разная валюта, а в какие–то данные была включена разбивка на европейское и национальное финансирование), нам нужно было быть очень точными при переводе и переформатировании, как и при описании групп данных, имевшихся в каждом из источников.