Пособие по журналистике данных
Шрифт:
Существует целый ряд очень прибыльных медийных компаний, работающих с данными, которые просто применили этот принцип раньше других. Они демонстрируют здоровый рост и порой впечатляющую прибыль. Один пример: Bloomberg. Компания оперирует более чем 300 000 терминалов и поставляет финансовые данные своим пользователям. Если вы в финансовом бизнесе, то это мощный инструмент. Каждый терминал идет с клавиатурой с цветовыми кодами, и предоставляет до 30 000 возможностей искать, смотреть, сравнивать, анализировать. Он помогает вам решать, что делать в следующий момент времени. Этот ключевой бизнес генерирует примерно 6,3 миллиарда долларов в год, по крайней мере, такая оценка содержится в материале New York Times 2008 года. В результате Bloomberg нанимает
Еще одним примером может служить канадский медиа–конгломерат, ныне известный как Thomson Reuters. Они начинали всего с одной газеты, потом купили ряд широко известных брендов в Великобритании, и потом решили два десятилетия назад уйти из газетного бизнеса. Вместо этого они выросли на базе информационных услуг, целью которых является предоставлять клиентам в ряде отраслей более глубокую точку зрения. Если вы озабочены тем, как делать деньги на специализированной информации, советом может быть просто прочитать историю компании в Wikipedia.
А взгляните на Economist. Журнал выстроил отличный, влиятельный бренд в медийной отрасли. В то же самое время «расследовательское подразделение Economist» сейчас больше походит на консалтинговое, информирующее о соответствующих тенденциях и прогнозах практически для каждой страны мира. Они используют сотни журналистов и заявляют, что обслуживают около 1,5 миллиона клиентов по всему миру.
И кроме того существуют также многочисленные основанные на данных нишевые сервисы, которые могут служить источником вдохновения: eMarketer в США, представляющий сравнения, списки, таблицы и рейтинги, и дающий советы любому, кто интересуется интернет–маркетингом. Stiftung Warentest в Германии — учреждение, следящее за качеством продуктов и услуг. Statista, вновь из Германии — стартап, помогающий визуализировать публично доступную информацию.
По всему миру сейчас накатывает целая волна стартапов в этом секторе, естественным образом освещающая широкий круг вопросов и тем – например, Timetric, целью которого является заново изобрести такой формат как бизнес–исследования, OpenCorporates, Kasabi, Infochimps и Data Market. Многие из них, конечно, являются экспериментальными, но все вместе они могут быть восприняты как важный признак перемен.
Потом есть государственные средства массовой информации, которые в смысле журналистики данных являются эдаким спящим исполином. В Германии 7,2 миллиарда евро в год вливается в этот сектор. Журналистика — это особый продукт: если она делается хорошо и качественно, это не только «делание денег», она вдобавок играет важную роль в обществе. Как только станет ясно, что журналистика данных может предоставлять лучшую и более надежную и достоверную информацию, и при этом делать это легче и проще, чем традиционная журналистика, часть этих денег может начать использоваться для того, чтобы в ньюсрумах стали появляться новые рабочие места.
Что касается журналистики данных, то она подразумевает не только «быть первым», но и «являться вызывающим доверие источником информации». В этом многоканальном мире внимание к себе можно генерировать и привлекать в изобилии, но доверие становится все более дефицитным ресурсом. Журналисты данных могут помочь сопоставить, синтезировать и представить разнообразные, несходные и порой трудные для понимания источники информации таким способом, который даст их аудитории по–настоящему ценное понимание сложных проблем. Вместо того, чтобы просто перерабатывать пресс–релизы и пересказывать истории и сюжеты, которые они где–то слышали, журналисты, работающие в секторе журналистики данных, могут давать читателям ясную, всеобъемлющую и настраиваемую по предпочтениям перспективу или точку зрения, снабженную интерактивной графикой, а также прямой доступ к первичным источникам. Не тривиально, но определенно ценно.
Так каков же наилучший подход для того, чтобы вдохновить журналистов данных изучить и использовать
В качестве первого шага нужно взглянуть на незамедлительные возможности рядом: так сказать, сорвать низко висящий фрукт. Например, у вас, возможно, уже есть коллекции структурированных текстов и данных, которые вы могли бы использовать. Отличным примером такого является база данных Homicide от Los Angeles Times. Тут данные и визуализации являются ядром всего, а не следствием. Редакторы собирают информацию обо всех преступлениях, которую они обнаруживают, и только потом на этой основе пишут статьи. С течением времени подобные коллекции становятся лучше, глубже, и обретают бОльшую ценность.
Это может не работать первое время. Но со временем обязательно начнет. Одним очень обнадеживающим индикатором тут является, например, то, что проекты Texas Tribune и ProPublica, которые оба являются скорее всего медийными компаниями постпечатного периода, сообщали, что финансирование их некоммерческих журналистских организаций превысило намеченные заранее целевые показатели гораздо раньше, чем планировалось. Становясь опытными и искусными в работе со всеми этими данными – будь то работая с ними в общем и целом или как специалисты, концентрирующие внимание на одном аспекте из цепочки данных – эти проекты дают ценнейшую перспективу людям, которые верят в журналистику. Один известный издатель в Германии недавно отметил в интервью: «Это та самая новая группа, которая называет себя журналистами данных. И они не хотят больше работать за копейки».
— Мирко Лоренц, Deutsche Welle
Конкретные примеры
Проект «Расхождение в возможностях» (Opportunity Gap)
Рис 27. Проект Opportunity Gap(ProPublica)
Проект «Расхождение в возможностях ( The Opportunity Gap) использовал никогда ранее не публиковавшиеся данные американского Министерства образования о гражданских правах и показал, что в некоторых штатах, таких как, например, Флорида, ситуация достаточно ровная, там власти штата предлагают богатым и бедным студентам примерно равные возможности в плане доступа к предметам и дисциплинам высокого уровня, в то время как в других штатах, таких как Канзас, Мэриленд или Оклахома, возможностей, предлагаемых в районах, где живут более бедные семьи, гораздо меньше.
В проект были включены данные по каждой государственной школе в районе с числом учеников в 3 000 и более. Таким образом, были представлены более 75% всех обучающихся в государственных школах детей. Журналист из нашего ньюсрума получил данные, а наш директор по вопросам компьютерной журналистики качественно и быстро почистил их и обработал.
Проект реализовывался в течение примерно трех месяцев. В общей сложности, над сюжетом и новостным приложением работали шесть человек: два редактора, один журналист, один специалист по компьютерной журналистике и два разработчика. Большинство из нас работали не только над этим проектом в течение срока его реализации.
Проект действительно требовал объединения всех наших знаний и навыков — глубокого знания отрасли, понимания и ориентирования в лучших стандартах работы с данными, знаний в области дизайна и программирования, и так далее. И что еще более важно, он требовал наличия умения видеть и находить темы и сюжеты в наборах данных. Он также потребовал редактуры, не только для сюжета, который сопровождал проект, но и для самого новостного приложения.
Для очистки данных и анализа мы использовали по большей части Excel и очищающие программы, а также MS Access. Приложение было написано в Ruby on Rails, и в нем весьма активно используется JavaScript.