Пособие по журналистике данных
Шрифт:
— Стив Дойг (Школа журналистики Уолтера Кронкайта, Университет штата Аризона)
Создавая платформу открытых данных
В La Naci'on публикация открытых данных является неотъемлемой составной частью нашей деятельности в области журналистики данных. В Аргентине нет закона о свободе информации, и нет национального портала данных, поэтому мы испытываем непоколебимые убеждения в необходимости предоставления нашим читателям доступа к тем данным, которые мы используем в наших сюжетах и материалах.
Поэтому мы публикуем
Более того, мы представляем некоторые из этих наборов данных и визуализаций в нашем блоге данных NACION(NACION Data blog). Мы делаем это с целью продвигать, буквально–таки проповедовать данные и инструменты для публикации данных в Аргентине, а также для того, чтобы показать другим, как мы собирали наши данные, как мы использовали их, и как они могут повторно их использовать.
С тех пор, как мы открыли эту платформу в феврале 2012 года, мы получили много предложений и идей по поводу работы с наборами данных, в основном, от представителей академических кругов и разных исследователей, а также от студентов университетов, которые всякий раз выражают огромную благодарность, когда мы реагируем на их запросы созданием какого–либо решения или специального набора данных. Люди также работают с нашими данными и комментируют их в Tableau, и несколько раз наши заметки и статьи становились наиболее комментируемыми и выходили в топ этой службы. В 2011 году на нашу долю пришлось 7 из топ–100самых просматриваемых визуализаций.
— Ангелика Перальта Рамос, La Naci'on, Аргентина
Сделать данные более человечными и понятными
По мере того, как разговоры вокруг больших объемов данных ведутся во все более широких масштабах и начинают охватывать все более широкий набор тем, одна важная часть подозрительным образом отсутствует в таких обсуждениях — это человеческий фактор. В то время как многие из нас считают данные ни к чему не причастными, пребывающими в свободном обращении цифрами, на самом деле они представляют собой результаты измерений и оценки весьма ощутимых и осязаемых фактов (зачастую вполне человеческих). Данные привязываются к реальной жизни реальных людей, и когда мы имеем дело с цифрами, мы должны учитывать те субстанции и системы реального мира, откуда они, эти данные, поступают.
Возьмем, например, данные о местоположении, которые сейчас, прямо в данный конкретный момент, собирают сотни миллионов телефонов и иных мобильных устройств. Легко думать об этих данных (цифрах, которые фиксируют широту, долготу и время), как об эдаких цифровых «выхлопных газах», своего рода побочной информации, но на самом деле они являются дистиллированными моментами нашей личной жизненной повести, представляют собой хронологически подобранные сведения о нас. И хотя они могут казаться сухими и безжизненными, если их читать в таблице, то когда мы даем возможность людям нанести данные о самих себе на карту и вновь проиграть их, они испытывают своего рода повтор памяти, что является мощным инструментом и вписывается в рамки человеческой составляющей.
В настоящий
Журналисты играют очень важную роль в обнародовании, вытаскивании, так сказать, «на свет божий», этой присущей данным человеческой природы, человеческой составляющей. Делая это, они обладают силой, позволяющей менять общественное понимание и восприятие — как данных, так и тех систем, их которых эти данные возникли.
— Джер Торп, специалист по работе с данными: Научно–исследовательский отдел New York Times
Открытые данные, открытые источники, открытые новости
2012 год вполне можно назвать годом открытых новостей. Это лежит в самом центре нашей редакционной идеологической политики и является ключевым посылом нашей нынешней брендовой политики. На фоне всего этого ясно, что нам нужен открытый процесс для журналистики в области работы с данными. Этот процесс должен не только подпитываться открытыми данными, но также обеспечиваться наличием открытых инструментов для работы с ними. К концу года мы рассчитываем иметь возможность сопровождать каждую визуализацию, которую мы публикуем, доступом как к данным, которые лежат в ее основе, так и к программе, благодаря которой она была сделана и работает.
Многие из инструментов, используемых для визуализации сегодня, являются закрытыми исходниками и программными продуктами. Другие выпускаются с ограниченными лицензиями, которые запрещают использование деривативных, производных, вторичных данных. Библиотеки открытых источников, которые сейчас существуют, часто могут решить одну проблемы, но неспособны предложить более широкую методологию. Все это вместе взятое осложняет людям задачу делать свои построения на работах друг друга. Эта проблема скорее способствует сокращению разговоров и обсуждений проектов, чем увеличению и распространению их. В связи с этим мы разрабатываем набор открытых инструментов для интерактивного рассказывания историй и создания материалов — the Miso Project (@themisoproject).
Мы обсуждаем эту работу с многочисленными медийными организациями. Требуется участие всего сообщества, чтобы осознать полный потенциал программного обеспечения с открытым исходным кодом. Если нам будет сопутствовать успех, это будет способствовать появлению совершенно иной динамики среди наших читателей. Их вклад тогда отойдет от одних лишь комментариев и станет представлять собой уже дублирование и копирование нашей работы, поиск ошибок и недочетов в нашей работе или повторное использование данных неожиданными способами.