Пособие по журналистике данных
Шрифт:
Рис 77. Where does the senator’s money come from?: donations per candidate (Gregor Aisch)
Какой можно сделать вывод
Зачастую подобный наглядный анализ нового массива данных кажется очень увлекательным путешествием в незнакомую страну. Вы – чужеземец, при вас только данные и предположения, но с каждым шагом, с каждым новым графиком вы все больше вникаете в вопрос. На основе полученных выводов вы предпринимаете новые шаги, решаете, какие вопросы требуют более тщательного изучения. Как становится ясно из этой главы, процесс визуализации, анализа и преобразования данных можно повторять практически бесконечно.
Исходный
Все графики, изображенные в этой главе, были созданы с помощью очень полезного и эффективного инструмента R. Создавался он главным образом как инструмент визуального представления научных данных, но трудно найти способ визуализации или извлечения данных, который бы не был уже предусмотрен в R. Для тех, кто интересуется работой с R, я даю ссылки на исходные коды графиков, представленных в этой главе. Существует также множество книг и руководств по этой программе.
Точечная диаграмма: взносы на каждого кандидата
График: все взносы за период времени
График: взносы от уполномоченных комитетов
— Грегор Эйш Open Knowledge Foundation
Представление данных
Представление данных общественности
Существует много разных способов представить ваши данные общественности — начиная с публикации наборов исходных данных вместе с информационно–аналитическими материалами, и заканчивая созданием красивых визуализаций и интерактивных веб–приложений. Мы попросили ведущих журналистов, работающих с данными, обозначить подсказки и дать советы по поводу того, как представлять данные общественности.
Визуализировать или не визуализировать?
Бывают случаи, когда данные могут рассказать историю и передать суть материала лучше слов или фотографий, вот почему такие термины как «новостное приложение» и «визуализация данных» получили статус своего рода модного словечка в столь многих ньюсрумах в последнее время. Также подпитывает интерес и небывалый урожай новых инструментов и технологий (зачастую, свободно распространяемых и бесплатных), предназначенных для того, чтобы помочь даже самым продвинутым журналистам данных создать проект в области визуализированной подачи материала.
Такие инструменты как таблицы Google Fusion (Google Fusion Tables), Many Eyes, Tableau, Dipity, и другие, облегчают задачу, будь то создание карт, графиков, диаграмм, или даже полноценных и полномасштабных приложений по работе с данными, которые до того были исключительно прерогативой специалистов. В результате в условиях, когда барьер для входа в эту область ныне уменьшился до размеров дорожного полицейского, перед журналистами теперь встал вопрос не столько о том, как превратить ваш набор данных в визуализацию, сколько о том, стоит ли это делать. Плохая визуализация данныххуже во многих отношениях, чем никакой визуализации.
— Арон Пилхофер, New York Times
Использование анимированной графики
С четким, жестким сценарием, четко размеченной по времени анимацией и ясными объяснениями, анимированная графика может отлично служить решению задачи оживления сложных цифр или идей, может направлять вашу аудиторию по ходу освоения ею вашего сюжета или материала. Видео–лекции Ханса Рослинга (Hans Rosling) могут служить хорошим примером того, как данные могут воплотиться в жизнь, ожить и заиграть новыми красками, чтобы рассказать основанную на цифрах историю. И вы бы не стали, или вам не следовало бы, представлять эту графику в виде статичной картинки. Там слишком много всего происходит. А когда это выстраивается и монтируется шаг за шагом, у вас остается понимание того, как и когда авторы пришли к этому показателю. С анимированной графикой и анимированными короткими роликами вы можете усилить то, что слышит ваша аудитория из озвучки, путем объясняющих все видео– и визуализаций, что дает в итоге очень мощный и запоминающийся способ создания сюжета и рассказа истории.
— Лулу Пинней,BBC
Повествуя всему миру
Наш рабочий процесс обычно начинается в Excel. Это очень простой способ быстро
Половина трафика для некоторых из наших постов идет с «Твиттера» или с «Фэйсбука». Мы весьма гордимся тем, что среднее количество времени, которое пользователи проводят в статье в Datablog, составляет 6 минут, по сравнению с одной минутой в среднем для остальной части вебсайта Guardian. Шесть минут это весьма хороший показатель, а время, проведенное пользователем на странице, является одним из ключевых индикаторов при анализе нашего трафика.
Это также помогает убедить наших коллег в ценности и полезности того, что мы делаем. Это, а также большие основанные на данных сюжеты и материалы, которые мы создали, и которые знакомы каждому в ньюсруме: COINS, Wikileaks и британские волнения. Для проекта данных по расходам COINS у нас было 5–6 спецкорреспондентов в Guardian, которые работали над тем, чтобы представить свою точку зрения на данные, когда они были обнародованы британскими властями. У нас также была команда из еще 5–6 человек, которая работала на проектом, посвященным расходам британского правительства в размере свыше 25 000 фунтов стерлингов — в эту команду входили также хорошо известные журналисты, такие как Полли Кертис (Polly Curtis). Данные Wikileaks также совершенно очевидно были очень большими — множество историй об Ираке и Афганистане. Проект по беспорядкам в Британии также был очень большим, и набрал более 550 000 «хитов» всего за два дня.
Но речь не только о краткосрочных «хитах»: эти проекты также стали надежным источником полезной информации. Мы стараемся быть тем местом, где вы можете получить качественную, осмысленную, выразительную и достоверную информацию по темам, которые мы освещаем.
— Саймон Роджерс, The Guardian
Опубликование данных
Мы часто встраиваем наши данные в наш сайт при помощи визуализации, в той форме, которая дает возможность легко скачивать наборы данных. Наши читатели могут изучать данные, лежащие в основе материалов, посредством взаимодействия в рамках визуализации, или же использовать сами исходные данные иными способами. Почему это важно? Это увеличивает степень прозрачности The Seattle Times. Мы показываем читателям те же самые данные, которые мы сами использовали для того, чтобы прийти к серьезным выводам и заключениям. А кто этим пользуется? Конечно, наши критики, а также те, кто просто интересуется поднятой темой и всеми ее ответвлениями, последствиями и вариантами развития событий. Делая данные доступными, мы также можем набрать подсказок от этих самых критиков и читателей в целом — о том, что мы, возможно, могли упустить, и что нам, возможно, стоит исследовать дальше — что очень ценно в погоне за созданием журналистских материалов, которые будут иметь значение.
— Шерил Филлипс (The Seattle Times)
Открытие ваших данных
Предоставлять потребителям новостей легкий доступ к данным, которые мы использовали для нашей работы — это правильно по нескольким причинам. Читатели могут удостовериться, что мы не вымучиваем данные, чтобы прийти к несправедливым, нечестным или неправильным выводам. Делать наши данные открытыми — это традиция для общественных и социальных наук, которая позволяет исследователям повторить нашу работу. Стимулирование читателей к тому, чтобы изучать данные, может дать нам подсказки, которые могут привести к появлению дополнительных историй или сюжетов на основе данных. Наконец, участвующие в процесс читатели, интересующиеся вашими данными, весьма вероятно, будут возвращаться к вам снова и снова.