Пособие по журналистике данных
Шрифт:
The Data Hub
Ресурс, поддерживаемый фондом «Открытая информация» (Open Knowledge Foundation), который способствует легкому поиску, обмену и использованию открытых доступных источников данных, в частности, благодаря автоматизации данных процессов.
ScraperWiki
Онлайн–инструмент, облегчающий «извлечение полезных битов данных, которые затем могут использоваться в других приложениях или внимательно изучаться журналистами и исследователями». Большая часть «скребков» и собираемых ими баз данных находятся в открытом доступе и могут свободно использоваться.
Появился ряд новых проектов, преследующих своей целью построить сообщества вокруг обмена данными и их перепродажи. К ним относятся, например, Buzzdata, — место, посвященное обмену частными и открытыми базами данных и сотрудничеству в данной сфере, и такие магазины данных, как Infochimps, и DataMarket.
DataCouch — Место, куда вы можете загрузить свои данные, обработать их, поделиться ими или визуализировать их.
Интересный проект Google Freebaseпредлагает «сущностной график людей, мест и вещей, созданный сообществом, любящим открытые данные».
Исследование данных.
Многочисленные национальные или отраслевые агрегаторы исследовательских данных, такие как, например, UK Data Archive. В то время как многие данные являются бесплатными, существует также большое количество баз данных, для использования которых необходима подписка или которые не могут использоваться или распространяться без предварительного разрешения.
Поиск на форумах
Вы можете поискать ответы на вопросы других пользователей или задать свой вопрос на таких ресурсах, как Get The Dataили on Quora. GetTheData — это сайт вопросов и ответов, на котором вы можете задавать вопросы, связанные с базами данных, в т. ч. о том, где можно найти данные, относящиеся к конкретному вопросу, как следует строить поисковые запросы или извлечь какой–то конкретный источник данных, какие инструменты использовать для наглядного исследования базы данных, как очистить базу данных или преобразовать ее в формат, с которым вы сможете работать.
Поиск в списках рассылок
Списки рассылок сочетают в себе знания целого сообщества по какому–то конкретному вопросу. Для журналистов, занимающихся изучением данных, ресурсы Data Driven Journalism Listи the NICAR–Lявляются превосходными отправными точками. Среди подписчиков этих списков — большое количество журналистов, занимающихся данными, и поклонников компьютезированных отчетов (Computer Assisted Reporting (CAR)), работающих над самыми разными проектами. Вполне возможно, что кто–то уже занимался вопросом, подобным вашему, и имеет представление, с чего нужно начинать, или даже знает, где взять необходимые данные. Также можно посетить ресурсы Project Wombat(«место обсуждения трудных вопросов»), списки рассылок фонда Open Knowledge Foundation, списки рассылок на сайте theInfo, или самостоятельно провести поиск списков рассылок по интересующей вас теме или региону.
Присоединиться к сообществу Hacks/Hackers
Hacks/Hackers —
Спросить эксперта
Преподаватели, государственные служащие и представители той или иной отрасли зачастую знают, где необходимо искать то, что нужно. Позвоните им. Напишите им по электронной почте. Подойдите к ним на каком–нибудь мероприятии. Придите к ним в офис. Вежливо спросите. «Я пишу статью о том–то и том–то. Вы не знаете, где я могу найти такую информацию? Может быть, Вы знаете, у кого она может быть?»
Узнайте побольше об IT–структуре органов власти
Понимание технических и административных условий, в которых органы власти хранят свою информацию, часто оказывается полезным при поиске доступа к данным. Будь то CORDIS, COINS или THOMAS — все эти базы данных, название которых состоит сплошь из прописных букв, зачастую становятся более полезными после того, как вы чуть больше узнаете о том, зачем они были созданы.
Найдите схемы структурной организации правительства и поищите в них департаменты/подразделения, исполняющие сходные функции (например, отчетность, IT–услуги), а затем изучите их веб–сайты. Многочисленные ведомства ведут многочисленные базы данных, и в то время как одни из них берегут свои данные как зеницу ока, другие могут поделиться ими с вами совершенно бесплатно.
Обратите внимание на динамичную инфографику на правительственных сайтах. В основе этих элементов нередко лежат структурированные источники данных/API (интерфейсы программирования приложений), которые могут быть использованы самостоятельно (например, приложения расписаний авиарейсов или java–приложения прогнозов погоды).
Снова проведите поиск, используя фразы и самые невероятные наборы слов, с которыми вы столкнулись с момента последнего поиска
Когда вы знаете больше о том, что вы ищете, у вас больше шансов получить от поисковиков нужный результат!
Напишите запрос на основании законодательства о свободе информации
Если вы считаете, что у какого–либо ведомства имеются необходимые вам данные, то наилучшим способом их получения может оказаться запрос на основании законодательства о свободе информации. Далее мы познакомимся с информацией о том, как следует составлять такой запрос.
— Брайан Бойер (Chicago Tribune), Джон Киф (WNYC), Фридрих Линденберг (Open Knowledge Foundation), Джейн Парк (Creative Commons), Крис Ву (Hacks/Hackers)