Алгебра аналитики. Секреты мастерства в аналитической работе
Шрифт:
Вообще создание сетей связано с интенсификацией таких процессов, как контроль функционирования централизованного государства через систему налогообложения, деятельность таможенных органов и т. д. Базы данных нужны везде – в бизнесе, на транспорте, в банковском секторе, в политике, в госстатистике, при решении вопросов гражданства, для борьбы с криминалом. Очевидно, начало этим процессам в современном смысле слова положил сбор данных при учёте народонаселения для обеспечения воинской повинности. В далёкие средние века в итальянских городах-государствах Венеции и Генуе создавались БД для сопровождения бизнеса в банковской сфере. Эти БД были действенны (за ними стояло финансовое могущество банковских структур и государства), но достаточно ограничены по своим масштабам, охватывали незначительное число граждан по различным аспектам их финансового взаимодействия между собой, что отражалось в этих базах.
Позднее в Европе БД начали охватывать и другие аспекты жизнедеятельности (собственность,
Например, в Марселе в 1914 г. полицейские постреляли всех уголовников. Очевидно, это была не столько социальная мера в условиях войны, сколько следствие отсутствия систематической информации, возможности ведения БД для поиска преступников профессионально, систематически и регулярно. Поэтому решили избавиться от них кардинально. О подобных же методах, когда «виноваты все» свидетельствует и опыт нашей гражданской войны, весь советский опыт.
Вслед за армией, спецслужбами (тайной полицией, военной разведкой) и некоторыми другими институтами государства (например, статистические учреждения, нотариальные архивы), другие общественные институты в связи с качественным усложнением жизни также стали создавать (разрабатывать, поддерживать, усложнять) свои локальные БД. Образовывались публичные библиотеки с миллионами томов, книготорговые фирмы (тысячи наименований, пересылка книг по почте), выпуск каталогов с ценниками, что по сути уже было первыми аналитическими БД доступной информации по разделам.
Помимо локальных (но достаточно объёмных, например, в рамках всей страны – железнодорожный справочник общих сетей), БД стали появляться и в виде каталогов, специализированных микросетей. Архив с гарнитуром генеральши Поповой (Ильф и Петров «Двенадцать стульев»), путеводитель по дворянским усадьбам средней полосы, геральдические сборники, личные библиотеки и библиография в конце книги – тому примеры. Изначально понятна ограниченность формата данных из этих каталогов и специализированных сетей, что однако вовсе не говорит об их невостребованности, неиспользуемости.
В течение многих лет практика создания БД постоянно совершенствовалась, распространялась на различные сферы, а во второй половине XX века, когда мир охватила всеобщая информатизация, стала обычной. В XXI веке она нашла своё органичное продолжение через создание БЗ.
Большая статистическая работа проводилась ещё русскими земствами, особенно в период проведения первой переписи населения. В советский период структуры Госплана СССР предоставляли громадную, достаточно полную и систематизированную информацию по многим аспектам народно-хозяйственной жизни. Работа Министерства торговли и финансов позволяла измерять экономические показатели развития страны, вести БД по отраслям промышленности, регионам, замерять и отчасти предсказывать соотнесения валют, ёмкости рынков, динамику изменений. Важно также отметить, что статистические данные были достаточно полными, систематическими и публичными (открытыми). Последнее обстоятельство позволяло заинтересованным людям самим не дублировать работу ведомств, использовать статистические данные в своей практической деятельности, заказывать проведение иных выборок и статистических исследований под свои задачи и в своих интересах. Так постепенно на рубеже веков в России появился рынок Аналитики.
Чрезвычайно важным фактором, определяющим успешность применения созданной БД, является структура описаний (совокупность атрибутов, используемых для описания объектов учёта). Если структура описаний не обеспечивает тех возможностей, которые необходимы потребителю для производства работ
БД и БЗ представляют собой уникальный источник информации, использование которого в сочетании с иными средствами автоматизации аналитической работы способно многократно повысить продуктивность труда аналитика. Характерно, что большинство технических средств сбора информации, выражающих результаты в символьном виде, способно служить источниками только таких – специализированных данных. Как следствие, методологическое обеспечение систем анализа структурированных и числовых параметрических данных во многом совпадает. Даже в случае, когда в качестве параметров используются естественно-языковые термины, они могут рассматриваться как численные оценки значения атрибута, между которыми могут быть установлены те или иные отношения (порядка, величины, объёма понятия и т. д.). В результате для обработки таких данных могут быть (хоть и с некоторыми изменениями) применены пакеты автоматизированной статистической обработки данных наблюдений, системы математического моделирования и иные программные средства, располагающие широкими возможностями для проведения статистических исследований, анализа временных рядов, сравнительного анализа и так далее.
Современная аналитика располагает чрезвычайно обширной источникевой базой. В арсенале средств сбора информации присутствуют самые изощрённые системы: начиная от спутниковых систем мониторинга атмосферы и земной поверхности, радио и оптико-электронной разведки и заканчивая самим, вооружённым аналитическими способностями, мыслетехнологиями и навыками, аналитиком.
По существу, одной из задач информационной работы и является построение именно такого, структурированного ресурса для «внутреннего потребления» субъектом Аналитики. Однако на пути к этому необходимо решить целый ряд сложных проблем, связанных с переходом от символьных данных произвольной семантики к символьным данным специальной семантики, обладающих метризованным словарём. Здесь, в частности, используются методы нечётких множеств, многозначной и нечёткой логики (работы А. Лукасевича, Л. Заде и их последователей). В современной России за последние два десятка лет сделаны огромные подвижки в плане информатизации общества, развёртывания глобальных и локальных вычислительных сетей, интернета, мобильной телефонной связи, создания качественно новых БД и БЗ и т. д. Полностью развёрнута российская космическая навигационная система ГЛОНАСС, которая обеспечивает глобальную непрерывную навигацию на поверхности Земли и на высотах до 200 км и на текущее время сопоставима по основным характеристикам (точность, доступность, оперативность) с американской системой GPS. Развёртываются и конкурирующие системы спутниковой навигации: европейская «Galileo», китайская «Бэйдоу» и др.
Справка: Впервые космический аппарат системы ГЛОНАСС был запущен в октябре 1982 г. Штатная орбитальная группировка состоит из 24 космических аппаратов, расположенных в трёх орбитальных плоскостях, разнесённых на 120 градусов, в каждой из которых размещается по 8 спутников, что обеспечивает устойчивый сигнал.
Сегодня упрощаются (убыстряются, удешевляются) коммуникации, процесс обмена информацией становится условием происходящей в мировом масштабе глобализации, когда проигрывает отстающий (закрывшийся от потоков информации). Одновременно сосуществуют три уровня сетей. Их взаимодействие создаёт информационное пространство, где живёт современный человек.
Первый уровень – глобальные сети (интернет, радио, ТВ), как правило, дающие лишь контекст.
Второй уровень – федеральный и локально ведомственный. Например, есть материалы контрольных и экспертно-аналитических мероприятий Счётной палаты Российской Федерации, где я нахожусь много лет на государственной гражданской службе, востребованные лишь узкими специалистами, крупными политиками, бизнесменами, госчиновниками, но без них (другое дело, насколько они достоверны) управлять государством невозможно. Существуют локальные БД, условно не связанные с остальными (шахматисты, писатели, поликлиники с домашними адресами и телефонами своих пациентов), специализированные (включая условно закрытые, тем не менее, продающиеся на «Горбушке», включающие всех налогоплательщиков административного округа или района с указанием их облагаемого налогом имущества) и т. д.