Ценность ваших данных
Шрифт:
Все это позволяет понять разницу между понятиями «данные» и «информация» и очертить преимущественные сферы их применения.
Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо научных подхода к определению этого термина [42] .
42
Шамис А. Л. Модели поведения, восприятия и мышления: курс лекций. – М.: Интуит НОУ, 2016. – URL: https://intuit.ru/studies/courses/2191/423/info.
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби [44] .
43
Клод Шеннон (Claude Elwood Shannon) – выдающийся американский математик, основатель математической теории информации.
44
Уильям Эшби (William Ross Ashby) – английский психиатр, крупный теоретик кибернетики.
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее потребителя. Все способы количественного определения ценности основаны на представлении о цели, достижению которой способствует полученная информация. Чем больше информация помогает достижению цели, тем более ценной она считается [45] . Массив информации объемом в сотни гигабайт может иметь колоссальную важность для одной организации и нулевую для другой.
45
Чернавский Д. С. Синергетика и информация (динамическая теория информации). 2-е изд., испр. и доп. – М.: Едиториал УРСС, 2004.
Основываясь на приведенных сведениях, можно продолжить обсуждение вопросов, относящихся к ценности данных.
Как уже говорилось выше, применительно к сфере управления данными термины «данные» и «информация» часто используются как синонимы. Кроме того, как видно из приведенных выше определений, термин «информация» иногда заменяется термином «знания».
Всегда ли допустимо такое обобщение и не приводит ли оно к недоразумениям? В частности, к существенному недопониманию между участниками многочисленных проектов по внедрению различного рода информационных систем, а также между участниками их дальнейшей эксплуатации и пользователями. В том числе и по вопросам определения ценности данных.
Для ответа необходимо более подробно обсудить взаимосвязь понятий «данные» и «информация», а также соотнести их с понятиями «знания» (knowledge) и «мудрость» (wisdom).
2.2. Информационная иерархия
При обсуждении взаимосвязи понятий «данные», «информация», «знания» и «мудрость» обычно используется классическое представление – иерархия Data-Information-Knowledge-Wisdom (DIKW). Часто в литературе применяются названия «иерархия знаний», «пирамида знаний» или же «информационная иерархия», «информационная пирамида».
В большинстве исследований, посвященных происхождению иерархии DIKW (например, [46] [47] [48] ) в качестве одного из наиболее ранних источников, в которых встречается ее описание, обычно упоминается статья Харлана Кливленда [49] «Информация как ресурс». Она была опубликована в 1982 году в американском журнале The Futurist [50] .
46
Sharma N. The origin of the data information knowledge wisdom hierarchy, 2005. – URL: https://web.archive.org/web/20051221151426/http://www-personal.si.umich.edu/~nsharma/dikw_origin.htm.
47
Rowley J. The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information Science, 2007, 33(2), 163–180. DOI: 10.1177/0165551506070706. – URL: http://www-public.imtbs-tsp.eu/~gibson/Teaching/Teaching-ReadingMaterial/Rowley06.pdf.
48
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and Innovation (JEMI), 2014, Vol. 10, Iss. 1: 79–107. DOI: 10.7341/20141013. – URL: https://www.semanticscholar.org/paper/Models%2C-Metaphors-and-Symbols-for-Information-and-Williams/fde0d2b7da419d66f1cdbc7cce8ff37116254cf3.
49
Харлан Кливленд (Harlan Cleveland) – американский дипломат, педагог и писатель.
50
Cleveland H. Information as Resource. The Futurist, 1982. Vol. 16. No. 6, Pp. 34–39.
По
Хотя известно несколько более ранних публикаций других авторов, затрагивающих эту тему [51] , статья Кливленда цитируется особенно часто и примечательна фрагментом из поэмы Томаса Элиота [52] «Камень» (The Rock), написанной в 1934 году, в которой отражена иерархическая взаимосвязь понятий «информация», «знания» и «мудрость».
51
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and Innovation (JEMI), 2014, Vol. 10, Iss. 1: 79–107. DOI: 10.7341/20141013. – URL: https://www.semanticscholar.org/paper/Models%2C-Metaphors-and-Symbols-for-Information-and-Williams/fde0d2b7da419d66f1cdbc7cce8ff37116254cf3.
52
Томас Элиот (Thomas Stearns Eliot) – выдающийся английский поэт, лауреат Нобелевской премии по литературе 1948 года.
Кливленд назвал определенную в поэме цепочку понятий «иерархией Элиота». После выхода его статьи в специальной литературе прочно закрепилось мнение о том, что именно Элиоту принадлежит авторство идеи иерархии DIKW (или, по крайней мере, IKW) [53] .
53
В литературе часто упоминается еще один представитель мира искусств, который описал иерархию IKW до того, как она стала активно обсуждаться специалистами по обработке информации и управлению знаниями, – легендарный американский рок-музыкант Фрэнк Заппа (Frank Zappa). Связанные с этой темой рассуждения приводятся в его песне Packard Goose из альбома Joe’s Garage: Act II & III (1979).
Среди академических работ, в которых рассматривается иерархия DIKW, наиболее ранней стала статья Милана Желены [54] «Системы поддержки управления: На пути к интегрированному управлению знаниями» [55] . В ней описана схема последовательного продвижения от данных к знаниям. Ученый предложил упрощенные определения уровней иерархии, основанные на знании ответов на простые вопросы.
Данные – «не знаю – ничего» (know-nothing).
54
Милан Желены (Milan Zeleny) – американский экономист чешского происхождения, профессор в области систем управления Фордхемского университета (Fordham University).
55
Zeleny M. Management support systems: Towards integrated knowledge management. Human Systems Management, 1987, 7(1), 59–70.
Информация – «знаю – что» (know-what).
Знания – «знаю – как» (know-how).
Мудрость – «знаю – почему» (know-why).
В то же время Желены заметил, что, хотя данные и информация (благодаря их атомарной, дробной, нецелостной природе) могут быть сгенерированы без интерпретации человеком, знания и мудрость зависят от человека и контекста и не могут быть рассмотрены без использования процедур оценки и принятия решения человеком.
Автором одного из наиболее систематизированных и целостных описаний взаимосвязи понятий «данные», «информация», «знания» и «мудрость» часто называют Рассела Акоффа [56] . В 1989 году был опубликован текст его президентского обращения к Международному обществу общесистемных исследований (International Society for General Systems Research, ISGSR) под заголовком «От данных к мудрости» [57] .
56
Рассел Акофф (Russell Lincoln Ackoff) – известный американский ученый и консультант в области исследования операций, теории систем и стратегического менеджмента.
57
Ackoff R. L. From Data to Wisdom // Journal of Applied Systems Analysis, 1989, 16, 39. (Русский перевод: Р. Акофф. От данных к мудрости // Проблемы управления в социальных системах, 2011. – URL: