Анонимность и безопасность в Интернете. От «чайника» к пользователю
Шрифт:
частота использования уникальных слов;
использование одних и тех же уникальных слов в открытых и анонимных публикациях;
активный словарный запас (количество уникальных словарных слов в тексте);
активный несловарный запас (количество уникальных выдуманных слов в тексте);
статистика использования частей речи – процент существительных, глаголов, прилагательных и т. п.;
биграммы частей речи, то есть частота употребления пар "существительное-глагол", "наречие-прилагательное" и т. п.;
позиции частей речи в предложении (по всем частям
биграммы буквенных пар (подсчет по всем алфавитным парам "аа", "аб", "ав" и т. п.).
Для лингвистического анализа текста специалисты используют набор различных методов. С некоторыми из них вы можете познакомиться по адресу: http://filologia.su/metody. В Интернете также можно найти программы для лингвистического анализа текста – например, Лингвистический анализатор 2.0, который можно скачать бесплатно по адресу: http://softok.org/science/naukateh/7776prog.html. Программа не заменит вам опытного аналитика, но все же это лучше, чем ничего.
В общем, информации в Интернете по этой теме – очень много, но наша книга посвящена анонимности в Интернете, а не лингвистике. Главное, чтобы вы знали, что такой способ деанонимизации существует, а предупрежден – значит вооружен.
11.3. Наиболее частые ошибки
Исходя из всего ранее сказанного, выделим основные ошибки, совершаемые желающими быть анонимными пользователями:
использование анонимных и неанонимных сессий для одного и того же вида деятельности – например, при регистрации e-mail и блога вы не анонимизировали трафик, но начали это делать при ведении блога. Понятно, что легко запросить у администратора блога IP-адреса, которые были зафиксированы при регистрации блога, чтобы понять, кто вы;
элементарная забывчивость – забыли включить Tor, забыли перенастроить браузер (например, сначала отменили установку прокси-сервера Tor, чтобы скачать фильм, а затем забыли и продолжили работу, но уже не в анонимном режиме). Чтобы хоть как-то помочь себе, установите два браузера: один вы будете использовать в анонимном режиме, второй – для обычного серфинга;
публикация больших текстов сходного стиля написания под своим обычным именем. Или ничего не публикуйте под своим именем, или же измените стиль написания перед публикацией анонимного контента;
доступ к анонимному почтовому ящику без шифрования – всегда используйте шифрование трафика для доступа к своему анонимному почтовому ящику;
отказ от анонимизации трафика при работе с чужого компьютера – самая распространенная ошибка. Некоторые пользователи почему-то думают, что если они используют чужой компьютер (например, компьютер друга, родственника, соседа и т. п.), то уже анонимны. Это не так, и анонимизация трафика обязательна и в этом случае. Иначе вас очень легко будет выследить – придут к тому, у кого вы были, и спросят, он ли заходил на тот или иной ресурс. Он ответит, что не он и что вы были у него в гостях в то время.
В главе 12 вы узнаете, какие программы нужно использовать, чтобы остаться анонимным. Ведь иногда
Глава 12. Программы с "сюрпризом"
12.1. Программы с открытым кодом
Для обеспечения большей анонимности вы должны использовать программы с открытым исходным кодом (так называемые OpenSource-программы). Исходный код таких программ свободно доступен на сайтах разработчиков программ.
Возникает вопрос: почему именно OpenSource? У таких программ есть одно большое преимущество – их исходный код открыт, а это означает, что в коде программы нет "черных ходов" (backdoors), и эти программы не передают информацию о передаваемых с их помощью данных своим разработчикам или кому-то еще. Ведь если бы это было так, общественность очень быстро бы об этом узнала. В мире много энтузиастов, исследующих исходный код программ на наличие всевозможных ошибок. Если в исходном коде того же Firefox будет найдена "черная дверь", через пару минут об этом узнает весь мир.
Программное обеспечение, исходный код которого закрыт, называется проприетарным. Проприетарное программное обеспечение не обязательно является платным. Наоборот, в мире есть множество программ, распространяемых бесплатно (freeware), но исходный код этих программ закрыт. Взять ту же "Оперу" (браузер Opera) – ее исходный код никому не доступен, то же самое можно сказать и об IE. Да, Internet Explorer может скачать любой желающий с сайта Microsoft, но сама Microsoft до сих пор не открыла его исходного кода.
Исходный код проприетарных программ – тайна за семью замками, и он редко когда бывает выложен в Интернете. Разве что произойдет утечка информации внутри компании, и чем-то обиженный сотрудник возьмет да и выложит "исходники" на каком-то сайте.
Поскольку исходный код проприетарного ПО закрыт, никто не может с абсолютной уверенностью сказать, что такие программы не передают данные (например, информацию о посещаемых вами узлах или содержимое заполняемых вами форм) разработчикам или третьим лицам.
Есть у OpenSource и еще одно преимущество – по сути, над разработкой программ с открытым кодом работает весь мир. Представьте обычную компанию, разрабатывающую проприетарную программу. Сколько человек работает над ее исходным кодом? 10, 20, 50, 100, 500, пусть даже 1000. Так, общее число сотрудников Opera Software (не только программистов, а всех сотрудников и во всех офисах по всем странам) составляет всего 750 человек. Размер относительно небольшого заводика на постсоветском пространстве. А в разработке OpenSource-программ косвенно принимают участие тысячи разработчиков. Да, пусть команда разработчиков какого-то OpenSource-проекта составляет всего несколько десятков человек. Зато к ним с легкостью присоединяются энтузиасты по всему миру, помогающие отлаживать программу, находящие в ней "баги" и подсказывающие, как сделать так, чтобы программа работала лучше.