Цифровая стеганография
Шрифт:
1) определение избыточных бит, которые можно изменять без ущерба для контейнера;
2) выбор НЗБ, в которые будет встраиваться скрываемая информация;
3) коррекция статистических изменений в сформированном стего.
На первом этапе оценивается количество НЗБ контейнера, которые можно заменить на биты скрываемого сообщения без потери качества контейнера типа изображение. Реально для встраивания можно использовать не более половины выявленных битов. Если найденных избыточных битов не достаточно, надо поменять контейнер. Затем по секретному ключу определяются равновероятно распределенные в пределах контейнера НЗБ, заменяемые на биты скрываемой информации. Затем сформированное стего оценивается статистическими тестами и при выявлении отклонений от статистических характеристик естественных контейнеров оставшиеся избыточные биты используются для исправления этих отклонений. Простым методом коррекции является сохранение взаимной корреляции и величины энтропии, вычисляемой по тесту Маурера. Действительно, если некоторый младший бит при встраивании изменяется
Корректирующие преобразования должны удовлетворять требованиям:
1) для любого фрагмента изображения распределение коэффициентов ДКП стего должно быть аналогично их распределению в пустом контейнере;
2) число исправлений, необходимых для коррекции статистических характеристик, должно быть малым.
В работе [15] приведены результаты исследования алгоритма коррекции при встраивании сообщения в контейнерные изображения размером 640×480 пикселов. Среднее число коэффициентов ДКП, которые можно использовать для встраивания, равно 46000 и изменялось от 30000 до 97000. До встраивания вероятность совпадения соседних избыточных битов равна 63,8 % со средним квадратическим отклонением ± 3,4 % по множеству изображений. Длина сжатого скрываемого сообщения равна 14700 битов. Корректирующие преобразования привели к 2967 ± 434 дополнительным изменениям в избыточных битах. Это составило приблизительно 20 % от размера скрываемого сообщения. Среднее число искажений, которые не удалось скорректировать, составило 186…400.
В таблице 4.1 показаны результаты статистических тестов для исследуемого алгоритма. Видно, что в стего без коррекции заметно уменьшился коэффициент корреляции между избыточными битами и увеличилась их энтропия. Коррекция позволяет сделать встраивание скрываемых сообщений статистически необнаруживаемым.
Таблица 4.1
Исследуемая последовательность | Коэффициент корреляции | Универсальный тест Маурера |
---|---|---|
Исходный контейнер | 63,77 % ±,37 % | 6,704 ± 0,253 |
Стего без коррекции | 59,10 % ± 3,19 % | 6,976 ± 0,168 |
Стего с коррекцией | 62,91 % ± 3,36 % | 6,775 ± 0,231 |
Таким образом, если применить корректирующие преобразования к стего, то использованные методы статистического стегоанализа не способны выявить факт существования стегоканала. Однако справедливости ради необходимо отметить, что могут быть построены другие статистические атаки, для нейтрализации которых потребуется дополнительно использовать избыточные биты, что еще более уменьшит скорость передачи скрываемой информации.
Совершенствование стегосистем в общем случае может быть описано некоторым итеративным процессом. Стегосистемы разрабатываются и предлагаются авторами к использованию. Они исследуются известными методами стегоанализа, при необходимости для них разрабатываются новые методы анализа, и так до тех пор, пока не удается их взломать. Затем с учетом выявленных слабостей затем принципы построения стегосистем совершенствуются, но одновременно развиваются и стегоатаки. Этот процесс итеративно продолжается, пока не удается доказать, что при текущем уровне развития стегоанализа данная стегосистема является практически стойкой. Такой процесс сложился для анализа и синтеза криптосистем, и очевидно, что он справедлив и для стегосистем. Однако надо учитывать, во-первых, что по сравнению с криптосистемами в стегосистемах есть дополнительный параметр — контейнер, а во-вторых, практическая стойкость стегосистем может иметь значительно большее число толкований.
4.5. Теоретико-сложностный подход к оценке стойкости стеганографических систем
Рассмотренные в работах [2], [3] информационно-теоретические модели стойкости стеганографических систем имеют существенные недостатки. Впервые на это было обращено внимание в статье [19]. Как отмечено в этой работе, успешно применяемые для анализа криптосистем информационно- теоретические методы плохо подходят для анализа стегосистем. Причина этого в том, что процедура обнаружения скрытого сообщения не может быть смоделирована как непрерывный процесс. В самом деле, нарушитель может получить лишь два результата анализа подозрительного канала связи: либо он обнаружит факт присутствия стегосистемы, либо нет. Таким образом, мы имеем дело с прерывистым процессом, к которому неприменимы методы теории информации. В криптографии не так, там нарушитель может получать частичное знание об открытом сообщении (или ключе), и тем не менее система будет практически стойкой. Стегосистема же обязана быть совершенно стойкой по Шеннону. На рис. 4.11 на качественном уровне показана разность между криптосистемами и стегосистемами.
Рис. 4.11.
Осознание факта малопригодности информационно-теоретических моделей для анализа стегосистем повлекло за собой появление теоретико-сложностных подходов к оценке их стойкости [20]. В этой работе по-новому рассмотрено понятие стойкости стегосистем и построена конструктивная модель стойкой стегосистемы в виде вероятностной полиномиальной по времени игры между нарушителем и скрывающим информацию. К основным недостаткам информационно-теоретических моделей стегосистем можно отнести следующие.
1) Также как и в криптографии, на практике невозможно реализовать совершенно стойкую стегосистему. Можно показать, что реализация такой стегосистемы сводится к одноразовому блокноту (так называемому шифру Вернама). Таким образом, информационно-теоретические модели стегосистем неконструктивны.
2) Распределение вероятностей контейнеров на практике неизвестно, или известно с точностью до некоторой весьма и весьма приблизительной модели.
3) Используемые контейнеры отнюдь не являются реализацией случайного процесса, а, чаще всего, оцифрованными образами реальных физических объектов.
4) Вполне реалистично было бы предположить, что нарушитель имеет доступ лишь к ограниченным вычислительным ресурсам. Как и в криптографии достаточно потребовать, чтобы стегосистема выдерживала бы все полиномиальные тесты по ее обнаружению. Этот момент также не учитывают информационно-теоретические модели.
Рассмотрим модель стегосистемы, предложенную в работе [20]. Предположим, что имеется множество возможных контейнеров
Алгоритм G есть процесс генерации ключа, который в ответ на входную строку из единиц порождает псевдослучайный стегоключ
на основе контейнера
Интересно отметить, что если на структуру скрытого сообщения не накладывается никаких ограничений, то для многих стегосистем эта задача неразрешима. В самом деле, любая комбинация бит может быть вложением, и даже если нарушитель каким-то образом и заподозрит наличие скрытой связи, все равно ему невозможно будет доказать это третьей стороне. Поэтому, в работе [20] на структуру скрытого сообщения накладывается ограничение: оно должно иметь какой-то семантический смысл.