Чтение онлайн

на главную - закладки

Жанры

Интернет-журнал "Домашняя лаборатория", 2008 №5
Шрифт:

Чтобы в дальнейшем не было ошибок, запомните, что, например, ASCII 9 относится к клавише Tab, а не к цифре 9, которая имеет по этому стандарту код ASCII 57.

Сначала в системах кодирования было много путаницы. Кодировок гуляло по миру множество. Была основная кодировка, болгарская, КОИ-7, КОИ-8, альтернативная и много других.

Многообразие способов кодирования связано с тем, что при разработке компанией IBM своих первых компьютеров и создании для них компанией Microsoft операционной системы MS DOS, было заложено очень трудно обходимое техническое ограничение на число используемых символов — не более 256. Это

количество в то время полностью перекрывали все мыслимые потребности англоязычного пользователя. Странная, на первый взгляд, цифра 256 обусловлена тем, что это максимальное число (2•108), которое может быть записано в двоичной системе в 1-ном байте (8 бит, то есть восемь 0 и 1). А именно 1 байт отводился в MS DOS для хранения любого символа. Последствия этого ограничения со временем и начали проявляться при широком распространении компьютеров не только в англоязычных странах.

В конце концов все же пришли к разумному компромиссу:

• первые 128 кодов (с 0-го по 127-й) с управляющими символами, некоторыми специальными знаками, цифрами и латинским алфавитом остаются в неприкосновенности;

• коды со 176-го по 223-й сохранены за символами псевдографики;

• остальные же коды отданы на откуп потребителям.

У нас наибольшее распространение получила альтернативная ASCII-кодировка, построенная именно по такому принципу: в оставшихся свободными кодах располагаются буквы русского (или другого национального) алфавита. Тем самым обеспечивалась преемственность программного обеспечения, разработанного в других странах, — здесь мы были не "впереди планеты всей..

В альтернативной ASCII-кодировке:

прописные русские буквы:

• имеют номера со 128 по 159 — (с "А" по "Я"),

• буква "Ё" стоит особняком под номером 240.

строчные русские буквы (чтобы сохранить символы псевдографики) разбросаны:

• буквы с "а" по "п" имеют номера со 160 по 175,

• с "р" по "я" занимают позиции с 224 по 239,

• буква "ё" снова на отшибе и имеет номер 241.

Кодовая таблица ANSI

Появление Windows вызвало к жизни еще одну систему кодирования символов — ANSI. Это также аббревиатура английской фразы American National Standard Institute (Американский национальный институт стандартов). Кстати, первоначальное название этой кодировки было — OEM.

Система кодирования ANSI стала преемником формата ASCII, сохранив первые 128 символов на своих привычных местах. Все остальные коды также были отданы национальным алфавитам, причем, символы псевдографики из таблицы были изъяты. Варианты национальных кодовых таблиц получили название кодовых страниц с соответствующим номером. Так, например, кодовая страница с кириллицей, используемая в Windows, имеет номер 1251.

На кодовой странице номер 1251 русские буквы (кириллица) размещаются следующим образом:

• Прописные буквы с "А" по "Я" (кроме "Ё") занимают места со 192 по 223.

• Строчные буквы с "а" по "я" (также кроме "ё") расположены с 224 по 255.

• Для букв "Ё" и "ё" отведены коды 168 и 184.

Ввод символов с помощью клавиши Alt

При работе в DOS все ASCII-коды, начиная с ASCII 32, могут быть выведены

на экран с помощью клавиши Alt. Если нажать и, удерживая нажатой клавишу Alt набрать на дополнительной (малой цифровой) клавиатуре необходимый ASCII-код, то после отпускания Alt соответствующий символ появится на экране в том месте, где перед этим находился текстовый курсор.

При работе в Windows (Здесь речь уже идет об ANSI-кодах) для ввода символов Alt с помощью клавиши Alt нужно поступать точно так же, как в DOS, но перед со ответствующим ANSI-кодом символа сначала надо набрать 0 (ноль) и только потом собственно код. Причем, малая цифровая клавиатура должна быть обязательно переключена для ввода цифр (режим NumLock должен быть включен). Например, цифру 9, стоящую на 57-ом месте в таблице кодов, можно ввести с помощью клавиши Alt набрав код 057.

Краткая информация о других системах кодирования

Системы кодирования текстовых данных были разработаны и в других странах. Так, например, в СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось "отступить" во вторую, расширенную часть системы кодирования, определяющую значения кодов со 128 до 255. Отсутствие единого стандарта в этой области привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта кодировки и еще два устаревших.

Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена "извне" — компанией Microsoft, но учитывая широкое распространение операционных систем и других продуктов этой компании в России она нашла широкое распространение в России. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) — ее происхождение относится ко времени действий Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.

Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название ISO (International Standard Organization — Международный институт стандартизации). На практике данная кодировка используется редко.

На компьютерах, работающих под операционной системой MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день.

В связи с изобилием систем кодировки текстовых данных, действующих в России возникает задача межсистемного преобразования данных — это одна из распространенных задач информатики.

Подводя некоторый итог, можно сказать, что текстовый файл — это файл, в котором каждый байт интерпретируется как изображаемый символ в некоторой системе кодировки. Кроме кодов изображаемых символов, текстовые файлы включают также ряд управляющих кодов, например, код возврата каретки, перевода строки, конца файла.

Поделиться:
Популярные книги

Кодекс Охотника. Книга XII

Винокуров Юрий
12. Кодекс Охотника
Фантастика:
боевая фантастика
городское фэнтези
аниме
7.50
рейтинг книги
Кодекс Охотника. Книга XII

Газлайтер. Том 3

Володин Григорий
3. История Телепата
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Газлайтер. Том 3

Росток

Ланцов Михаил Алексеевич
2. Хозяин дубравы
Фантастика:
попаданцы
альтернативная история
фэнтези
7.00
рейтинг книги
Росток

Волхв пятого разряда

Дроздов Анатолий Федорович
2. Ледащий
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Волхв пятого разряда

Боги, пиво и дурак. Том 3

Горина Юлия Николаевна
3. Боги, пиво и дурак
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Боги, пиво и дурак. Том 3

Господин следователь

Шалашов Евгений Васильевич
1. Господин следователь
Детективы:
исторические детективы
5.00
рейтинг книги
Господин следователь

Адмирал южных морей

Каменистый Артем
4. Девятый
Фантастика:
фэнтези
8.96
рейтинг книги
Адмирал южных морей

Огни Аль-Тура. Желанная

Макушева Магда
3. Эйнар
Любовные романы:
любовно-фантастические романы
эро литература
5.25
рейтинг книги
Огни Аль-Тура. Желанная

Лорд Системы

Токсик Саша
1. Лорд Системы
Фантастика:
фэнтези
попаданцы
рпг
4.00
рейтинг книги
Лорд Системы

Попаданка в академии драконов 4

Свадьбина Любовь
4. Попаданка в академии драконов
Любовные романы:
любовно-фантастические романы
7.47
рейтинг книги
Попаданка в академии драконов 4

И только смерть разлучит нас

Зика Натаэль
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
И только смерть разлучит нас

Пипец Котенку!

Майерс Александр
1. РОС: Пипец Котенку!
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Пипец Котенку!

Как я строил магическую империю

Зубов Константин
1. Как я строил магическую империю
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Как я строил магическую империю

Возвышение Меркурия. Книга 2

Кронос Александр
2. Меркурий
Фантастика:
фэнтези
5.00
рейтинг книги
Возвышение Меркурия. Книга 2