UNIX — универсальная среда программирования, Керниган Брайан Уилсон

UNIX — универсальная среда программирования

на обложку

Керниган Брайан Уилсон

Шрифт:

Глава 6

Программирование с помощью стандартных функций ввода-вывода

До сих пор мы использовали существующие инструменты, чтобы разрабатывать новые, но сейчас уже достигнут разумный предел в создании новых средств с помощью

shell

sed

awk

. В этой главе нам предстоит написать простые программы на языке программирования Си. Основополагающая философия конструирования объектов, функционирующих совместно, будет по-прежнему оказывать влияние на построение программ, так как наша цель — подготовить инструменты, с которыми можно работать и на которые можно положиться. В каждом случае мы также попытаемся показать вам приемлемую

стратегию реализации таких инструментов: начинать с минимума, обеспечивающего некоторые полезные свойства, а затем добавлять новые средства, если в них возникает необходимость.

Существуют веские причины для того, чтобы писать новые программы "с нуля". Так, может оказаться, что проблема, с которой мы столкнулись, просто не может быть решена с помощью имеющихся программ. Часто приходится иметь дело с нетекстовыми файлами. Например, большинство программ, которые демонстрировались ранее, действительно хорошо работали лишь с текстовой информацией либо слишком трудно достигалась должная ясность или эффективность, если применялись только

shell

и другие средства общего назначения. В подобных случаях реализация с использованием

shell

может быть полезна для апробирования программы и ее интерфейса с пользователем. (Если же программа работает достаточно хорошо, нет причины для ее переделки.) Уже знакомая вам программа zap является в этом смысле неплохим примером: требуется всего несколько минут, чтобы написать первую версию на

shell

, которая имеет адекватный пользовательский интерфейс, но слишком медленна.

Мы будем писать программы на языке Си — стандартном языке системы UNIX (ядро и все пользовательские программы написаны на Си), поскольку нет иного языка, хотя бы отчасти также хорошо поддерживаемого. Вы должны знать этот язык, по крайней мере в такой степени, чтобы свободно разбираться в предлагаемом здесь материале. Если это не так, прочтите книгу "Язык программирования Си" Б. Кернигана и Д. Ритчи (М.: Финансы и статистика, 1985) [13] . Мы также воспользуемся "стандартной библиотекой ввода-вывода" — набором функций, обеспечивающих программы на Си эффективными и переносимыми средствами ввода-вывода и системными услугами. Стандартные библиотеки ввода-вывода есть во многих, отличных от UNIX, системах, поддерживающих Си, поэтому программы, взаимодействия с системой которых ограничены возможностями таких библиотек, могут быть легко перенесены.

Сейчас выпущено как переиздание этой книги, так и новое, третье издание на русском языке

Примеры, подобранные в настоящей главе, имеют общее свойство: они представляют собой небольшие "инструменты", которые используются регулярно, но не являются частью седьмой версии системы. Если ваша система обладает подобными программами, вам будет легче сравнивать системы. Если же вы с ними еще не знакомы, то они могут оказаться вам чрезвычайно полезными. Эти программы помогут вам понять, что совершенной системы не существует, и для того чтобы добиться улучшения и устранить те или иные дефекты, достаточно приложить лишь небольшие усилия

6.1 Стандартные входной и выходной потоки: программа

vis

Многие программы читают только из одного входного потока и пишут в один выходной поток: для таких программ полностью подходят функции ввода-вывода, использующие лишь стандартные входной и выходной потоки, и для того чтобы начать работу, этого почти всегда достаточно.

Проиллюстрируем изложенное с помощью программы

vis

, которая копирует свой стандартный входной поток в стандартный выходной, изображая при этом все непечатаемые символы в виде

\nnn

, где

nnn

—

восьмеричное значение символа.

Vis

полезна для обнаружения "посторонних" или нежелательных символов, которые могут попасть в файлы. Например,

vis

будет печатать каждый символ "шаг назад" как \010, что является его восьмеричным значением:

$ cat x abc

$ vis < x

abc\010\010\010 ___

Чтобы просмотреть несколько файлов с помощью этой элементарной версии

vis

, вы можете использовать

cat

для сбора файлов

$ cat файл1 файл2 ... | vis

...

$ cat файл1 файл2 ... | vis | grep '\\'

...

и избежать тем самым выяснения способа доступа к файлам из программы.

Между прочим, может показаться, что подобную работу следует выполнить с привлечением

sed

, поскольку команда

'1'

выдает на экран непечатаемые символы в наглядном виде:

$ sed -n 1 x

abc<-<-<-___

Результат выполнения программы

sed

, вероятно, вам покажется яснее, чем результат выполнения

vis

. Но применение

sed

к нетекстовым файлам бессмысленно:

$ sed -n 1 /usr/you/bin

Ничего в ответ!

(Так получилось на PDP-11; в одной из систем для VAX

sed

аварийно завершилась, возможно, потому, что ввод был воспринят как очень длинная текстовая строка.) Таким образом,

sed

нам не подходит, и мы вынуждены писать новую программу.

Простейшие функции ввода и вывода

getchar

putchar

. При каждом вызове

getchar

появляется очередной символ из стандартного входного потока, которому может быть поставлен в соответствие файл, конвейер или терминал (последнее принимается по умолчанию). Программа "не знает", что конкретно он собой представляет. Аналогично

putchar(c)

помещает символ в стандартный выходной поток, который по умолчанию также связан с терминалом.

Функция

printf(3)

выполняет форматное преобразование при выводе. Вызовы

printf

putchar

могут следовать в любом порядке; выходной поток отразит порядок этих вызовов. Для форматного преобразования входного потока предусмотрена функция

scanf(3)

; она читает входной поток и разбивает его, как требуется, на строки, числа и т.п. Вызовы

scanf

getchar