Сбои системных вызовов происходят в самых разных ситуациях.
■ В системе могут закончиться ресурсы (или же программа может исчерпать лимит ресурсов, наложенный на нее системой). Например, программа может запросить слишком много памяти, записать чересчур большой объем данных на диск или открыть чрезмерное количество файлов одновременно.
■ Операционная система Linux блокирует некоторые системные вызовы, когда программа пытается выполнить операцию при отсутствии должных привилегий. Например, программа может попытаться осуществить запись в доступный только для чтения файл, обратиться к памяти другого процесса или уничтожить программу другого пользователя.
■ Аргументы системного вызова
могут оказаться неправильными либо по причине ошибочно введенных пользователем данных, либо из-за ошибки самой программы. Например, программа может передать системному вызову неправильный адрес памяти или неверный дескриптор файла. Другой вариант ошибки — попытка открыть каталог вместо обычного файла или передать имя файла системному вызову, ожидающему имя каталога.
■ Системный вызов может аварийно завершиться по причинам, не зависящим от самой программы. Чаще всего это происходит при доступе к аппаратным устройствам. Устройство может работать некорректно или не поддерживать требуемую операцию. либо в дисковод просто не вставлен диск.
■ Выполнение системного вызова иногда прерывается внешними событиями, к каковым относится, например, получение сигнала. Это не обязательно означает ошибку, но ответственность за перезапуск системного вызова возлагается на программу.
В хорошо написанной программе, часто обращающейся к системным вызовам, большая часть кода посвящена обнаружению и обработке ошибок, а не решению основной задачи.
2.2.3. Коды ошибок системных вызовов
Большинство системных вызовов возвращает 0, если операция выполнена успешно, и ненулевое значение — в случае сбоя. (В некоторых случаях используются другие соглашения. Например, функция
malloc
при возникновении ошибки возвращает нулевой указатель. Никогда не помешает прочесть
man
– страницу, посвященную требуемому системному вызову.) Обычно этой информации достаточно для того, чтобы решить, следует ли продолжать привычное выполнение программы. Но для более специализированной обработки ошибок необходимы дополнительные сведения.
Практически все системные вызовы сохраняют в специальной переменной
errno
расширенную информацию о произошедшей ошибке. [7] В эту переменную записывается число, идентифицирующее возникшую ситуацию. Поскольку все системные вызовы работают с одной и той же переменной, необходимо сразу же после завершения функции скопировать значение переменной в другое место. Переменная
errno
модифицируется после каждого системного вызова.
Коды ошибок являются целыми числами. Возможные значения задаются макроконстантами препроцессора, которые, по существующему соглашению, записываются прописными буквами и начинаются с литеры "E", например
EACCESS
и
EINVAL
. При работе со значениями переменной errno следует всегда использовать макроконстанты, а не реальные числовые значения. Все эти константы определены в файле
<errno.h>
.
7
В целях обеспечения безопасной работы потоков переменная
errno
реализована в виде макроса, но к ней можно обращаться как к глобальной переменной.
В Linux имеется удобная функция
strerror
, возвращающая строковый эквивалент кода ошибки. Эти строки можно включать в сообщения об ошибках. Объявление функции находится в файле
<string.h>
.
Есть также функция
perror
(объявлена
в файле
<stdio.h>
), записывающая сообщение об ошибке непосредственно в поток
stderr
. Перед собственно сообщением следует размещать строковый префикс, содержащий имя функции или модуля, ставших причиной сбоя.
В следующем фрагменте программы делается попытка открыть файл. Если это не получается, выводится сообщение об ошибке и программа завершает свою работу. Обратите внимание на то, что в случае успеха операции функция
open
возвращает дескриптор открытого файла, иначе — -1.
В зависимости от особенностей программы и используемого системного вызова конкретные действия, предпринимаемые в случае ошибки, могут быть разными: вывод сообщения об ошибке, отмена операции, аварийное завершение программы, повторная попытка и даже игнорирование ошибки. Тем не менее важно включить в программу код, обрабатывающий все возможные варианты ошибок.
Одни из кодов, с которым приходится сталкиваться наиболее часто, особенно в функциях ввода-вывода, — это
EINTR
. Ряд функций, в частности
read
,
select
и
sleep
, требует определенного времени на выполнение. Они называются блокирующими, так как выполнение программы приостанавливается до тех пор, пока функция не завершится. Но если программа, будучи заблокированной, принимает сигнал, функция завершается, не закончив выполнение операции. В данном случае в переменную
errno
записывается значение
EINTR
. Обычно в подобной ситуации следует повторно выполнить системный вызов.
Ниже приведен фрагмент программы, в котором функция
chown
меняет владельца файла, определяемого переменной
path
, назначая вместо него пользователя с идентификатором
user_id
. Если функция завершается неуспешно, дальнейшие действия программы зависят от значения переменной
errno
. Обратите внимание на интересный момент: при обнаружении возможной ошибки в самой программе ее выполнение завершается с помощью функции
abort
или
assert
, вследствие чего генерируется файл дампа оперативной памяти. Анализ этого файла может помочь выяснить природу таких ошибок. В случае невосстанавливаемых ошибок, например нехватки памяти, программа завершается с помощью функции
exit
, указывая ненулевой код ошибки: в подобных ситуациях файл дампа оказывается бесполезным.
rval = chown(path, user_id, -1);
if (rval != 0) {
/* Сохраняем переменную errno, поскольку она будет изменена
при следующем системном вызове. */
int error_code = errno;
/* Операция прошла неуспешно; в случае ошибки функция chown
должна вернуть значение -1. */
assert(rval == -1);
/* Проверяем значение переменной errno и выполняем