возвращает число записанных байтов или -1, если произошла ошибка. Для некоторых типов файлов чисто фактически записанных байтов может оказаться меньше требуемого. Программа должна выявлять подобные случаи и вызывать функцию
write
повторно, чтобы передать оставшуюся часть данных. Этот прием продемонстрирован в листинге Б.3. Но иногда даже таких методов недостаточно. Например, если показанная функция будет записывать данные в сокет, в нее придется добавить код проверки того, не произошел ли в ходе операции записи разрыв соединения.
Функция, осуществляющая чтение данных из файла, называется
read
. Подобно функции
write
, она принимает дескриптор файла, указатель на буфер и счетчик числа извлекаемых байтов. Функция возвращает число прочитанных байтов или -1 в случае ошибки. Иногда читается меньше байтов, чем требовалось, если, например, в файле содержится недостаточно байтов.
Чтение текстовых файлов DOS/Windows
В Linux-программах нередко приходится читать файлы, созданные в DOS или Windows. Важно понимать разницу между тем, как структурируются текстовые файлы в Linux и в DOS/Windows.
В Linux каждая строка текстового файла оканчивается символом новой строки. Он представляется символьной константой
'\n'
, ASCII-код которой равен 10. В Windows строки разделяются двухсимвольной комбинацией символ возврата каретки (константа
'\r'
, ASCII-код 13), за которым идет символ новой строки.
Некоторые текстовые редакторы Linux при отображении текстовых файлов Windows ставят в конце каждой строки обозначение
^M
— символ возврата каретки. В Emacs такие файлы отображаются правильно, но в строке режима появляется запись
(DOS)
. Многие Windows-редакторы, например Notepad (Блокнот), показывают содержимое текстовых файлов Linux в виде одной длинной строки, так как предполагают наличие в конце строки символа возврата каретки.
Если программа читает текстовые файлы, сгенерированные Windows-программами, желательно менять последовательность
'\r\n'
одним символом новой строки. Точно так же при записи текстовых файлов, которые будут читаться Windows-программами, нужно менять одиночные символы новой строки комбинациями
'\r\n'
.
В листинге Б.4 демонстрируется применение функции
read
. Программа отображает шестнадцатиричный дамп файла, заданного в командной строке. В каждой строке показано смещение от начала файла, а затем — следующие 16 байтов.
Эти результаты могут быть разными в зависимости от того, какой компилятор применялся и какие флаги компиляции были установлены.
Б.1.5. Перемещение по файлу
В файловом дескрипторе запоминается текущая позиция в файле. При чтении или записи данных указатель текущей позиции перемещается на то количество байтов, которое было прочитано или записано. Но иногда нужно осуществлять простое перемещение по файлу (позиционирование). Например, может потребоваться вернуться в начало файла и прочитать его заново, не открывая повторно.
Позиционирование указателя текущей позиции файла осуществляет функция
lseek
. Она принимает дескриптор файла и два дополнительных аргумента, определяющих новую позицию указателя.
■ Если третий аргумент равен
SEEK_SET
, функция
lseek
интерпретирует второй аргумент как смещение (в байтах) от начала файла.
■ Если третий аргумент равен
SEEK_CUR
, функция
lseek
интерпретирует второй аргумент как смещение (положительное или отрицательное) от текущей позиции.