4.15. Преобразование между табуляциями и пробелами в текстовых файлах
Проблема
Имеется текстовый файл, содержащий табуляции или пробелы, и требуется преобразовать одни в другие. Например, может потребоваться заменить все табуляции на последовательности из трех пробелов или сделать наоборот и заменить все вхождения некоторого числа пробелов на табуляции.
Решение
Независимо от того, производится ли замена табуляций на пробелы или пробелов на табуляции, используйте классы
ifstream
и
ofstream
из
<fstream>
. В первом (более простом) случае прочтите данные по одному символу с помощью входного потока,
изучите их и, если очередной символ — это табуляция, запишите в выходной поток некоторое количество пробелов. Пример 4.23 демонстрирует, как это делается.
Пример 4.23. Замена табуляций на пробелы
#include <iostream>
#include <fstream>
#include <cstdlib>
using namespace std;
int main(int argc, char** argv) {
if (argc < 3)
return(EXIT_FAILURE);
ifstream in(argv[1]);
ofstream out(argv[2]);
if (!in || !out) return(EXIT_FAILURE);
char c;
while (in.get(c)) {
if (c == '\t')
out << " "; // 3 пробела
else
out << c;
}
out.close;
if (out)
return(EXIT_SUCCESS);
else
return(EXIT_FAILURE);
}
Если же требуется заменить пробелы на табуляции, обратитесь к примеру 4.24. Он содержит функцию
spacesToTabs
, которая читает из входного потока по одному символу, ища три последовательных пробела. Когда они найдены, она записывает в выходной поток табуляцию. Для всех остальных символов или меньшего количества пробелов в выходной поток записывается то, что было прочитано во входном.
Пример 4.24. Замена пробелов на табуляции
#include <iostream>
#include <istream>
#include <ostream>
#include <fstream>
#include <cstdlib>
using namespace std;
void spacesToTabs(istream& in, ostream& out, int spaceLimit) {
int consecSpaces = 0;
char c;
while (in.get(c)) {
if (c != ' ') {
if (consecSpaces > 0) {
for (int i = 0; i < consecSpaces; i++) {
out.put(' ');
}
consecSpaces = 0;
}
out.put(c);
} else {
if (++consecSpaces == spaceLimit) {
out.put('\t');
consecSpaces = 0;
}
}
}
}
int main(int argc, char** argv) {
if (argc < 3)
return(EXIT_FAILURE);
ifstream in(argv[1]);
ofstream out(argv[2]);
if (!in || !out)
return(EXIT_FAILURE);
spacesToTabs(in, out, 3);
out.сlose;
if (out)
return(EXIT_SUCCESS);
else
return(EXIT_FAILURE);
}
Обсуждение
Механизм
обоих этих решений один и тот же, отличаются только алгоритмы. Символы читаются из входного потока с помощью
get
, а в выходной поток помещаются с помощью
put
. Логика, выполняющая преобразования, помещается между этими двумя функциями.
Вы, вероятно, заметили в примере 4.24, что в функции
main in
и
out
объявлены как переменные типов
ifstream
и
ofstream
соответственно и что параметры
spacesToTabs
— это
istream
и
ostream
. Это сделано для того, чтобы позволить
spacesToTabs
работать с любыми типами входных и выходных потоков (ну, не любыми типами потоков, а теми, которые наследуются от
basic_istream
или
basic_ostream
), а не только с файловыми потоками. Например, текст, который требуется переформатировать, может находиться в строковом потоке (
istringstream
и
ostringstream
из
<sstream>
). В этом случае сделайте что-то похожее на следующее.
istringstream istr;
ostringstream ostr;
// заполняем istr текстом...
spacesToTabs(istr, ostr);
Как и в случае со строками, потоки — это на самом деле шаблоны классов, параметризованные по типу символов, с которыми работает поток. Например,
ifstream
— это
typedef
для
basic_ifstream<char>
, a
wifstream
— это
typedef
для
basic_ifstream<wchar_t>
. Таким образом, если требуется, чтобы
spacesToTabs
из примеров 4.23 или 4.24 работала с потоками любых символов, то вместо
typedef
используйте эти шаблоны классов.
template<typename T>
void spacesToTabs(std::basic_istream<T>& in,
std::basic_ostream<T>& out, int spaceLimit) { //...
4.16. Перенос строк в текстовом файле
Проблема
Требуется сделать перенос текста файла после определенного количества символов. Например, если требуется сделать перенос текста после 72 символов, то после каждого 72 символа файла требуется вставить символ новой строки. Если файл содержит текст, читаемый человеком, то, вероятно, потребуется избежать разделения слов.
Решение
Напишите функцию, которая использует входной и выходной потоки, читает символы с помощью
istream::get(char)
, выполняет какие-либо действия и записывает символы с помощью
ostream::put(char)
. Пример 4.25 показывает, как это делается с файлом, который содержит обычный текст, с учетом сохранения целостности слов.