. Почти все методы поиска начинаются со слова «find», и их имена говорят достаточно о том, что они делают. Пример 4.15 показывает, как работают некоторые из этих методов поиска.
Пример 4.15. Поиск строк
#include <string>
#include <iostream>
int main {
std::string s = "Charles Darwin";
std::cout << s.find("ar") << '\n'; // Поиск от
// начала
std::cout << s.rfind("ar") << "\n"; // Поиск с
конца
std::cout << s.find_first_of("swi") // Найти первое вхождение одного
<< '\n'; // из этих символов
std::cout << s.find_first_not_of("Charles") // Найти первое,
<< '\n'; // что не входит в этот
// набор
std::cout << s.find_last_of("abg") << '\n'; // Найти первое вхождение любого
// из этих символов,
// начиная с конца
std::cout << s.find_last_not_of("aDinrw") // Найти первое,
<< '\n'; // что не входит в этот
// набор, начиная с конца
}
Все эти методы поиска обсуждаются более подробно в разделе «Обсуждение».
Обсуждение
Имеется шесть различных методов для поиска в строках, каждый из которых предоставляет четыре перегруженных варианта. Эти перегрузки позволяют использовать либо параметр
basic_string
, либо
charT*
(
charT
— это символьный тип). Каждый имеет параметр
pos
типа
basic_string::size_type
, который позволяет указать индекс, с которого следует начать поиск, и есть перегрузка с параметром
n
типа
size_type
, который позволяет выполнить поиск только n символов из набора.
Запомнить все эти методы довольно сложно, так что в табл. 4.2 дается краткая справка по каждому из них и их параметрам.
Находит первое вхождение символа или подстроки, начиная с конца строки и двигаясь к ее началу. Другими словами делает то же, что и
find
, но начинает поиск с конца строки
size_type find_first_of(...)
Находит первое вхождение любого символа из набора, переданного как
basic_string
или указатель на символы. Если указан
n
, то ищутся только первые
n
символов используемого набора
size_type find_last_of(...)
Находит последнее вхождение любого символа из набора, переданного как
basic_string
или указатель на символы. Если указан
n
, то ищутся только первые
n
символов используемого набора
size_type find_first_not_of(...)
Находит первое вхождение любого символа, не входящего в набор, переданный как
basic_string
или указатель на символы. Если указан
n
, то принимаются во внимание только первые n символов используемого набора
size_type find_last_not_of(...)
Находит последнее вхождение любого символа, не входящего в набор, переданный как
basic_string
или указатель на символы. Если указан
n
, то принимаются во внимание только первые
n
символов используемого набора
Все эти методы возвращают индекс вхождения искомого элемента, который имеет тип
basic_string<T>::size_type
. Если поиск заканчивается неудачей, возвращается
basic_string<T>::npos
, которое является специальным значением (обычно -1), указывающим, что поиск был неудачен. Даже хотя обычно это значение -1, сравнивать возвращаемое значение следует именно с
npos
, что обеспечит переносимость. Также это сделает код более понятным, так как сравнение с
npos
является явной проверкой, не содержащей магических чисел.
Имея такое многообразие алгоритмов поиска, у вас должна быть возможность найти то, что вы ищете, а если такой возможности нет, используйте свои собственные алгоритмы. Однако если
basic_string
не предоставляет то, что требуется, то перед написанием своего кода посмотрите на
<algorithm>
. Стандартные алгоритмы работают с последовательностями, используя итераторы и почти также часто — объекты функций. Для удобства и простоты переноса
basic_string
предоставляет итераторы, так что подключение итераторов
string
к стандартным алгоритмам является тривиальным. Скажем, вам требуется найти первое вхождение двух одинаковых символов подряд. Для поиска двух одинаковых расположенных рядом («расположенных рядом» означает, что их позиции отличаются на один шаг итератора, т.е.
*iter == *(iter + 1))
символов в строке используйте шаблон функции
adjacent_find
.
std::string s = "There was a group named Kiss in the 70s";
std::string::iterator p =
std::adjacent_find(s.begin, s.end);
Результатом будет итератор, указывающий на первый из двух смежных элементов.
Если вам требуется написать собственный алгоритм работы со строками, не используйте
basic_string
так, как это делается со строками в стиле С, используя для доступа к элементам
operator[]
. Используйте существующие методы. Каждая функция поиска принимает параметр
size_type
, указывающий индекс, с которого должен начаться поиск. Последовательно используя функции поиска, можно пройти по всей строке. Рассмотрим пример 4.16, который подсчитывает число уникальных символов в строке.
Пример 4.16. Подсчет уникальных символов
#include <string>
#include <iostream>
template<typename T>
int countUnique(const std::basic_string<T>& s) {
using std::basic_string;
basic_string<T> chars;
for (typename basic_string<T>::const_iterator p = s.begin;
p != s.end; ++p) {
if (chars.find(*p) == basic.string<T>::npos)
chars += *p;
}
return(chars.length);
}
int main {
std: :string s = "Abracadabra'";
std::cout << countUnique(s) << '\n';
}
Функции поиска очень часто оказываются полезными. Когда требуется найти что- либо в строке типа
string
, они должны быть первым, что следует использовать.