Чтение онлайн

на главную - закладки

Жанры

Интернет – легко и просто!
Шрифт:

3. Индексатор (indexer) – программа, служащая для упорядочивания информации, найденной пауками. Индексатор разбивает текст документа на составляющие его слова, при этом запоминая их местонахождение, анализируя, написано слово прописными или строчными буквами, является ли оно названием документа, текстом ссылки и т. д.

4. База данных (database) – представляет собой хранилище всех обработанных данных, накопленных поисковой системой.

5. Механизм выдачи результатов (search engine) – предназначен для взаимодействия пользователя с базой данных. С ним вы постоянно будете иметь дело при поиске какой-либо информации. Именно

этот механизм определяет, какие вебстраницы вам представлять в соответствии с вашим запросом.

После задания вами ключевого слова или фразы поисковая система осуществляет поиск и выдает вам результат, который представляет собой список найденных веб-страниц, соответствующих вашему запросу. Для определения порядка, в котором будет показаны документы в списке, поисковая машина применяет алгоритм ранжирования. В идеале наиболее релевантные вашему запросу страницы будут расположены в списке первыми. Однако идеальный алгоритм ранжирования не найден, поэтому каждая поисковая система использует собственный, хотя отбор результатов во всех системах основывается примерно на следующих критериях:

– наличие ключевых слов в заголовке;

– плотность ключевых слов в содержимом документа, то есть количество искомых слов в тексте веб-страницы;

– расположение ключевых слов в документе;

– стиль ключевых слов (полужирный, курсив);

– индекс цитируемости – количество ссылок, ведущих на данную веб-страницу с других страниц;

– наличие ключевого слова в имени домена или адресе страницы.

После того как вы щелкнете на ссылке одного из документов в списке, предложенном вам поисковой системой, веб-страница будет запрошена с того сервера, на котором она находится.

Популярные поисковые машины

Наиболее популярны следующие поисковые машины:

– Google –(рис. 4.1);

– Yahoo! – http://www.yahoo.com;

– AltaVista – http://www.altavista.com;

– Lycos – http://www.lycos.com;

– Excite – http://www.excite.com;

– AOL Search – http://search.aol.com;

– HotBot – http://www.hotbot.com.

На этом, разумеется, список популярных поисковых систем не заканчивается – их количество исчисляется сотнями. Однако я уверен, что для работы с англоязычными сайтами вам с лихвой хватит и этих.

Следует отметить, что практически все представленные выше поисковые машины могут работать и с кириллицей. Но для поиска информации на русском языке все-таки рекомендую отечественные поисковые системы:

– Яндекс – http://www.yandex.ru;

– Рамблер – http://www.rambler.ru;

– Апорт – http://www.aport.ru;

– mail.ru – http://www.mail.ru.

Существуют и другие русскоязычные поисковые системы, однако эти наиболее популярны, особенно первые две.

Рис. 4.1. Поисковая система Google

Формирование запросов

Если вы не хотите углубляться в детали техники поиска, то можете просто задать поисковой машине вопрос так же, как задали бы его человеку, у которого хотите получить совет. Например, «как быстро похудеть», «есть ли жизнь на Марсе», «где раки зимуют» (рис. 4.2) или просто «работа журналиста».

Не

исключено, что вы быстро найдете интересующую вас информацию. Но может случиться так, что поисковая система завалит вас кучей совсем не интересных вам ссылок. Так, на запрос «работа журналиста» Яндекс нашел более 180 000 документов.

Одними из первых в списке стояли ссылки на веб-страницы с информацией о конкурсе работ журналистов на тему иммунизации населения против кори и краснухи, о регламентировании работы журналистов в кризисных ситуациях и о влиянии внесенных дополнений к закону о СМИ на работу журналистов. Все это, конечно, довольно занимательно, но вряд ли вас удовлетворит.

Получить слишком много информации не намного лучше, чем не получить ничего. Мудрецы считают, что правильно заданный вопрос уже содержит в себе половину ответа. Это особенно справедливо по отношению к поисковым машинам.

Существует немало способов увеличения эффективности поиска. Рассмотрим самые основные из них.

Рис. 4.2. Формирование поискового запроса

Увеличение количества ключевых слов

Одно или два слова при поиске используют в основном начинающие пользователи. Видавшие виды пользователи Интернета включают в запрос в среднем пять или шесть ключевых слов, чтобы уменьшить количество ненужной информации и сделать запрос более точным. Но увеличение количества ключевых слов необходимо понимать правильно. Не стоит включать в запрос частицы и предлоги. Это так называемые стоп-слова. По умолчанию они исключаются поисковой машиной из запроса в связи с малой информативностью. Не нужно также использовать вводные и не относящиеся к делу слова.

К примеру, на запрос «ищу работу журналиста» поисковая машина совершенно справедливо предложит вам уйму ссылок на резюме выпускников факультета журналистики и прочих соискателей работы в области СМИ.

В таком случае нужно быть хитрее и вместо «ищу» написать «предлагаю». Результат будет гораздо лучше.

Каждое добавляемое к запросу слово должно его конкретизировать, указывать на особенности объекта поиска. Ведь поисковая машина не может читать ваши мысли.

Так скажите ей то, что вы думаете! Вы ищете работу журналиста? Хорошо. Какую именно работу, удаленную? Добавляем слово «удаленная». Вы собираетесь писать, фотографировать или снимать? Если писать, то добавьте слово «статья». Итак, мы получили запрос следующего вида: «журналист работа удаленная статья предлагаю». На этот запрос Яндекс выдал не 180 000, а всего 132 документа, которые уже более точно отвечают вашим потребностям.

Если и здесь вы не нашли то, что искали, то можно поиграть со словами, заменяя их синонимами. Например, слово «журналист» можно заменить на «автор», «удаленную работу» – на «телеработу», «статью» – на «текст» и т. д.

Метод последовательного приближения

Суть данного способа заключается в том, что вы после получения результата по своему запросу добавляете к тексту запроса новые ключевые слова, уточняющие его, а затем запускаете поиск заново.

Поделиться:
Популярные книги

Кодекс Крови. Книга IV

Борзых М.
4. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга IV

Господин следователь. Книга 2

Шалашов Евгений Васильевич
2. Господин следователь
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Господин следователь. Книга 2

Энциклопедия лекарственных растений. Том 1.

Лавренова Галина Владимировна
Научно-образовательная:
медицина
7.50
рейтинг книги
Энциклопедия лекарственных растений. Том 1.

Девятый

Каменистый Артем
1. Девятый
Фантастика:
боевая фантастика
попаданцы
9.15
рейтинг книги
Девятый

Идеальный мир для Лекаря 9

Сапфир Олег
9. Лекарь
Фантастика:
боевая фантастика
юмористическое фэнтези
6.00
рейтинг книги
Идеальный мир для Лекаря 9

Флеш Рояль

Тоцка Тала
Детективы:
триллеры
7.11
рейтинг книги
Флеш Рояль

Младший сын князя. Том 4

Ткачев Андрей Юрьевич
4. Аналитик
Фантастика:
фэнтези
аниме
5.00
рейтинг книги
Младший сын князя. Том 4

Крошка Тим

Overconfident Sarcasm
Любовные романы:
остросюжетные любовные романы
5.00
рейтинг книги
Крошка Тим

Избранное. Компиляция. Книги 1-11

Пулман Филип
Фантастика:
фэнтези
героическая фантастика
5.00
рейтинг книги
Избранное. Компиляция. Книги 1-11

Соль этого лета

Рам Янка
1. Самбисты
Любовные романы:
современные любовные романы
6.00
рейтинг книги
Соль этого лета

Машенька и опер Медведев

Рам Янка
1. Накосячившие опера
Любовные романы:
современные любовные романы
6.40
рейтинг книги
Машенька и опер Медведев

Сердце Дракона. нейросеть в мире боевых искусств (главы 1-650)

Клеванский Кирилл Сергеевич
Фантастика:
фэнтези
героическая фантастика
боевая фантастика
7.51
рейтинг книги
Сердце Дракона. нейросеть в мире боевых искусств (главы 1-650)

Стеллар. Заклинатель

Прокофьев Роман Юрьевич
3. Стеллар
Фантастика:
боевая фантастика
8.40
рейтинг книги
Стеллар. Заклинатель

В зоне особого внимания

Иванов Дмитрий
12. Девяностые
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
В зоне особого внимания