Поиск в интернете
Шрифт:
Вероятно, поначалу рекламодатели просто заинтересовались нестандартностью идеи. Но после публикаций в СМИ сайт стал весьма посещаемым, а следовательно, действительно привлекательным с рекламной точки зрения.
С тех пор как Алекс придумал свой сайт, он зарабатывал по 4 тысячи долларов в день. Предпоследний кусочек рекламного пространства площадью 1000 пикселов был продан на интернет-аукционе eBay за 38 100 долларов.
Алекс пока не знает, будет ли он развивать эту идею дальше, но адрес billiondollarhomepage.com он уже зарегистрировал.
URL:
универсальный адрес
Теперь, когда мы узнали, что такое доменное имя, стоит вернуться к структуре гипертекстового документа. Как было сказано выше, такой документ можно рассматривать как набор страниц (HTML-файлов), связанных между собой гиперссылками. Если таких страниц достаточно много, они упорядочены и однотипно оформлены, то их обычно называют сайтом (от англ. site), или узлом. Правда, второй вариант чаще используется для обозначения подключенного к Сети компьютера, имеющего собственное доменное имя.
ПРИМЕЧАНИЕ: Если помимо предоставления информации сайт обеспечивает доступ к нескольким сервисам Интернета (электронной почте, рассылкам новостей, электронному магазину), то его обычно называют порталом.
Как правило, физически сайт размещается в одной папке на жестком диске компьютера, подключенного к Сети. Эта папка может содержать другие вложенные папки для более удобной работы с файлами сайта. Например, может быть создана отдельная папка для рисунков, включаемых в HTML-страницы, еще одна – для звуковых файлов или для флэш-фильмов и т. д. (рис. 1.10). В отдельной папке также хранятся файлы с программами-сценариями, обеспечивающими интерактивность сайта.
Если посетители Интернета имеют доступ к единственному сайту, размещенному на данном компьютере, то можно считать (с некоторыми оговорками), что адрес сайта совпадает с доменным именем компьютера. Например, если на компьютере, имеющем имя bank и входящем в домен. spb, который, в свою очередь, является частью домена. ru, размещен единственный сайт, то адресом сайта можно считать доменное имя bank.spb.ru. Обычно компьютер, на котором размещен сайт, называют веб-сервером, поскольку он «обслуживает» запросы, поступающие от клиентов– посетителей Интернета (точнее, от браузеров посетителей).
Рис. 1.10. Типовая структура небольшого сайта.
ПРИМЕЧАНИЕ: Следует отметить, что на таком компьютере должно быть установлено дополнительное программное обеспечение, предназначенное для обработки поступающих запросов (отправки запрошенных страниц). Кроме того, серверное программное обеспечение выполняет ряд дополнительных задач. Например, оно может проверять, разрешен ли данному пользователю доступ к конкретной странице сайта.
В большинстве случаев начальная (главная) страница сайта размещается непосредственно в корневой папке сайта, и веб-сервер при поступлении адреса сайта от клиента пересылает браузеру в качестве ответа на запрос именно эту страницу. Обычно такой файл называется Index.html, Default.html или Home.html (см. рис. 1.10).
Чтобы обратиться
Поскольку физическим носителем (точнее, хранителем) ресурса является компьютер, то основу URL составляет доменное имя этого компьютера. Однако для обращения к конкретному файлу-ресурсу требуется указывать дополнительные сведения – маршрут доступа к необходимому файлу. Маршрут доступа отделяется от доменного имени наклонной чертой (слэшем). Например, обращение к файлу Cat.gif, находящемуся в папке Images, может выглядеть так: bank.spb.ru/Images/Cat.gif.
Наряду с адресом ресурса URL обычно содержит также наименование протокола, который должен использоваться при работе с запрашиваемым ресурсом.
Вот наиболее распространенные протоколы (методы) доступа к ресурсам Интернета:
• http – сокращение от Hypertext Transfer Protocol (протокол пересылки гипертекста); применяется для доступа к гипертекстовым документам;
• ftp – сокращение от File Transfer Protocol (протокол передачи файлов); применяется для обращения к файлам, хранящимся в FTP-архивах;
• news – применяется для доступа к новостям системы Usenet;
• file – применяется для доступа к локальным файлам.
Например, для обращения к упоминавшемуся выше графическому файлу Cat.gif, расположенному в FTP-архиве public, может использоваться такой URL: ftp://public.spb.ru/Images/Cat.gif.
Подробнее о поиске информации, отличающейся от гипертекстовых документов, будет рассказано в главах 2 и 3.
Итак, в общем случае URL выглядит следующим образом (рис. 1.11):
[тип протокола]:// [доменное имя компьютера]/[маршрут доступа].
Рис. 1.11. Структура URL.
ПРИМЕЧАНИЕ: Иногда (при наличии соответствующего сетевого оборудования) компьютер может быть не только подключен к Интернету, но и включен в состав одной или нескольких локальных сетей. В этом случае целесообразно указывать в URL наименование входного порта, используемого для подключения к Интернету. Например, URLport1/path/file.htm означает, что ресурс расположен на компьютере с доменным именем www.wired.com и что для доступа к нему необходимо использовать протокол HTTP через IP-порт с именем port1.
В заключение отметим, что далеко не всегда имена папок и файлов, используемые в URL, совпадают с именами физических папок и файлов, расположенных на веб-сервере. Одна из причин – попытка владельцев сайта защитить информацию от злоумышленников. Другая причина состоит в том, что современные программные средства позволяют создавать запрашиваемые документы динамически. То есть до тех пор, пока документ не понадобится посетителю сайта, он вообще может не существовать. Характерный пример использования такой технологии – поиск и выдача информации из базы данных.