Часто можно заметить, что при одном и том же запросе разные поисковики выдают различные страницы. Если вас интересует, например, как происходит , то указав запрос в Яндексе, пользователь на первой странице в определенном порядке получает один список веб-сайтов, а вот в Рамблере этот список может быть другим, и сайты могут располагаться в совершенно другом порядке. Это связано с тем, что некоторые, веб-программисты для каждого бота создают свои страницы. Но еще хуже, если поисковик видит одну страницу, а пользователи – другую. Этот нечестный прием не приветствуется создателями поисковиков, и в случае обнаружения велика вероятность того, что ресурс получит «бан», то есть будет исключен из индекса поисковой системы.
Все поисковые пауки или боты имеют свое название, что дает возможность отличать ботов и определять, к какой поисковой системе он принадлежит. Например, бот Google называется Googlebot, а бот Яндекса имеет имя Yandex. Данные названия веб-мастер использует в файле robots.txt, где можно запретить какому-либо поисковику индексировать определенные страницы.
Такие базы данных называют индексом поисковой системы, а индексирование сайта – это включение конкретного сайта в этот индекс. Каждый поисковик оснащен специальной программой, которую часто называют роботом, пауком или ботом. Именно робот индексирует веб-сайты, а сам процесс индексирования заключается в сборе информации и чем-то напоминает ползание паука по сайтам.
Так, например, если вас интересует , то поиск будет производиться только по усеченной базе данных, куда уже собраны все наименования сайтов, где есть информация на интересующую вас тему. Разумеется, такой подход дает возможность быстрее находить нужные данные, чем каждый раз выполнять поиск по всем сайтам.
Знаете ли вы, что поисковые системы вовсе не «лопатят» каждый раз все сайты, чтобы найти нужную вам информацию? Сканировать весь интернет – это было бы слишком долго и расточительно. Вместо этого каждый поисковик создает себе базу данных, в которой содержится основная информация обо всех страницах, содержащихся в сети.
> > Как работают поисковые роботы
Как работают поисковые роботы
Как работают поисковые роботы | Территория бизнеса
Комментариев нет:
Отправить комментарий