Коротко о Sitemap
Sitemap [сайтмэп] – карта сайта, его содержание, немаловажный элемент в продвижении Сайта. А это означает, что если Ваш сайт считается огромным (когда количество проиндексированных страниц исчисляется не сотнями, а тысячами), самое время задуматься о качественном Sitemap!
Качественный – значит правильный, а правильный, значит нравится Google и нравится Yandex!
А как иначе передавать поисковикам список страниц, которые им нужно проиндексировать? Именно для этого и существует файл Sitemap.xml, в котором четко перечислены адреса страниц сайта [URL], важность страницы на сайте [Priority], частота ее обновления [Change Frequency] и дата последнего изменения [LastChange (GMT)], что позволяет поисковым системам наиболее разумно сканировать Ваш сайт, собирая всю информацию о URL с помощью метаданных. Хотя стоит отметить, что 100% гарантии сканирования всех URL Вашего сайта Sitemap.XML не дает.
На нашем сайте Sitemap выглядит так. Наверху, на синем фоне, написано с помощью чего он был создан. [It was generated using the Blogging-Software WordPress and the Google Sitemap Generator Plugin by Arne Brachhold.]
Вы же сможете создать протокол Sitemap с помощью различных онлайн-генераторов Sitemap, что вполне подходит для малых сайтов (когда количество проиндексированных страниц исчисляется сотнями).
Если Ваш сайт создан на движке Word-Press, Вам, как и нам, может подойти плагин Arne Brachhol. В общем, для каждого движка, нужен свой модуль-плагин, который создаст Sitemap автоматически.
Что касается огромных сайтов, то существуют ограничения:
- не более 50 000 URL в одном Sitemap;
- объем файла Sitemap не более 10 МБ.
Можно разбить по категориям, например, отдельно статьи и отдельно новости, при этом не забыв перечислить каждый из этих файлов в файле индекса Sitemap — Sitemap index.
А можно и сжать с помощью распространенного архиватора 7-zip, хотя лучше использовать разбиение на несколько Sitemap, потому что у Google может не получиться распаковать Ваш Sitemap и выдать Вам ошибку.
Нет!
Следует следить за тем, чтобы в Sitemap не попали дубликаты уже имеющейся информации, это могут быть анонсы, которые «раздражают» Google.
Что касается миролюбивого Яндекса, тот там все спокойно, у него не выявлено неприязни к динамическому контенту.
И еще один бонус от Yandex! Валидатор файлов Sitemap поможет проверить грамотность файлов Sitemap и Sitemap index с точки зрения Яндекса. В валидатор возможно:
- загрузить файл;
- ввести ссылку на файл Sitemap;
- внести текст файла.
- послать HTTP-запрос;
- указать местоположение файла Sitemap в файле robots.txt;
- сделать это с помощью интерфейса поисковой системы.
Конкретно Яндексу о Вашем Sitemap можно сообщить двумя способами:
- зайти на Яндекс.Вебмастер в раздел «Файлы Sitemap» и добавить туда URL Вашего файла Sitemap
- прописать директиву Sitemap в файле robots.txt Вашего сайта.
В корневой директории сервера ему самое что ни на есть место.
А теперь о внутренностях, о ссылках в файле Sitemap:
- в том же домене, что и файл;
- использовать тот же протокол по которому доступен и файл;
- указывать на страницы в том же каталоге (или его подкаталогах), что и файл.
- Создавайте разные файлы Sitemap.xml — заносите динамический контент в отдельный Sitemap.xml и не показывайте его Google.
- Sitemap.xml не дает 100% гарантии, что поисковые системы проиндексируют все адреса, содержащиеся в нем;
- Создавайте корректный Sitemap.xml и проверяйте его в валидаторе от Yandex, может большой пользы он и не принесет, но раз рекомендуют, значит, он должен быть;
- Размещайте Sitemap в корневой директории сервера.