Оптимизация для роботов карты сайта

Sitemap.xml если не обязательный, то весьма желательный дескриптор сайта. Он — пища для индексирующих роботов. В самой простой нотации карта сайта упоминается в бот-инструктаже robots.txt. В частности, наш сайт скармливает паукам такую конструкцию:

                      User-agent: *
                      Sitemap: /index.xml
                      Host:

Можно обойтись без карты сайта? — Запросто! Рано или поздно сканеры сами найдут все, что им нужно. Или почти все. А если принять во внимание, что пословицу «Лучше поздно, чем никогда!» придумали лентяи, то оптимизацию сайта стоит начинать именно в этом направлении. Выигрыш во времени гарантирован.

Почему в robots.txt лучше использовать индекс, а не саму карту сайта?

В нашем примере (и в этом легко убедиться) в качестве параметра для директивы Sitemap используется файл индекса Sitemap. Мы были неоригинальны и дали ему имя index.xml, но, по правде говоря, наша фантазия в этом деле ничем не ограничена, и назвать эту без преувеличения корневую структуру можно и по-другому.

Какие преимущества дает использование индекса, вместо карты сайта? Их несколько. Если не обсуждать культуру программирования и логику древовидных структур, то первым адвантиджем будет представление в индексном файле метаданных обо всех типах контента на сайте.

                      
                                                                   /sitemap.xml
                                                                   2012-03-11
                                             

                                                                   /image.xml
                                                                   2012-03-11
                

И хотя в нашем случае типов контента всего два: содержимое сайта в html-файлах и графические объекты, — в общем случае на сегодня их перечень шире, и кроме уже перечисленных, он состоит также из описаний видео, новостей, исходного кода, данных для мобильных устройств и географического контента. Детальное описание всех разновидностей можно найти на сайте Google.

Еще один аргумент в пользу индексного файла — ограничение объема Sitemap. В этой ситуации даже упакованная карта сайта потребует мильтифайловой структуры, что мы и видим на примере сайта noindex.by.

Маленькие хитрости

Ничто не мешает создать несколько файлов, описывающих тот или иной раздел сайта, и положить их не в корень, а в избранную директорию. Предположим, что на сайте, кроме всего прочего, есть два каталога, где хранятся фотоотчеты за 2011 и 2012 год: foto_2011 и foto_2012 соответственно.

Создавая два файла и размещая их в указанную директорию (пути /foto_2011/sitemap_2011.xml и /foto_2012/sitemap_2012.xml), мы не только информируем роботов о содержимом каждой из директорий, но также в явном виде декларируем их названия. Что, согласитесь, не так уж плохо.

01-08-2014

Bitcoins для всех

Бесплатные биткоины здесь!

Реклама

Навигация

Найти в блоге

Реклама

Статистика

Яндекс.Метрика

Все операции с электронными валютами


Мгновенный сервис вывода электронных валют

Бесплатные биткоины здесь!