Skontrolujte mapu webu xml. Podrobný sprievodca mapou webu

Ak je hlavným účelom súboru robots.txt zákaz indexovania, mapa stránok sitemap.xml vykonáva presne opačné úlohy. Je zodpovedná za zrýchlenie indexovania stránok a úplnosť indexovania stránok.

Mapa webu.xml označuje vyhľadávač frekvencia, s akou je potrebné znova indexovať stránky. V tomto ohľade je mapa webu obzvlášť dôležitá pre stránky s pravidelne aktualizovaným obsahom (spravodajské portály atď.). Sitemap.xml navyše obsahuje všetky dôležité stránky webu s uvedením ich priority.

Požiadavky na mapu webu

Mapa webu je súbor XML, ktorý uvádza adresy URL webových stránok kombinované s metadátami priradenými ku každej adrese URL (dátum poslednej úpravy; frekvencia zmien; priorita na úrovni stránok), aby vyhľadávače mohli inteligentnejšie indexovo prehľadávať tieto stránky.

Celkový počet súborov sitemap.xml na webe by nemalo presiahnuť 1 000, pričom počet záznamov (adries URL) v každom z nich by nemal prekročiť 50 000.

Ak potrebujete uviesť viac ako 50 000 adries URL, mali by ste vytvoriť viacero máp webu.

Mapu webu je možné komprimovať archivátorom gzip, aby sa zmenšila jej veľkosť. Veľkosť každého mapy webu v rozbalenej (rozbalenej) forme by však nemala presiahnuť 10 megabajtov.

Mapa webu nemusí byť vo forme xml súbor... Protokol umožňuje generovanie mapy vo forme syndikácie (RSS alebo Atom) alebo vo forme jednoduchej textový súbor so zoznamom adries URL po riadkoch. Takéto „mapy webov“ však buď neobsahujú všetky adresy URL stránok (v prípade syndikácie), alebo neobsahujú ďalšie dôležitá informácia(dátum a čas úpravy obsahu stránky), v skutočnosti kvôli ktorému sa mapy webov používajú v SEO.

Poskytnutím časovej pečiatky poslednej zmeny Povolíte prehľadávačom vyhľadávacieho nástroja načítať iba podmnožinu máp webu v indexe, to znamená, že prehľadávač môže načítať iba tie súbory (stránky) stránok, ktoré boli zmenené po určitom dátume. Tento mechanizmus čiastočnej extrakcie súborov zo súboru Sitemap.xml vám umožňuje rýchlo objaviť nové adresy URL na veľkých serveroch. Navyše vám to umožní znížiť zaťaženie servera aj prehľadávača. A oni (vyhľadávače) majú veľmi radi to druhé.

Kombinácia mapy webu s súborom robots.txt a robotovými značkami

Ak sa návod na súbor sitemap.xml používa správne, mal by sa navzájom dopĺňať. Existuje tri základné pravidlá interakcie týchto pokynov:

  • metaznačky sitemap.xml, robots.txt a robots by si nemali navzájom odporovať;
  • všetky stránky vylúčené (blokované) v súboroch robots.txt a robots by mali byť tiež vylúčené zo súboru sitemap.xml;
  • všetky indexované stránky povolené súborom robots.txt musia byť súčasťou súboru sitemap.xml

Výnimky z týchto troch pravidiel

Z týchto troch pravidiel existujú aj výnimky. A ako vždy sú prepojené so stránkami so stránkami. Začínajúc od druhého a ďalej na stránke stránkovania, registrujeme noindex, sledujeme meta tagy robotov, zatiaľ čo stránkovanie stránok nie je zatvorené pred indexovaním v súbore robots.txt.

Nastavte dátum a čas zmeny stránky tak, aby sa rovnal dátumu a času zmeny hlavnej (prvej, hlavnej stránky) stránky v katalógu. V zásade sa s tým dá súhlasiť.

Optimalizátory zo starej školy odporúčajú pridať do súboru sitemap.xls iba neindexované alebo zmenené stránky. Stránky zahrnuté v indexe by mali byť odstránené z mapy webu. Ale s týmto názorom je už ťažšie súhlasiť. Keď je pole lastmod prítomné a je správne vyplnené, o takéto potešenie nie je núdza.

Hlavné problémy pri použití mapy webu.xml

Počas vykonávania som sa najčastejšie stretol s nasledujúcimi chybami:

  1. Nekonzistentnosť mapy webu.xml so stránkami stránok, zastaraná mapa stránok. Tento problém nastáva vtedy, ak mapa webu nie je generovaná dynamicky, ale príležitostne spustením nejakej služby v systéme CMS alebo dokonca službami tretích strán. V tomto prípade sa objaví veľa mŕtvych stránok, čo spôsobuje 404 chýb (v prípade, že bola stránka fyzicky odstránená alebo presunutá na iné miesto, bola zmenená adresa URL). Nové stránky sú navyše indexované oveľa pomalšie, pretože sa nenachádzajú v mape webu.xml.
  2. Ďalšou chybou je neplatná štruktúra súboru sitemap.xml. K tejto chybe dochádza spravidla v „samostatne napísaných“ CMS alebo pri použití nesprávnych doplnkov pre populárny CMS. Toto generuje súbor sitemap.xml v rozpore so štruktúrou popísanou protokolom.
  3. Úpravou tejto chyby je nesprávne spracovanie dátumu zmeny záznamu. Z hľadiska protokolu nejde o chybu, pretože pole lastmod je voliteľné. Z pohľadu SEO a vyhľadávacích nástrojov absencia správnej hodnoty v tomto poli (súbežne s priamou zmenou obsahu) úplne neguje význam celého súboru sitemap.xml. Ako bolo uvedené vyššie, vyhľadávacie nástroje znova indexujú stránky, ktorých pole lastmod sa zmenilo. Čo sa stane, ak sa toto pole zmení súčasne pre všetky záznamy (stránky) webu. To znamená, že dátum úpravy je pre všetky súbory stránok rovnaký. S najväčšou pravdepodobnosťou vyhľadávače nevenujú pozornosť mape webu a stránka bude znova indexovaná obvyklým spôsobom, zatiaľ čo hlboko umiestnené stránky buď nie sú reindexované vôbec, alebo budú reindexované veľmi dlho. Takže buď nesmiete pole lastmod používať vôbec (čo je zlé), alebo nastaviť dátum poslednej významnej zmeny stránky. napríklad keď sa zmenila cena alebo skončil produkt alebo sa zmenil popis ...
  4. Ďalšou skupinou vyskytujúcich sa chýb sú logické chyby spôsobené porušením troch pravidiel o kombinovaní súborov robots.txt a sitemap.xml. V takom prípade môžete v indexe pozorovať neustály zásah stránky a okamžitý odchod odtiaľ. To sa však nedodrží, ak existuje metaznačka noindex a záznam v súbore Sitemap.xml. V tomto prípade crawler (robot, PS spider), ktorý vstúpil na stránku, ju neindexuje.
  5. Nuž a poslednou chybou, ktorá sa na stránkach často vyskytuje, je prítomnosť „osirotených stránok“. Sú to stránky, na ktoré existuje odkaz zo mapy webu, ale neexistuje ani jeden priamy odkaz na žiadnu zo stránok na webe. Dôvodom je často skutočnosť, že stránky boli odstránené „logicky“ (napríklad vo WordPresse boli umiestnené do koša), a nie fyzicky. Toto je tiež pozorované na stránkach, kde je prístup k produktovým kartám vykonávaný pomocou skriptov a filtrov spôsobom, ktorý neumožňuje indexovanie výsledkov týchto skriptov. Výskyt takýchto osirotených stránok môže mať ďalšie dôvody. To všetko znižuje dôveru vyhľadávačov voči stránkam a je negatívnym hodnotiacim signálom.

Podľa protokolu môžete po zmene mapy webu odoslať ping do vyhľadávacích nástrojov. Ak to chcete urobiť, musíte vytvoriť dotaz nasledujúceho typu.

Mapa webu je súbor s odkazmi na stránky stránok, ktorý informuje vyhľadávače o aktuálnej štruktúre stránok. Yandex podporuje formáty XML a TXT. Formát XML umožňuje prenos ďalších informácií.

Poznámka. Spoločnosť Yandex nezaručuje, že do výsledkov vyhľadávania budú zahrnuté všetky adresy URL uvedené v súbore.

  1. Požiadavky na súbor
  2. Otázky a odpovede

Kedy potrebujem mapu webu?

Yandex vyvíja špeciálne algoritmy, pomocou ktorých sa indexovací robot dozvie o webe. Napríklad pomocou Odkaz, ktorý spája stránky jedného webu. Stránky \ n je možné nachádzať v rôznych adresároch tej istej domény alebo na subdoménach.

"}}">vnútorné a Odkaz, ktorý sa nachádza na inom webe. "))"> externé odkazy - presúvanie z jednej stránky na druhú. Niekedy môže robot preskočiť stránky. Použite mapu webu, ak váš web:

    veľký počet strán;

    oddelené stránky bez navigačných odkazov;

    hlboké hniezdenie.

Formáty podporované spoločnosťou Yandex

Obmedzenie. Vyhľadávanie Yandex nepodporuje odosielanie kanálov RSS a Atom pomocou súboru Sitemap.

Požiadavky na súbor

    Maximálna veľkosť nekomprimovaného súboru je 50 MB.

    Súbor umiestnite na rovnakú doménu ako web, pre ktorý bol vytvorený.

    Pri prístupe k súboru by mal server vrátiť kód HTTP 200.

Ako vytvoriť súbor a nahlásiť ho spoločnosti Yandex

V prípade potreby môžete informácie o mape webu odstrániť.

Otázky a odpovede

Mapa webu sa v službe zobrazuje ako vylúčená stránka so stavom „Neplatný formát dokumentu“

Zobrazenie mapy webu (ako iných súborov XML) ako vylúčených stránok slúži iba na informačné účely a žiadnym spôsobom neovplyvňuje indexovanie stránok ani spracovanie mapy webu.

Súbor Sitemap je možné zobraziť v skupine vylúčených stránok, pretože robot sa ho pokúsil indexovať ako bežnú stránku, zatiaľ čo súbory XML nie sú indexované vo vyhľadávacom nástroji Yandex a nie sú zahrnuté vo výsledkoch vyhľadávania.

Pri spracovaní mapy webu sa vyskytla chyba „Neznáma značka“

Mapa webu môže obsahovať iba určité prvky XML. Ak správca webu nájde v súbore ďalšie prvky (napríklad označenie mobilnej alebo viacjazyčnej verzie, adresy obrázkov), správca webu zobrazí chybu „Neznáma značka“. Nepodporované prvky robot pri spracovaní mapy webu ignoruje, pričom sa berú do úvahy údaje z podporovaných prvkov. Preto nie je potrebné mapu webu meniť.

Ak sa zmení obsah súboru, aktualizácia informácií vo webmasterovi bude trvať až dva týždne.

Súbor mapy webu má stav „Neindexovaný“

Súbor mapy webu nemusí byť indexovaný z niekoľkých dôvodov:

    Robot nedávno prehľadal mapu webu a zatiaľ ju nespracoval. Počkajte dva týždne. Ak používate indexový súbor mapy webu s viacerými súbormi, ich spracovanie môže trvať dlhšie ako jeden súbor sitemap.

    Táto stránka bola predtým pre indexovacieho robota nedostupná. Na ďalšiu návštevu webu robotom musíte počkať.

V tejto príručke sa zameriame na nasledujúce otázky:

Čo je to mapa stránok?

Toto je súbor, ktorý obsahuje zoznam odkazov na všetky dôležité stránky webu. To znamená, že tento dokument nasmeruje vyhľadávacie nástroje na hlavný obsah na webe.

Na čo slúži mapa webu?

Mapa webu je potrebná, ak majú webové stránky problémy s indexovaním, ktoré sú spôsobené:
1) veľký počet strán;
2) nedostatok odkazov (interných alebo externých) na stránky;
3) hlboké hniezdenie na mieste (mätúca štruktúra).

Mapa webu HTML vs XML

Mapy stránok sú nasledujúcich typov:

  • HTML;

Najjednoduchším vysvetlením rozdielu medzi týmito formátmi je, že mapa XML je primárne pre vyhľadávače, zatiaľ čo HTML je pre používateľov.

HTML mapa- toto je len všeobecný prehľad stránok, obsahuje iba informácie a stránky, ktoré používatelia potrebujú vidieť. Ak ste na webe a hľadáte konkrétnu sekciu, keď prejdete na HTML mapu webu, ľahko ju nájdete. Aj keď je tento typ mapy webu zameraný na používateľa, môže tiež pomôcť hodnoteniu vo vyhľadávačoch. Toto je jeden zo znakov, že vám záleží na užívateľskej prívetivosti stránok.

Pri zostavovaní mapy webu HTML je dôležité vziať do úvahy:

1. Štruktúrovaný obsah.

Mapa webu by mala byť jasná a užívateľsky prívetivá. Je žiaduce, aby obsahoval sekcie, kategórie, podkategórie atď.

2. Spojovacie kotvy.

Protokol XML mapy stránka je určená pre vyhľadávacie roboty. Súbor XML obsahuje informácie o tom, kedy naposledy adresa URL bola aktualizovaná, ako je dôležitá a ako často dochádza k zmenám.

Mapa webu sa zvyčajne skladá z nasledujúcich značiek XML:

Povinné:
- definuje štandard protokolu a zapuzdruje tento súbor.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://win-keys.ru/sk/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Sitemap или Карта сайта – специально созданный файл с перечнем страниц ресурса, которые необходимо проиндексировать.

Зачем нужен файл Sitemap

Существует два вида Карты сайта, которые различаются форматами и назначением:

HTML-карта

Её составляют для пользователей, чтобы упростить им навигацию по страницам сайта. Это необязательный элемент, такую карту можно составить на большом сайте со сложной иерархией для удобства пользователей.

XML-карта

Нужна для поисковых ботов, она важна для SEO, так как помогает ботам индексировать страницы ресурса.Наличие этого файла подсказывает поисковым роботам, как именно организована структура сайта. Соответственно, Яндекс, Google, Bing и другие поисковики получают возможность более качественно индексировать проект.

В этом материале разберем создание XML-карты .

Для чего нужна Карта сайта:

  1. Ускорить процесс полной индексации .
    Поисковые роботы Google могут пропустить недавно созданные или измененные страницы, а Карта поможет в них ориентироваться.
  2. Дать дополнительную информацию.
    В Карте указывают дополнительные рекомендации для робота: делают пометки о важности страницы, частоте и дате обновления.
  3. Отобразить количество проиндексированных URL
    Сигналы из Sitemap нужны в том числе для отображения проиндексированных ссылок в Search Console.
  4. Ускорить процесс пакетной деиндексации.
    Для этого создают временный файл Sitemap, в который включают страницы для удаления. Об этом , он рекомендует обязательно указать дату последнего изменения страниц, когда им был присвоен код ошибки 404 или атрибут noindex. Так Google будет знать, что необходимо заново просканировать содержимое сайта. Через несколько месяцев эту временную карту сайта можно будет убрать.

При этом даже если Google найдет ссылку в Sitemap, но ее не будет в навигации, он не придаст ей веса и не проиндексирует. Ссылки в Карте сайта - это рекомендации, важнее всего составить грамотную , в которой поисковый робот найдет все нужные страницы.

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Лендингам, небольшим корпоративным сайтам из пары страниц, одностраничным визиткам Карта сайта и не нужна - бот разберется в страницах без труда. Карты нужны для сайтов, которые сложно краулить, поэтому для остальных проектов ее рекомендуют создать.

Карта обязательно нужна сайтам с такими признаками:

  • Проект создан недавно, у него мало внешних ссылок. В этом случае поисковому боту сложнее найти сайт.
  • В структуре сайта много архивов веб-документов, не связанных между собой.
  • У проекта большое количество страниц, разделов и подразделов;
  • В структуре преобладают динамические страницы.
  • На сайте есть мультимедийный контент. Бот сможет получить дополнительную информацию из Sitemap для показа в результатах поиска.

Поисковые системы могут не проиндексировать все нужные страницы таких сайтов, если не предложить краулерам файл Sitemap. Разберем, как его создать.


Базовые критерии создания файла Sitemap

У поисковиков есть свои требования к составлению Карты сайта, о которых нужно помнить веб-мастеру.

Общие требования к Sitemap:

  1. Количество URL-адресов в файле Sitemap не должно превышать 50 тысяч. Если их больше, необходимо создать несколько отдельных Карт сайта, которые прописывают в файле индекса Sitemap. По , для этого достаточно создать несколько отдельных файлов Sitemap, не больше 50 тысяч ссылок каждая, а в сумме ссылок может быть больше лимита. После этого для нескольких Карт создают общий материнский файл Sitemap.
  2. Максимальный размер файла – 50 Мб. Файл можно уменьшить при помощи сжатия , но в несжатом виде он все равно должен быть меньше 50 Мб.
  3. Файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.
  4. Можно использовать кодировку UTF-8, а также латинские буквы и цифры.
  5. на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.
  6. URL идентификаторы сессий не должны быть в Карте сайта.
  7. Ссылки должны иметь одинаковый синтаксис.
  8. В Карте указаны только канонические URL.
  9. Карта не конфликтует с информацией в robots.txt - если в robots.txt какие-то страницы закрыты от индексации, то их не должно быть в Карте.

Некоторые веб-мастеры беспокоятся о порядке ссылок в файле, но представитель Google , что очередность не имеет значения вообще, главное - поместить в Sitemap самые важные канонические ссылки.


Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Карту сайта можно создать в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. Яндекс указывает, что поиск не поддерживает передачу RSS и Atom-фидов с помощью Sitemap. Если ориентируетесь на разные поисковые системы, используйте формат XML. Правила создания файла описаны в стандарте .

Служебные теги Sitemap

Обязательные теги Карты сайта:

  • - контейнер с указанием стандарта протокола;
  • - родительский тег для каждой записи URL-адреса;
  • - указание URL, начинается с префикса, к примеру, http или https.

Дополнительные теги:

  • - частота обновления веб-документа с атрибутами never, always, yearly, monthly и так далее;
  • - дата последнего обновления на странице;
  • Указание разной важности страниц ресурса от 0,1 до 1, определяет очередность обработки URL на этом сайте. Google его не поддерживает. Приоритет можно дать самым важным страницам и нет смысла указывать высокий приоритет всем ссылкам, тогда тег вообще ни на что не повлияет.

Другие языковые версии сайта указывают с помощью атрибута hreflang .

Пример Карты сайта в формате XML

Sitemap для сайт, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.сайт/!} 2016-03-21 daily 0.8

Ako vytvoriť a kam umiestniť mapu webu?

Ak si želáte, môžete vytvoriť mapu webu ručne, ale je to príliš namáhavé a zbytočné - mapa webu by mala byť dynamická, ak stránku pravidelne aktualizujete - uverejňujete nové položky blogu, rozvíjate internetový obchod. Je lepšie vytvárať mapy stránok automaticky pomocou bezplatných online služieb a doplnkov CMS.

Služby vytvárania mapy webu


Ako často po vytvorení novej stránky sa pre ňu vytvára mapa webu? Súdiac podľa našich štatistík novo prichádzajúcich projektov, najmenej 50-60% stránok je vytvorených bez generovania mapy vo formáte sitemap.xml. Áno, dá sa tvrdiť, že úlohou vývojára je vytvoriť webovú stránku. Ako to bude indexované a ako rýchlo sa dostaneme do indexu vyhľadávacích nástrojov, je vecou majiteľa stránky. V zásade to tiež platí, ale vytvorenie súboru Sitemap.XML a tým pádom vytvorenie aspoň príjemného bonusu pre klienta je otázkou niekoľkých minút.

Čo je teda Sitemap.XML a ako môže byť užitočné? Budem o tom hovoriť ďalej.

Mapa stránok-XML súbor s informáciami o stránkach stránok pre vyhľadávače. Tento súbor pomáha vyhľadávacím nástrojom pri indexovom prehľadávaní a indexovaní stránok. Je potrebné poznamenať, že tento súbor nie je smernicou, ale iba akýmsi návrhom na skenovanie a indexovanie potrebných stránok webu. Vytvorením takéhoto súboru pre váš nový web tým uľahčíte (prečítate, zrýchlite) prácu vyhľadávacích nástrojov na prehľadávaní a indexovaní stránok.

Príklad mapy webu.xml

Tu je príklad toho, ako môže mapa webu vyzerať vo formáte xml. (opisuje iba jednu stránku webu)

http://www.site.com.ua/

2010-16-07

denne

1,0 / priorita>

Ako vytvoriť súbor Sitemap.xml

Existuje niekoľko z nich na automatické vytváranie mapy webu. online služby... Napríklad: jeden, dva.

Ako používať súbor Sitemap.xml

Súbor sa spravidla nachádza v koreňovom adresári stránky, takže je dostupný na adrese http://www.site.com.ua/sitemap.xml.

Súbor by nemal obsahovať viac ako 50 000 adries URL a jeho veľkosť by nemala presiahnuť 10 MB. Ak potrebujete zadať viac ako 50 000 adries URL, vytvoríme niekoľko súborov Sitemap.

Kontrola správnosti vygenerovanej mapy webu

Nasledujúce schémy XML sa používajú na definovanie prvkov a atribútov, ktoré sa môžu objaviť v mapách webu:

Varovanie vyhľadávacích nástrojov o súbore mapy webu

Po vytvorení súboru sitemap a jeho umiestnení je potrebné upozorniť vytvorené a zverejnené na webovom serveri, je potrebné upozorniť vyhľadávače na jeho umiestnenie.

Túto operáciu je možné vykonať niekoľkými spôsobmi:

  • pomocou panela správcu webu vyhľadávača
  • zadaním umiestnenia súboru v súbore robots.txt
  • pomocou špeciálnej požiadavky do vyhľadávača (postup vytvorenia žiadosti je popísaný nižšie)

V tabuľke sú uvedené dopyty niektorých vyhľadávacích nástrojov

Vyhľadávací systém Adresa
Google http://google.com/webmasters/sitemaps/ping?sitemap=
Yandex. http://webmaster.yandex.ru/wmconsole/sitemap_list.xml?host=
Yahoo! http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=

Epilóg

Stojí za zmienku, že vytváranie súborov ako sitemap.xml a robots.txt je jednou z prvých akcií „gentlemanov“ po vytvorení nového webu.