Как добавить файл sitemap
Файл Sitemap для видео содержит дополнительную информацию о роликах, размещенных на ваших страницах. Это удобный способ сообщить Google о своих видео, особенно если они добавлены недавно или их трудно обнаружить с помощью обычного сканирования. Файлы Sitemap для видео, предназначенные для Google, – это расширение стандарта Sitemap.
Мы рекомендуем использовать именно этот формат, но поддерживаем и фиды mRSS.
Инструкции по работе с файлами Sitemap для видео
На что следует обращать особое внимание при работе с файлами Sitemap для видео:
Пример файла Sitemap
Ниже приведен пример файла Sitemap для одной страницы и одного видео. В этом фрагменте кода есть все теги, поддерживаемые Google.
Пространство имен XML
Теги файла Sitemap для видео определены в следующем пространстве имен:
Определения тегов файла Sitemap для видео
URL страницы, на которой есть одно или несколько видео. Пользователь попадет на нее, если нажмет в Google на результат поиска по видео. Каждый URL может указываться в файле Sitemap только один раз. Этот тег должен соответствовать основному формату Sitemap.
Если на этой странице несколько видео, укажите для нее один тег <loc> и добавьте в него несколько дочерних элементов <video> .
Родительский элемент для всей информации об одном видео на странице, указанной в теге <loc> .
URL графического файла, который используется в качестве значка видео. Соблюдайте требования к значкам видео.
Название видео. Все используемые в нем специальные символы HTML нужно экранировать или заключать в блок CDATA . Рекомендуем указывать здесь значение, совпадающее с названием видео на странице.
Описание видео. Используйте не более 2048 символов. Все специальные символы HTML в этой строке нужно экранировать или заключать в блок CDATA . Значение элемента должно в целом соответствовать описанию, опубликованному на странице, хотя может и не совпадать с ним полностью.
Фактический URL видеофайла. Файл должен быть сохранен в одном из поддерживаемых форматов.
Дополнительные инструкции:
- Поддержка HTML и Flash не предусмотрена.
- URL не должен совпадать со значением, указанным в теге <loc> .
- Этот тег аналогичен свойству VideoObject.contentUrl в структурированных данных.
- Совет. Ограничить доступ к контенту, не препятствуя сканированию, можно с помощью обратного DNS-запроса для идентификации робота Googlebot.
URL проигрывателя для отдельно взятого видео. Обычно это та информация, которая указывается в атрибуте src тега <embed> .
Дополнительные инструкции:
- URL не должен совпадать со значением, указанным в теге <loc> .
- Для видео с YouTube используйте именно этот тег, а не video:content_loc . Он аналогичен свойству VideoObject.embedUrl в структурированных данных.
- Совет. Ограничить доступ к контенту, не препятствуя сканированию, можно с помощью обратного DNS-запроса для идентификации робота Googlebot.
- allow_embed (необязательно). Позволяет указать, разрешено ли Google встраивать видео в результаты поиска. Допустимые значения: yes (да) и no (нет).
Продолжительность видео в секундах. Значение должно быть в диапазоне от 1 до 28800 (8 часов) включительно.
Указанная в формате W3C дата, по прошествии которой видео станет недоступным. Если видео не имеет срока действия, не добавляйте этот тег, иначе оно перестанет появляться в результатах поиска Google после указанной даты.
Допустимые значения: полная дата ( YYYY-MM-DD ) и полная дата с часами, минутами, секундами и часовым поясом ( YYYY-MM-DDThh:mm:ss+TZD ).
Пример: 2012-07-16T19:20:30+08:00 .
Рейтинг видео. Поддерживаются числа с плавающей запятой. Используются значения от 0.0 (низкий рейтинг) до 5.0 (высокий рейтинг) включительно.
Дата публикации видео в формате W3C. Допустимые значения: полная дата ( YYYY-MM-DD ) и полная дата с часами, минутами, секундами и часовым поясом ( YYYY-MM-DDThh:mm:ss+TZD ).
Пример: 2007-07-16T19:20:30+08:00 .
Информация о том, доступно ли видео в Безопасном поиске. Если опустить этот тег, видео будет доступно, когда Безопасный поиск включен.
Допустимые значения:
- yes : видео доступно, когда Безопасный поиск включен.
- no : видео доступно, только когда Безопасный поиск выключен.
Вы можете разрешить или запретить показ ролика в результатах поиска в определенных странах.
Укажите список кодов стран в формате ISO 3166 через пробел. Для каждого видео можно добавить только один тег <video:restriction> . При отсутствии тега <video:restriction> предполагается, что видео разрешено показывать во всех странах. Обратите внимание, что этот тег влияет только на результаты поиска. Пользователь из страны, на которую будет распространяться ограничение, может найти и воспроизвести ваш ролик другими способами. Подробнее о применении ограничений к отдельным странам…
- relationship (обязательно). Позволяет разрешить или запретить показывать видео в результатах поиска в указанных странах. Допустимые значения: allow и deny . Если задать значение allow , то показ будет разрешен только в странах из списка, а если использовать вариант deny , то показ будет разрешен во всех странах, кроме добавленных в список.
Пример кода, который позволяет показывать видео в результатах поиска Google только пользователям из Канады и Мексики:
<video:restriction relationship="allow">CA MX</video:restriction>
Вы можете разрешить или запретить показ видео в результатах поиска на определенных платформах. Укажите список платформ через пробел. Обратите внимание, что этот тег влияет только на результаты поиска. Указав список платформ, вы не помешаете их пользователям смотреть ваши ролики.
Для каждого видео можно добавить только один тег <video:platform> . При отсутствии тега <video:platform> предполагается, что видео разрешено воспроизводить на всех платформах. Подробнее о применении ограничений к отдельным платформам…
Допустимые значения:
- web – обычные браузеры на компьютерах и ноутбуках.
- mobile – мобильные браузеры, например на смартфонах и планшетах.
- tv – браузеры для телевизоров, в том числе доступные на устройствах с Google TV и игровых приставках.
- relationship (обязательно). Позволяет указать, можно ли показывать видео на указанных платформах. Допустимые значения: allow и deny . Если задать значение allow , то показ будет разрешен только на платформах из списка, а если использовать вариант deny , то показ будет разрешен на всех платформах, кроме добавленных в список.
Пример кода, который позволяет показывать видео на компьютерах, ноутбуках и телевизорах, но не на мобильных устройствах:
<video:platform relationship="allow">web tv</video:platform>
Стоимость скачивания или просмотра видео. Не используйте этот тег, если видео доступно без оплаты. Элемент <video:price> можно добавить несколько раз (например, если вам нужно указать разные валюты, разрешения или варианты покупки).
- currency (обязательно). Валюта в формате ISO 4217.
- type (необязательно). Вариант покупки. Допустимые значения: rent (напрокат) и own (в собственность). Значение по умолчанию – own .
- resolution (необязательно). Разрешение приобретаемой версии видео. Допустимые значения: hd (высокое) и sd (стандартное).
Имя пользователя, который загрузил видео. Для каждого видео можно добавить только один тег <video:uploader> . Максимальная длина строкового значения – 255 символов.
- info (необязательно). URL страницы с дополнительной информацией о пользователе, загрузившем видео. Этот URL должен находиться в том же домене, что и веб-адрес из тега <loc> .
Указывает, является ли это видео прямой трансляцией. Допустимые значения: yes (да) и no (нет).
Строка, которая позволяет идентифицировать видео. Как правило, теги – это очень короткие описания ключевых тем видео или фрагмента контента. У видео может быть несколько тегов, даже если оно относится только к одной категории. Например, видео о жарке мяса на гриле может относиться к категории "Приготовление на гриле", но для него также можно добавить теги "стейк", "мясо", "лето" и "отдых". Задавайте отдельный элемент <video:tag> для каждого тега, связанного с видео. Максимальное количество тегов – 32.
Краткое описание категории, к которой относится видео. Используйте не более 256 символов. Категории – это общие группы, позволяющие систематизировать контент по темам. Видео обычно относится только к одной категории. Например, на кулинарном сайте могут быть категории "Варка", "Выпечка" и "Приготовление на гриле". Чаще всего, видео будет относиться к одной из них.
Этот тег в настоящее время не используется.
Фиды mRSS как альтернатива файлам Sitemap
Google поддерживает mRSS – модуль RSS, который дополняет возможности стандарта RSS 2.0. Фиды mRSS очень похожи на файлы Sitemap для видео, и их можно точно так же тестировать, отправлять и обновлять.
Пример записи mRSS
Ниже приведен пример записи mRSS со всеми основными тегами, которые поддерживаются Google. Помимо прочего, в код включен тег <dcterms:type>live-video</dcterms:type> , позволяющий помечать прямые трансляции.
Теги mRSS
Содержит сведения о видео.
- medium (обязательно). Тип контента. Должен иметь значение video .
- url (обязательно). URL исходного видеоконтента. При отсутствии этого атрибута необходим тег <media:player> .
- duration (необязательно, но рекомендуется). Продолжительность видео в секундах.
Все прочие необязательные атрибуты и дочерние элементы тега <media:content> перечислены в спецификации mRSS.
Обязательно добавьте хотя бы один тег <media:player> или атрибут url в тег <media:content> .
URL проигрывателя для отдельно взятого видео. Обычно это та информация, которая указывается в атрибуте src тега <embed> . Она не должна совпадать ни с содержимым тега <loc> , ни с URL в теге <link> . Элемент <link> указывает на URL страницы, где размещено видео, а упомянутый выше тег – на проигрыватель.
Название видео. Используйте не более 100 символов. Все специальные символы HTML должны быть экранированы или заключены в блок CDATA.
Описание видео. Используйте не более 2048 символов. Все специальные символы HTML должны быть экранированы или заключены в блок CDATA.
Дата публикации видео и окончания срока, в течение которого оно будет доступно. Рекомендуем ознакомиться с полной спецификацией тега dcterms:valid .
Список перечисленных через пробел стран в формате ISO 3166, в которых может или не может показываться видео. При отсутствии тега <media:restriction> предполагается, что ролик разрешено воспроизводить во всех странах.
- type (обязательно). Для атрибута type необходимо задать значение country . Поддерживаются только ограничения по странам.
- relationship (обязательно). Атрибут определяет, можно ли воспроизводить видео в странах, перечисленных в списке. Допустимые значения:
- allow
- deny
Стоимость скачивания или просмотра видео. Не используйте этот тег, если видео доступно без оплаты. Элемент <media:price> можно добавить несколько раз (например, если вам нужно указать разные валюты или варианты покупки).
Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.
После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap, обрабатывается роботом отдельно.
После загрузки напротив каждого файла вы увидите один из статусов:
Напротив файла отобразится дата последней загрузки.
Проиндексированные страницы появятся в результатах поиска в течение двух недель
Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.
Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.
Напротив файла отобразится дата последней загрузки.
Проиндексированные страницы появятся в результатах поиска в течение двух недель
Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.
Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.
Обновить Sitemap
Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова — робот регулярно проверяет файл на обновления и ошибки.
Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap, можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.
Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.
Удалить Sitemap
Вопросы и ответы
Как правило, в Sitemap принято включать все значимые страницы сайта. Если на сайте множество страниц, вы можете удалить из Sitemap уже известные Яндексу страницы и вносить в файл только новые или часто обновляющиеся.
Если вы используете файл индекса Sitemap отметьте тегом lastmod файлы Sitemap , которые часто обновляются.
Определить, какие страницы сайта уже известны Яндексу, можно в Вебмастере на странице Индексирование → Статистика обхода .
Sitemap отображается в сервисе как исключенная страница со статусом «Неверный формат документа»Отображение файла Sitemap и других XML-файлов как исключенных страниц носит только информативный характер и никак не влияет на индексирование сайта или обработку Sitemap .
Файл Sitemap может отображаться в группе исключенных страниц, так как робот попытался проиндексировать его как обычную страницу. Не смотря на это файлы Sitemap не участвуют в поиске.
При обработке Sitemap возникла ошибка «Неизвестный тег»Файл Sitemap может содержать только определенные XML-элементы. Если Вебмастер обнаружит в файле другие элементы, например, указание на мобильную версию, в Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые элементы игнорируются роботом при обработке Sitemap , при этом данные из поддерживаемых элементов учитываются. Поэтому менять файл Sitemap необязательно.
Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Вебмастере.
Файл Sitemap находится в статусе «Не проиндексирован»Файл Sitemap может быть не проиндексирован по нескольким причинам:
Робот обошел файл Sitemap недавно и еще не успел обработать его. Подождите две недели. Если вы используете файл индекса Sitemap с несколькими файлами, то их обработка может занять больше времени, чем одного файла Sitemap . Сайт ранее был недоступен для индексирующего робота. Необходимо дождаться следующего посещения сайта роботом.Если проблема с доступом актуальна, обратитесь к администратору сайта или сервера, на котором он расположен. Если файл составлен корректно, он будет повторно обработан в течение двух недель с момента последнего запроса роботом. Проверить файл можно с помощью инструмента Анализ файлов Sitemap.
Файл Sitemap находится в статусе «Документ не содержит текст»Такой статус отображается в инструменте Проверка ответа сервера и сообщает, что робот не может проиндексировать файл как обычную страницу сайта и включить его содержимое в результаты поиска. На обработку Sitemap этот статус не влияет. Чтобы проверить корректность Sitemap используйте в Вебмастере инструмент Анализ файлов Sitemap.
Файл Sitemap находится в статусе «URL запрещён к индексированию тегом noindex»Как правило, файл Sitemap обрабатывается роботом в течение двух недель после добавления его в Вебмастер. Если этого не произошло, проверьте:
После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap, обрабатывается роботом отдельно.
После загрузки напротив каждого файла вы увидите один из статусов:
Напротив файла отобразится дата последней загрузки.
Проиндексированные страницы появятся в результатах поиска в течение двух недель
Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.
Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.
Напротив файла отобразится дата последней загрузки.
Проиндексированные страницы появятся в результатах поиска в течение двух недель
Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.
Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.
Обновить Sitemap
Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова — робот регулярно проверяет файл на обновления и ошибки.
Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap, можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.
Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.
Удалить Sitemap
Вопросы и ответы
Как правило, в Sitemap принято включать все значимые страницы сайта. Если на сайте множество страниц, вы можете удалить из Sitemap уже известные Яндексу страницы и вносить в файл только новые или часто обновляющиеся.
Если вы используете файл индекса Sitemap отметьте тегом lastmod файлы Sitemap , которые часто обновляются.
Определить, какие страницы сайта уже известны Яндексу, можно в Вебмастере на странице Индексирование → Статистика обхода .
Sitemap отображается в сервисе как исключенная страница со статусом «Неверный формат документа»Отображение файла Sitemap и других XML-файлов как исключенных страниц носит только информативный характер и никак не влияет на индексирование сайта или обработку Sitemap .
Файл Sitemap может отображаться в группе исключенных страниц, так как робот попытался проиндексировать его как обычную страницу. Не смотря на это файлы Sitemap не участвуют в поиске.
При обработке Sitemap возникла ошибка «Неизвестный тег»Файл Sitemap может содержать только определенные XML-элементы. Если Вебмастер обнаружит в файле другие элементы, например, указание на мобильную версию, в Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые элементы игнорируются роботом при обработке Sitemap , при этом данные из поддерживаемых элементов учитываются. Поэтому менять файл Sitemap необязательно.
Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Вебмастере.
Файл Sitemap находится в статусе «Не проиндексирован»Файл Sitemap может быть не проиндексирован по нескольким причинам:
Робот обошел файл Sitemap недавно и еще не успел обработать его. Подождите две недели. Если вы используете файл индекса Sitemap с несколькими файлами, то их обработка может занять больше времени, чем одного файла Sitemap . Сайт ранее был недоступен для индексирующего робота. Необходимо дождаться следующего посещения сайта роботом.Если проблема с доступом актуальна, обратитесь к администратору сайта или сервера, на котором он расположен. Если файл составлен корректно, он будет повторно обработан в течение двух недель с момента последнего запроса роботом. Проверить файл можно с помощью инструмента Анализ файлов Sitemap.
Файл Sitemap находится в статусе «Документ не содержит текст»Такой статус отображается в инструменте Проверка ответа сервера и сообщает, что робот не может проиндексировать файл как обычную страницу сайта и включить его содержимое в результаты поиска. На обработку Sitemap этот статус не влияет. Чтобы проверить корректность Sitemap используйте в Вебмастере инструмент Анализ файлов Sitemap.
Файл Sitemap находится в статусе «URL запрещён к индексированию тегом noindex»Как правило, файл Sitemap обрабатывается роботом в течение двух недель после добавления его в Вебмастер. Если этого не произошло, проверьте:
В Google поддерживается несколько форматов файлов Sitemap.
Во всех форматах следует использовать стандартный протокол. В настоящее время Google не учитывает в файлах Sitemap атрибут <priority> .
Вот пример простого XML-файла Sitemap с одним URL:
RSS, mRSS и Atom 1.0
Текст
Правила создания текстовых файлов Sitemap
- Необходимо использовать кодировку UTF-8.
- В файл Sitemap можно добавлять только URL.
- Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).
Файлы Sitemap с расширенным синтаксисом
Google поддерживает расширенный синтаксис файлов Sitemap для перечисленных ниже MIME-типов. С помощью дополнительных элементов можно описывать видео, изображения и другой плохо поддающийся анализу контент, чтобы они лучше индексировались.
Общие рекомендации в отношении файлов Sitemap
Кроме того, все URL (включая адрес вашего файла Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это выполняется автоматически, если для создания URL вы применяете какой-либо скрипт, инструмент или файл журнала, то есть не вводите адреса вручную. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.
Ниже приведен пример URL, где есть символ, не относящийся к кодировке ASCII ( ü ), а также символ, который требует экранирования ( & ):
Этот же URL в кодировке ISO-8859-1 (для размещения на сервере, использующем ее) и с экранированием:
Этот же URL в кодировке UTF-8 (для размещения на сервере, использующем ее) и с экранированием:
Этот же URL, содержащий маскирование:
Как создать файл Sitemap
Создавая файл Sitemap, вы сообщаете поисковым системам, какие из ваших URL следует выбирать для показа в результатах поиска. Такие URL называются каноническими. Если вы разместили одинаковый контент по нескольким URL, выберите основной вариант страницы и включите в файл Sitemap только его.
Выбрав URL, которые следует добавить в файл Sitemap, создайте его одним из перечисленных ниже способов. Оптимальный вариант будет зависеть от архитектуры и размеров сайта.
- Файл Sitemap можно сгенерировать с помощью системы управления контентом.
- Если в файле несколько десятков URL или меньше, попробуйте создать его вручную.
- Если ожидается, что файл Sitemap будет очень велик, создавайте его автоматически.
Как создать файл Sitemap с помощью системы управления контентом
Если вы работаете с системой управления контентом, такой как WordPress, Wix или Blogger, то возможно, что она уже сгенерировала файл Sitemap, доступный поисковым системам. Попробуйте найти сведения о том, как ваша система управления контентом создает файлы Sitemap, или о том, как подготовить такой файл, если она не сделала этого автоматически. Например, если вы работаете с Wix, введите в Google Поиске запрос "wix sitemap".
В остальных случаях вам потребуется создать файл Sitemap самостоятельно.
Как создать файл Sitemap вручную
Если вы планируете добавить в файл Sitemap не более чем несколько десятков URL, его можно будет создать вручную. Для этого откройте текстовый редактор, такой как Блокнот (Windows) или nano (Linux, macOS), и начните вносить в новый файл данные в соответствии с синтаксисом, который описан в разделе Форматы файлов Sitemap выше.
Вручную можно создавать и крупные файлы Sitemaps, но это очень трудоемкий процесс.
Как создать файл Sitemap автоматически
Если вам нужно включить в файл Sitemap множество URL, то удобнее будет создавать его автоматически. Сгенерировать файл Sitemap можно с помощью различных инструментов, но лучше всего воспользоваться для этого средствами вашего сайта. Например, вы можете извлечь URL, относящиеся к сайту, из его базы данных и экспортировать эти адреса на экран или в файл на вашем веб-сервере. При необходимости обратитесь к разработчикам или менеджеру сервера. Ознакомьтесь с нашей подборкой сторонних генераторов файлов Sitemap: вы можете создать на их основе аналогичный инструмент.
Как сделать файл Sitemap доступным для Google
Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был обработан повторно, сообщите нам, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько раз одинаковые файлы Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не новый.
Если вы обновляли страницы, включенные в такой файл, отметьте их с помощью поля <lastmod> . В XML-файлах других типов есть аналогичные поля (например, в Atom XML это поле <updated> ). Подробнее о том, как определить нужную дату…
Предоставить Google доступ к файлу Sitemap можно несколькими способами:
- Отправьте файл через интерфейс специального отчета.
- Выполните запрос ping. В браузере или командной строке отправьте запрос GET на приведенный ниже адрес, указав полный URL файла Sitemap и убедившись, что этот файл доступен:
Устранение неполадок, возникающих при обработке файлов Sitemap
Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.
Читайте также: