Как добавить свой файл robots.txt в Blogger(Blogspot)

30 марта 2012

Как добавить свой файл robots.txt в Blogger(Blogspot)

Продолжая поисковую оптимизацию блога, нельзя упускать из вида такую возможность Blogger, как добавление своего файла robots.txt. С его помощью можно точно указать поисковым роботам правила для индексирования блога и при желании, установить разные параметры для различных поисковых систем.
Добавить собственный файл robots в Blogger-блог не составит труда, все делается через панель инструментов. Главная задача состоит в его правильно составлении.
Чтобы воспользоваться данной настройкой, необходимо в админ-панели своего блога зайти на вкладку "Настройки", перейти в "Настройки поиска" где в разделе "Поисковые роботы и индексация" будет пункт "Пользовательский файл robots.txt":

Кликнув на "Изменить" выбираем "Да" и в появившиеся окошко добавляем текст своего заранее подготовленного файла для роботов или пишем его прямо тут.

Но основной вопрос остается в том, как же правильно составить собственный пользовательский файл robots. Как это делается можно найти и прочесть в разделе "Помощь" любой вебмастерской поисковиков, где вы уже наверное зарегистрированы, а если нет, то советую вам это сделать. Хорошо изложено здесь. Однако, вкратце опишу структуру. По умолчанию у Blogger такой robots.txt

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /

Поисковые роботы индексируют сайты по принципу - все что не запрещено, то - разрешено. По-этому существует два принципа записей:
1. Запретить все и указать разрешения только для выбранных страниц;
2. Запретить выбранные директории.
Что каждый решает сам. Я сильно не усердствовал просто убрал мета-теги, добавленные ранее.
И еще, можно указать для каждого поисковика свои параметры индексирования через 'User-agent:' например для Яndex - 'User-agent: Yandex' , а для Mail.ru - 'User-agent: Mail.Ru ' , думаю что это гораздо удобнее чем пользоваться мета-тегами.

А вот вариант данного файла, который используется в этом блоге:

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Disallow: /*archive
Allow: /

User-agent: Yandex
Disallow: /search
Disallow: /*archive
Allow: /

User-agent: Mail.Ru
Disallow: /search
Disallow: /*archive
Allow: /

Sitemap: http://www.magentawave.com/feeds/posts/default?orderby=updated

Может кому приглянется и пригодится.

Так что теперь можно колдовать и настраивать нужную индексацию своего блога, в любое время, не испытывая ни каких трудностей.

25 комментариев:

Unknown16.10.2012, 14:21
Спасибо большое, я несколько дней искала в коде HTML файл robots.txt, а оказалось все очень просто)
ОтветитьУдалить
Ответы
Unknown19.10.2012, 09:48
А у меня ещё возник один вопрос: я все исправила, как сказано выше, проверила сегодня, а изменения не сохранились(((( Это может быть связанно стем, что когда-то я вручную в код HTML вставляла файл robots.txt?
ОтветитьУдалить
Ответы
Unknown07.11.2012, 08:16
Добрый день, может быть вы сможете, мне помочь, при проверке роботекс в яндексе он пишет:"Файл robots.txt не будет учтён роботом Яндекса, т.к. при запросе выполняется перенаправление."
роботекс выглядет так
User-agent: Mediapartners-Google
Disallow:

User-agent: Yandex
Disallow:

User-agent: Mail.ru
Disallow:

Главным зеркалом я выбрала сайт без www, но это уже было после того, как яндекс выдал сообщение о перенаправлении, пробовала вставить host, но блоггер пишет, что форматирование некорректно, что мне делать?)
ОтветитьУдалить
Ответы
Unknown07.11.2012, 10:56
Спасибо за ответ, а я могу это как-то исправить, самостоятельно?
ОтветитьУдалить
Ответы
Medet28.11.2012, 11:46
добрый день!
я создал вот такой блогосайт salken.ru
создал статические страницы на боковой панели.
они в фид АТОМ не попадают.
соответвенно столкнулься со след. проблемой:
яндекс не видит статические страницы. чтобы увидел ему нужен сайтэп. в блоггере как мне стало известно вместо сайтмэп используется фид атом.
скажите вы знаете как и куда выложить сайтмэп сделанный мной ?
ОтветитьУдалить
Ответы
Unknown17.01.2013, 12:02
Здравствуйте,у меня есть блог на Blogger,я добавил в Пользовательский файл robots.txt

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Disallow: /*archive
Allow: /

User-agent: Yandex
Disallow: /search
Disallow: /*archive
Allow: /

User-agent: Mail.Ru
Disallow: /search
Disallow: /*archive
Allow: /

Sitemap: http://online-zarobotok.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500

это правильно?
и мне не нужно ничего больше делать? или в яндекс нужно еще и проверять robots.txt ? просто когда я ввожу то что я написал выше,то что у меня стоит в блоге robots.txt,то в яндексе пишет "строка 9-12 и 19-19 что это может быть? это значит что что то не так?
ОтветитьУдалить
Ответы
Unknown17.01.2013, 12:24
дошло до меня наверное :)

ой я не помню сидел дня 2 менял эти штуки:) где то в гугле мне эту сылку дали:)
ОтветитьУдалить
Ответы
relaxmusicpalaid01.03.2013, 01:10
Спасибо огромное за информацию. Очень пригодилась. Долго правда искал как создать свой Sitemap и куда его потом вставлять, но все таки разобрался.
Вот кстати ссылка на сайт где автоматически создается файл Sitemap и перебрасывается на сайт: http://ctrlq.org/blogger/
ОтветитьУдалить
Ответы
Que07.04.2013, 20:36
добрый день, что-то я не поняла с robots.txt, у меня стандартный, но при этом в поиске яндекса (смотрю в вебмастер.яндекс.ру) находятся только три (!) страницы - это главная (т.е. лалала.блогспот.ру) и две ссылки на два поста, по какому принципу выдернутые роботом, не знаю.
нормально ли это? мне кажется, это какая-то кривая индексация. хотелось бы побольше страниц в поиске. (в результате очень плохо представлена в яндексе по низкочастотным запросам, хотя контекст качественный, оптимизированный, перелинковка и т.п.) в гугле же наоборот хорошо представлена
ОтветитьУдалить
Ответы
Evgeniia Dolinenko19.03.2015, 19:05
Спасибо за информацию. Везде рекомендации только о закрытии search, а про архив что-то все умалчивают.

У меня в robots были крыты search, а archive по глупости индексировался. Только сейчас разобралась благодаря вам.
ОтветитьУдалить
Ответы
Александр Самсонычев27.11.2015, 06:08
Спасибо, очень интересно и полезно. Попробую применить Ваш шаблон.
ОтветитьУдалить
Ответы
Unknown27.03.2016, 17:05
User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /
У меня стоял такой файл страницы кроме главной не шли в индекс. Удалив запись /search пошли страницы в индекс. Как вообще удалить роботс файл? я его на блоге удаляю а в search concole он все равно прописан.
ОтветитьУдалить
Ответы
Unknown27.03.2016, 17:18
User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /
Извините конечно но этот файл запрещяет индекст вот скриншот примера что индекс запрещён http://prnt.sc/ako2yd
ОтветитьУдалить
Ответы
Unknown15.07.2017, 23:39
Здравствуйте! Не подскажете почему робот яндекса не видит файл? Пишет » Сервер отвечает редиректом на запрос /robots.txt «
ОтветитьУдалить
Ответы

Добавить комментарий

MagentaWAVE

Как добавить свой файл robots.txt в Blogger(Blogspot)

25 комментариев:

BestProject