Все посты
Обновлено 9999+ 4 Знания

Краулинговый бюджет сайта: как улучшить сканирование и индексацию страниц

Разбираем, как поисковик обходит сайт, что влияет на сканирование и индексацию страниц и как увеличить краулинговый бюджет без рискованных приемов. Материал обновлен 15.06.26.

Краткое саммари

Краулинговый бюджет — это способ оценить, хватает ли роботам ресурсов и интереса обходить важные URL. Он особенно важен для интернет-магазинов, маркетплейсов, медиа, каталогов и сайтов с миллионами фильтров, дублей, редиректов и JS-страниц.

Кому стоит прочитать эту статью: 

SEO-специалистам, владельцам крупных сайтов, разработчикам, редакторам медиа и ecommerce-командам, у которых новые страницы долго не попадают в поиск или в индексе много лишних URL.

Как поисковик обходит сайт: что такое краулинговый и рендеринговый бюджет

Страница появится в поиске, будет ранжироваться по ключевым словам и получать трафик, если поисковый бот ее найдет и проиндексирует.

Процесс немного различается для статических HTML-страниц и динамических страниц с JavaScript.

Статические страницы

Боты, которые ищут и обрабатывают страницы, называются краулеры, процесс обработки — краулинг.

  1. Поисковый бот формирует список URL сайта: находит их по внутренним и внешним ссылкам, sitemap.xml, ранее известным адресам и сигналам из сервисов для вебмастеров.

  2. Сверяется с разрешениями на обход в файле robots.txt. В этом файле не строгие правила, а рекомендации, так что закрыть страницу от бота через запрет в robots.txt не получится. Если на страницу есть ссылки и редиректы, бот может решить, что она все-таки важна, и включить ее в свой список.

  3. Дальше он сортирует ссылки по приоритетности и начинает сканировать. На приоритет влияют внутренняя перелинковка, качество контента, частота обновлений, скорость ответа сервера, статус страницы и другие сигналы.

У поисковых систем нет технических возможностей одинаково часто обрабатывать все страницы всех сайтов. Поэтому для краулинга есть лимиты. Краулинговый бюджет сайта складывается из двух частей: сколько запросов сервер выдерживает без проблем и насколько поисковику интересны URL сайта — то есть как часто их стоит переобходить.

Если количество важных и регулярно обновляемых страниц больше бюджета сканирования сайта, часть URL будет попадать в индекс медленно или не попадет туда совсем.

Динамические JS-страницы

Краулеры сканируют и индексируют контент статической HTML-страницы. Если страница динамическая, с визуализацией и JS-фреймворками, то процесс в целом такой же, но нужен еще промежуточный этап. После сканирования бот должен сначала отрисовать контент, закодированный через JavaScript, а уже потом отправить его в индекс. Этот этап называется рендеринг.

Googlebot обрабатывает JavaScript на актуальной версии Chromium. Яндекс тоже умеет работать с JS-страницами, но поисковикам проще и быстрее обрабатывать контент, который доступен в HTML сразу. Количество страниц и ресурсов, которые бот может отрисовать, называют рендеринговым бюджетом.

Получается, рендеринг — добавочный этап в обработке страницы, который требует ресурсов. Если страницу приходится долго отрисовывать из-за асинхронности и сложности JavaScript, индексирование займет больше времени.

Подробнее про обработку страниц на JavaScript Google рассказал в Центре поиска. Если страница или ее часть не отображаются в выдаче, причиной могут быть проблемы с кодом JavaScript, закрытые ресурсы, ошибки гидратации или слишком поздняя загрузка важного контента.

Скорость сканирования не относится к факторам ранжирования и сама по себе никак не влияет на позиции. Но важна для работы сайта — если бот не сможет просканировать новые страницы, они долго не появятся в выдаче и пользователи их не увидят. Разберемся, что делать, чтобы боты успевали сканировать все нужные страницы.

FAQ по разделу

Что такое краулинговый бюджет?

Это объем URL, который поисковый робот готов и может обойти на сайте за определенный период.

Краулинговый бюджет влияет на позиции?

Нет, но если важные страницы не сканируются и не индексируются, они не смогут получать поисковый трафик.

Нужно ли беспокоиться о рендеринговом бюджете?

Если ваш сайт активно использует JavaScript и важный контент появляется только после отрисовки в браузере, беспокоиться стоит.

Кому важен краулинговый бюджет

На небольших проектах количество страниц, которым нужно сканирование, обычно меньше, чем лимит краулера. Так что владельцам маленьких сайтов о краулинговом бюджете можно не беспокоиться.

Если новые страницы месяцами не могут попасть в выдачу, стоит заняться оптимизацией: помочь боту не тратить краулинговый бюджет зря и находить страницы, которые вам нужны. 

В августе 2022 года сотрудники Google в подкасте Search Off the Record подчеркнули, что более 90% сайтов не должны беспокоиться о краулинговом бюджете. Однако для крупных сайтов с большим количеством страниц важно оптимизировать структуру и контент, чтобы обеспечить эффективное сканирование и индексацию.

Осталось понять, достаточно ли большой у вас проект, чтобы нужно было беспокоиться о лимитах краулера. Оптимизаторы называют разные цифры по объему страниц. Проблемы могут начаться и на 10 тысячах страниц, если структура хаотичная, а сайт генерирует много дублей. И наоборот, проект на 100 тысяч URL может индексироваться нормально, если у него чистая архитектура и быстрый сервер. Проще проверить по данным вебмастеров и логам.

Как определить, что у вас проблемы с краулинговым бюджетом:

  1. Найти, сколько страниц теоретически должно быть в индексе. Это страницы без тега noindex (актуален для Яндекса) и нет запрета в robots.txt.

  2. Соотнести количество проиндексированных страниц с тем, что теоретически должно быть в индексе. Эти данные можно посмотреть в консоли Google и Яндекс.Вебмастере.

  3. Если страниц, которые теоретически должны быть в индексе, во много раз больше, то есть проблемы.

FAQ по разделу

Нужен ли краулинговый бюджет маленькому сайту?

Скорее нет, если на сайте только десятки или сотни качественных страниц, поисковики успевают их обходить.

В каких случаях нужно проверять бюджет сканирования?

Еслиновые URL неделями не попадают в индекс, бот часто ходит по дублям или в логах много 3xx, 4xx, 5xx и параметрических страниц.

Есть ли точный порог по числу страниц?

Его нет, поэтому ориентируйтесь не на размер сайта, а на разрыв между нужными страницами и фактически проиндексированными URL.

Как посмотреть сканирование сайта поисковыми роботами

Динамика сайта

Динамику по обеим поисковым системам можно смотреть в сервисе Анализ сайта:

Сервис для просмотра индексации сайта
Индексация в Анализе сайта

В Яндекс.Вебмастере в разделе «Статистика обхода» можно посмотреть, какие страницы сайта обходит робот, а какие он не смог загрузить.

Работа краулера в Яндекс.Вебмастере
Статистика обхода в Яндекс.Вебмастере

В Google Search Console на вкладке Статистика сканирования можно увидеть общую картину — количество запросов робота, объем скачанных данных, среднее время ответа сервера, распределение по кодам ответа и типам файлов.

Сканирование страниц поисковым роботом в консоли
Запросы на сканирование страниц

Проблемы с индексацией могут повлечь и проблемы с ранжированием, а значит и с трафиком. Если вы заметили падение трафика, то проверьте данные отчета «Покрытие» в консоли Google. Нужно сравнить динамику изменения ранжирования и динамику на всех четырех вкладках отчета.

Сканирование страниц в Google Search Console
Отчет «Покрытие»

Особенно важны причины исключения из индекса: страницы с редиректом, дубли без выбранного пользователем канонического URL, страницы с тегом noindex, просканированные, но пока не проиндексированные URL, soft 404 и ошибки сервера.

Список некачественных страниц сайта
Список исключенных страниц

Проверка конкретной страницы

Быстро узнать, в индексе ли страница сайта, можно с помощью онлайн-инструмента. В нем можно проверить URL любого сайта, даже чужого. Проверить можно в Google и Яндекс.

Проверка индексации страниц
Пример работы инструмента

Узнать, на какой стадии конкретная страница, можно через Инструмент проверки URL. Он отобразит текущий статус индексирования страницы и даст знать, если что-то мешает обработке.

Проверить URL в инструменте Google
Проверка URL

Инструмент проверяет последнюю проиндексированную версию страницы. Если после последнего сканирования страницу изменили или удалили, он это не отобразит. Кликните на «Проверить страницу на сайте», чтобы получить данные о текущей версии страницы.

Есть еще момент: инструмент не учитывает санкции поисковика и временную блокировку URL. Так что даже если вы видите в результатах проверки «URL есть в индексе Google», страницы может не быть в выдаче. Проверить, есть ли она там, очень просто — нужно загуглить ее URL.

Как проверить наличие URL в индексе
URL есть в выдаче Google

Посмотреть на страницу глазами поискового бота можно с помощью этого бесплатного инструмента. Он покажет Header ответ, код, который видит бот, а также соберет в список внутренние и внешние ссылки и укажет, какие из них индексируются.

Посмотреть на страницу глазами поискового бота
Фрагмент результатов работы инструмента

Серверные логи

Проверить краулинговый бюджет можно в серверных логах, там можно проследить за тем, какие страницы посещает краулер, увидеть маршруты и расписание обходов сайта. Новичку может быть сложно, но можно разобраться.

Искать логи нужно в файле access.log в системной папке сервера или через панель управления хостинга, но не все типы хостинга это позволяют.

Если вы смотрите на поведение бота Google, вам нужен GoogleBot, но не все, что так называется, действительно относится к ботам поисковика — Как убедиться, что сайт сканируется роботом Googlebot.

Анализировать данные лучше за большой промежуток, не менее месяца. Так получится выявить общие принципы: как часто появляется бот, смотрит ли он Карту сайта, какие URL обходит часто, а какие игнорирует, какие возникают ошибки. Игнорируемый раздел можно усилить внутренними и внешними ссылками.

Регулярно анализировать логи стоит владельцам сайтов, у которых больше 100 тыс страниц, поскольку за ними сложно уследить.

Ориентироваться на больших массивах данных удобнее через программы. Для анализа логов есть программы: LogViewer, Screaming Frog Log Analyzer, JetOctopus, Loggly, GoAccess и другие.

Материал по теме:
Анализируем лог-файл веб-сервера для выявления SEO-проблем

FAQ по разделу

Где посмотреть сканирование сайта в Яндексе?

В Яндекс.Вебмастере. Найдите разделы про статистику обхода, страницы в поиске, исключенные URL и ошибки загрузки.

Где посмотреть сканирование в Google?

В Google Search Console. Пригодятся отчеты «Статистика сканирования», «Индексирование страниц» и инструмент проверки URL.

Зачем нужны серверные логи?

Они показывают реальные визиты роботов, какие URL обходят часто, где бот получает ошибки и на что уходит бюджет сканирования.

Эффективные способы оптимизировать краулинговый бюджет сайта

Увеличить лимит на сканирование можно только двумя способами:

  • выделить дополнительные ресурсы сервера для сканирования: ускорить сервер, снизить число ошибок 5xx, убрать тяжелые ответы и лишние редиректы;

  • повысить ценность контента для пользователей: сделать важные страницы полезными, уникальными, свежими и хорошо связанными внутренними ссылками.

Разберем, как веб-мастеру работать со вторым.

Ускорить загрузку страниц

Долгая загрузка сайта отнимает время поискового бота. Увеличить скорость сканирования нельзя без ускорения сайта.

Проверить скорость загрузки можно в сервисе Анализ сайта. Он проверяет загрузку онлайн в соответствии параметру Core Web Vitals. Если со скоростью будут проблемы, сервис их покажет и посоветует, что делать:

Скорость загрузки онлайн
Фрагмент проверки скорости загрузки страницы
Проверить скорость сайта

Способов ускорения загрузки много, советуем посмотреть подборку материалов, в которой мы подробно разобрали самые эффективные.

Настроить Sitemap.xml

Обработать Карту сайта: очистить ее от дублей и ненужных ссылок с редиректами. В Карте должны быть только URL качественных страниц, которые нужны в индексе. Служебные там ни к чему.

Как составить файл Sitemap.xml правильно

Обработать robots.txt

Хоть это файл не с правилами, а рекомендациями для поисковых ботов, все равно он может повлиять на решение о сканировании.

Проверьте, что файл не закрывает важные разделы и не открывает для обхода бесконечные фильтры, сортировки, результаты поиска по сайту и служебные URL. Чтобы роботы не скачивали неизменившиеся страницы заново, настройте на сервере заголовки Last-Modified и ETag, корректные ответы 304 Not Modified и актуальное поле lastmod в sitemap.xml.

Избавиться от редиректов

Очищайте длинные цепочки редиректов — это вредно и для пользователей, и для роботов-краулеров. Для пользователей увеличивается время загрузки итоговой страницы, приходится дольше ждать. Краулеры расходуют лимиты на редиректах, а если цепочка переадресаций затягивается, краулер может «потерять след» и не дойти до конечной страницы.

Разобраться с дублями контента

От дублей нужно избавиться, они в принципе бесполезны как пользователям, так и ботам. Поисковики не любят дублирующийся контент, роботы реже сканируют повторяющиеся страницы.

Выявить такие страницы поможет технический аудит. Проанализируйте совпадения и либо удалите более слабые страницы с повторениями, либо настройте редирект, если удалить не получится.

Удалить или заменить битые ссылки

Битые ссылки, по которым страницы отдают код ответа 404, по словам Джона Мюллера из Google, не тратят краулинговый бюджет. Поисковый бот их обходит, но только для того, чтобы убедиться, что они не доступны — не в ущерб остальным страницам. Вредны страницы с ошибкой 404 SOFT — она возникает, когда при попытке попасть в удаленный документ сервер должен отвечать кодом 404 или 410, но вместо этого отдает код 200 ОК. 

Настроить внутреннюю перелинковку

Бот назначает ссылкам приоритетность в сканировании в том числе по отдаленности страницы от главной. Чем меньше кликов нужно, чтобы перейти с главной до искомой страницы, тем она важнее. Поэтому важные для работы пользователей страницы располагайте ближе к главной.

Выстроить архитектуру сайта поможет материал 15 советов по seo-архитектуре сайта

Бот переходит по ссылкам на страницах и таким образом находит другие страницы,которые нужно просканировать. Кстати, это не позволяет запретить сканирование страницы в robots — если бот найдет ее по внутренним ссылкам, то может решить, что она важна, и добавить в свой список для сканирования.

Без внутренних ссылок на страницу боту будет проблематично на нее попасть, поэтому важно перелинковывать новые страницы с существующими.

Направление ссылочного веса по внутренним ссылкам подробно разобрали в статье Эффективная перелинковка: как работать с внутренними ссылками

Наращивать внешние ссылки

Также в определении приоритета страницы важен ее авторитет: чем больше качественных ссылок с релевантных площадок на нее ведет, тем она кажется важнее. Поэтому важные страницы нужно подпитывать ссылками с подходящих по теме площадок.

Без покупки обратных ссылок сложно обойтись, но есть и бесплатные способы, как можно их получить.
Проблемы с индексацией и советы о том, как ее ускорить, мы собрали в этом материале.

FAQ по разделу

Что быстрее всего помогает сэкономить краулинговый бюджет?

Удаление дублей, мусорных параметров, длинных редиректов, soft 404. И еще закрытие от обхода технических разделов.

Можно ли просто увеличить лимит в поисковике?

Нет, лучше и надежнее ускорить сервер, улучшить структуру сайта и повысить ценность страниц.

Что важнее, sitemap.xml или внутренняя перелинковка?

Нельзя сказать однозначно. Sitemap помогает найти URL, а ссылки показывают их место в структуре сайта.

Как оптимизировать рендеринговый бюджет

Если вы используете динамические страницы, то нужно позаботиться о том, чтобы поисковым ботам было легко взаимодействовать и с ними. К индексированию добавляется рендеринг — «вторая волна индексирования», которая увеличивает время обработки страниц.

Рассмотрим, что можно внедрить, чтобы оптимизировать этот процесс.

Большую часть контента не визуализировать

JS-решения нужны не для всего контента, не усердствуйте с визуализацией, чтобы не перегружать страницы и дать роботу возможность понять большую часть смысла страницы при первом сканировании, до рендеринга.

Сократить JS

В коде часто бывает мусор: ненужные фрагменты, неиспользуемые библиотеки, разрывы и разделители. Можно уменьшить размер кода, то есть минифицировать JavaScript. Для минификации есть много бесплатных онлайн инструментов, ссылки и больше теории есть в статье.

Ускорить загрузку страницы

Нужно ускорить отображение контента, чтобы страница быстрее загружалась. Есть много возможностей, например, кэширование на длительный срок. Подойдет страницам, содержание которых нечасто изменяется.

Настройку кэширования и другие способы ускорить загрузку разобрали в этой же статье.

Применить динамическое отображение контента

Не все боты поисковиков могут обрабатывать JavaScript, и не все делают это быстро и качественно. Поэтому надежнее отдавать важный контент и внутренние ссылки в HTML сразу через серверный рендеринг (SSR), статическую генерацию (SSG), предварительный рендеринг или гибридный подход. Пользовательский JavaScript при этом может отвечать за интерфейс, фильтры и интерактивные элементы, но не должен быть единственным способом показать основной текст, товары, цены и ссылки.

FAQ по разделу

Как понять, что JS мешает индексации?

Сравните HTML до рендера и после, проверьте страницу инструментами Google Search Console, Яндекс.Вебмастера и симулятором поискового бота.

Что лучше для SEO, SPA или серверный рендеринг?

Для важных страниц лучше SSR, SSG или гибридный подход, при котором основной контент и ссылки доступны без ожидания сложного JS.

Мифы о краулинговом бюджете

В декабре 2022 года Google обновил руководство по управлению лимитом на сканирование, опровергнув два мифа:

  • Миф 1: «Я могу использовать noindex, чтобы контролировать краулинговый бюджет».
  • Миф 2: «Страницы с кодом статуса 4xx впустую тратят краулинговый бюджет».

Google пояснил, что директива noindex используется для предотвращения индексации страниц, а страницы с кодом статуса 4xx не индексируются и не расходуют краулинговый бюджет.

Кстати, в том же году в подкасте Search Off the Record сотрудники Google отметили, что термин «краулинговый бюджет» был придуман сообществом SEO-специалистов. В самой компании Google «не было ничего, что могло бы означать краулинговый бюджет сам по себе».


Беспокоиться о лимитах для краулеров нужно владельцам больших сайтов, если страницы долго не появляются в индексе. Проблемы с индексированием можно решить, для этого подойдут описанные в материале способы.

Расскажите в комментариях, какие способы мы зря не упомянули в статье? Что работает лучше всего по вашему опыту?

Возьмите под контроль продвижение своего сайта
Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.
🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.

Теги поста или какие разделы почитать еще:

Комментарии (4)
Ирина Корина   23.01.2021 10:37
Пользуясь этими знаниями, можно реально сдвинуть рейтинг сайта и переместить его без особых усилий на позиции в поиске браузера повыше. Или объяснить, почему сайт так трудно найти в поисковике.
Alex-Zotov   26.01.2021 11:25
Подскажите, как можно ускорить процесс обхождения страниц поисковыми ботами. У меня иногда сразу страница индексируется, а иногда приходится ждать неделю.
Elena_Zhmurina   26.01.2021 14:19
Эта статья должна помочь - https://pr-cy.ru/news/p/8190
Alison Hale   17.02.2021 06:50
Order Indian Takeaway food from restaurants nearby in Croydon, CR0. Place your order online to get food delivered at your door or for takeout.call call on 02036678566 also order online
https://www.adeenaskitchen.co.uk
К данной записи нельзя добавлять комментарии, т.к. она очень старая.
Robots.txt: полное руководство по управлению индексацией сайта
Где размещать рекламу в интернете: топ-10 площадок для продвижения в 2026 году
Метатеги сайта: полный гайд по Title, Description, Canonical, Robots и другим тегам
SEO-продвижение сайта на WordPress в 2026 году: пошаговый гайд с настройкой и чек-листом
Сезонность спроса и трафика: как анализировать в SEO
Почему падает трафик на сайте: причины и способы увеличить посещаемость