Рейтинг Рунета
2020
2020
Представьте: ваш интернет-магазин имеет 500 товаров, но поисковый робот видит 50 000 страниц. Откуда? Из фильтров, сортировок и тегов, которые генерируют тысячи URL с почти одинаковым содержимым. Результат — поисковик тратит ресурсы на сканирование «мусора», а действительно важные страницы теряют позиции.

Страницы тегов и страницы фильтров — мощный инструмент для пользователей и для SEO. Но только если они правильно настроены. При неправильной реализации возникают дубли страниц, раздувается индекс, а краулинговый бюджет (количество страниц, которое робот готов просканировать за визит) сжигается впустую.
Эта статья — пошаговое руководство по оптимизации интернет-магазина с точки зрения управления индексацией фильтров и тегов. Внутри: конкретные примеры кода, сравнительные таблицы методов, специфика Яндекса и Google, а также чек-лист для самопроверки. Материал будет полезен владельцам магазинов, SEO-специалистам среднего уровня и разработчикам, которые реализуют техническую часть.
Прежде чем бороться с мусорной индексацией, нужно понять, откуда берутся лишние URL и почему поисковики воспринимают их как проблему.

Страницы фильтров появляются, когда пользователь выбирает параметры в фасетной навигации — бренд, цвет, размер, ценовой диапазон. Каждая комбинация фильтров генерирует уникальный URL с GET-параметрами.
Примеры типичных URL:
Проблема в математике: если у вас 5 брендов, 8 цветов, 4 ценовых диапазона и 3 варианта сортировки — это уже 5×8×4×3 = 480 комбинаций URL только для одной категории. Добавьте пагинацию, и число вырастет в разы.

Страницы тегов — это статические подборки товаров, объединённых по определённому признаку. В отличие от фильтров, теги создаются вручную или полуавтоматически и имеют чистые URL:
Когда теги полезны для SEO: если под тег есть поисковый спрос (например, «недорогие смартфоны Samsung»), страница получает уникальный title, описание и текст. Когда теги вредят: если создаются бездумно, без привязки к семантике — десятки пустых подборок засоряют индекс точно так же, как и фильтры.

Дубли страниц в контексте фильтров — это URL с разным адресом, но практически идентичным контентом. Для поискового робота /catalog/?color=black&brand=samsung и /catalog/?brand=samsung&color=black — две разные страницы с одинаковым содержимым.
Реальные последствия:
По данным Google Search Central, для крупных сайтов с более чем 10 000 страниц управление краулинговым бюджетом становится критически важным фактором.

Любая оптимизация начинается с диагностики. Нельзя чинить то, что не измерено.
Откройте Google Search Console → раздел «Страницы» (бывший «Покрытие»). Обратите внимание на:
В Яндекс Вебмастере проверьте раздел «Индексирование» → «Страницы в поиске». Яндекс также показывает исключённые страницы и причины исключения.
Совет: используйте оператор site:вашдомен.ru inurl:? в поисковой строке Google, чтобы увидеть проиндексированные URL с GET-параметрами.

Логи сервера — самый точный источник данных о поведении поисковых роботов. Вы увидите, какие URL сканируются чаще всего. Если 80% запросов Googlebot приходится на параметрические адреса фильтров — бюджет расходуется неэффективно.
Для анализа логов подойдут Screaming Frog Log File Analyser или бесплатный GoAccess.

Три проверенных инструмента:
Запустите полный краул с включёнными параметрами — так вы увидите реальный масштаб проблемы.

Это ключевой раздел. Здесь — конкретные методы решения проблемы с пояснением, когда какой применять.
Не все фильтры — мусор. Некоторые страницы фильтров имеют реальный поисковый спрос и приносят трафик. Критерии отбора:
Практический подход: открывайте для индексации фильтры первого уровня (бренд, тип товара) и закрывайте комбинации второго уровня и глубже (бренд + цвет + цена + сортировка).
Файл robots.txt — первый рубеж обороны. Он сообщает роботам, какие разделы сканировать не нужно.
Настройка robots.txt подразумевает добавление правил Disallow для параметрических URL:
Пример настройки robots.txt для интернет-магазина

Важно: директива Clean-param — специфика Яндекса. Она сообщает роботу, что указанные параметры не влияют на контент страницы. Google эту директиву не поддерживает.
Ограничения robots.txt: этот метод не гарантирует удаление из индекса. Если на мусорную страницу ведут внешние ссылки, поисковик может её проиндексировать, проигнорировав запрет. Robots.txt блокирует сканирование, но не индексацию.
Канонические страницы (тег rel=canonical) указывают поисковику, какую версию URL считать основной. Это главный инструмент борьбы с дублями.
Когда использовать canonical:
Пример в HTML:
Типичные ошибки при настройке canonical:

Мета-тег <meta name="robots" content="noindex, follow"> запрещает индексацию конкретной страницы, но разрешает роботу переходить по ссылкам на ней.
Отличие от robots.txt: noindex работает на уровне страницы и гарантирует удаление из индекса, тогда как robots.txt блокирует лишь сканирование. Отличие от canonical: canonical перенаправляет вес на основную страницу, а noindex просто исключает URL из выдачи.
Когда применять noindex:
В Google Search Console раньше был инструмент «Параметры URL». В 2024 году Google перевёл его в ограниченный режим, но вы всё ещё можете задать поведение для конкретных GET-параметров: сканировать / не сканировать, влияет / не влияет на контент.
Для Яндекса аналогичную функцию выполняет директива Clean-param в robots.txt.
| Метод | Блокирует сканирование | Убирает из индекса | Передаёт вес | Поддержка Яндекс | Поддержка Google |
| Robots.txt Disallow | ✅ | ❌ | ❌ | ✅ | ✅ |
| Canonical | ❌ | Косвенно | ✅ | ✅ | ✅ |
| Noindex, follow | ❌ | ✅ | Частично | ✅ | ✅ |
| Clean-param | ❌ | Косвенно | ❌ | ✅ | ❌ |
| Параметры в GSC | Зависит | Зависит | ❌ | ❌ | ✅ (ограниченно) |
Рекомендация: для максимальной надёжности комбинируйте методы. Оптимальная связка для мусорных фильтров: noindex, follow + исключение из sitemap.xml. Для страниц-дублей с ценностью: rel=canonical на основную версию.

Страницы тегов требуют иного подхода, чем фильтры. Если фильтры нужно преимущественно закрывать, то теги — целенаправленно развивать.
Каждая теговая страница, оставленная в индексе, должна быть полноценной посадочной страницей:
Хотите получать заявки из поиска?
Комплексная работа над ростом позиций, трафика и заявок: техническая оптимизация, семантика, структура сайта, контент и регулярная аналитика.
Теговые страницы работают только при грамотной перелинковке:
Правило: количество тегов должно быть пропорционально ассортименту. Для магазина с 500 товарами 50–100 тегов — разумный максимум. Каждый тег — под конкретный поисковый запрос с подтверждённым спросом.
Если тег содержит менее 3 товаров — скорее всего, он не нужен. Если два тега показывают одинаковую выборку — один из них нужно объединить или удалить.
Этот раздел — задание для разработчика, которое можно передать «как есть».
| Тип URL | Метод | Пример |
| Категория (основная) | Canonical на себя | <link rel="canonical" href="/catalog/smartphones/" /> |
| Фильтр 1 уровня (с трафиком) | Canonical на себя, включить в sitemap | /catalog/smartphones/samsung/ |
| Фильтр 2+ уровней | Noindex, follow + исключить из sitemap | /catalog/?brand=samsung&color=black |
| Сортировка, пагинация | Canonical на первую страницу категории | /catalog/smartphones/?sort=price |
| Тег с поисковым спросом | Canonical на себя, уникальный контент | /catalog/nedorogie-smartfony/ |
| Тег без спроса | Noindex, follow или удалить | — |
В файл sitemap.xml включайте только те URL, которые должны попасть в индекс. Это прямой сигнал поисковику: «вот мои важные страницы». Никаких параметрических адресов, отфильтрованных URL или пагинации.

Автоматизируйте генерацию: sitemap должен обновляться при добавлении/удалении товаров и тегов.
Один из радикальных способов — не создавать параметрические URL вообще. AJAX-фильтры обновляют контент без изменения URL, а хеш-навигация (/catalog/#brand=samsung) не индексируется поисковиками.
Минус: вы теряете возможность получать трафик на ценные комбинации фильтров. Поэтому оптимальный подход — гибридный: ценные фильтры имеют статические ЧПУ, остальные работают через AJAX.
Google официально заявил, что больше не использует rel=prev/next как сигнал. Однако Яндекс по-прежнему их учитывает. Рекомендация: для пагинации в фильтрах ставьте canonical на первую страницу серии или используйте noindex на страницах 2+.
Это самая распространённая ошибка. Вы прописали Disallow в robots.txt, но через месяц найти страницы фильтров в выдаче можно по-прежнему. Причина: если на закрытый URL ссылаются другие сайты или внутренние страницы, поисковик может проиндексировать его, даже не сканируя содержимое. В индексе появится «пустая» страница с title из анкора ссылки.
Решение: комбинируйте robots.txt с noindex — первое снижает нагрузку на краулинговый бюджет, второе гарантирует исключение из индекса.
Если страница имеет noindex и одновременно canonical на другой URL — это противоречивые сигналы. Noindex говорит «не индексируй меня», а canonical — «индексируй, но считай основной вот ту». Google в такой ситуации может игнорировать оба сигнала.

Правило: на одной странице — один метод. Если страница мусорная — только noindex. Если она дубль ценной — только canonical.
Некоторые SEO-специалисты идут по пути наименьшего сопротивления и закрывают все фильтры от индексации. Это безопасно, но неэффективно. Вы теряете трафик по низкочастотным коммерческим запросам, которые конвертируются лучше высокочастотных.
Решение: всегда начинайте с анализа спроса. Выделите 10–20% фильтров с трафиковым потенциалом и оформите их как полноценные посадочные страницы.
Многие руководства ориентированы на Google и забывают про Яндекс. А ведь в российском e-commerce доля Яндекса — около 60%. Директива Clean-param — мощный инструмент, который сообщает роботу Яндекса, что определённые параметры URL не влияют на содержимое страницы.
Синтаксис в robots.txt:
Шаг 1: Аудит текущих страниц тегов и фильтров. Просканируйте сайт Screaming Frog, проверьте данные в Google Search Console и Яндекс Вебмастере. Зафиксируйте общее число проиндексированных URL и долю параметрических страниц.
Шаг 2: Сегментация URL на ценные и мусорные. Выгрузите все уникальные URL с параметрами. Проверьте каждую группу параметров в Яндекс Wordstat: есть спрос — ценная страница, нет спроса — мусорная.
Шаг 3: Выбор метода закрытия для каждого сегмента. Используйте сводную таблицу из раздела выше. Ценные фильтры → статические ЧПУ + canonical на себя. Мусорные комбинации → noindex, follow. Сортировки и служебные параметры → Disallow в robots.txt + Clean-param для Яндекса.
Шаг 4: Техническая реализация. Передайте разработчику чек-лист. Обновите robots.txt, добавьте canonical и noindex в шаблоны, пересоберите sitemap.xml.
Шаг 5: Мониторинг индексации и корректировка. Через 2–4 недели проверьте индексацию страниц заново. Число мусорных URL в индексе должно снижаться. Если нет — пересмотрите реализацию и найдите ошибки через оператор site:
Проблемы индексации страниц фильтров и тегов — одна из главных технических болей любого интернет-магазина. Но решение не в том, чтобы закрыть всё подряд, а в грамотной сегментации: ценные страницы развивать как посадочные, мусорные — исключать из индекса комбинацией noindex, canonical и robots.txt.

Ключевые принципы SEO для интернет-магазина в контексте фильтрации:

Пусть ваши теги приносят только целевой трафик, а роботы поисковых систем индексируют исключительно то, что приносит продажи — удачи в настройках!