YATI (Yet Another Transformer with Improvements) — нейросетевой алгоритм Яндекса на архитектуре «трансформер», запущенный 23 ноября 2020 года. Считает текстовую релевантность не по статистическому совпадению слов, а по смысловому соответствию запроса и страницы. Заменил предыдущие нейросети Палех и Королёв, переоценил поведение по ~30% поисковых запросов и стал главным текстовым сигналом ранжирования. Понимает синонимы, перефразирования, контекст и порядок слов — то, чего не умели статистические алгоритмы вроде BM25 и TF-IDF.
YATI за 30 секунд
Представьте, что вы оцениваете школьное сочинение. Раньше учитель просто проверял, упомянул ли ученик «Толстого» нужное число раз — это TF-IDF. Потом стал учитывать длину сочинения и не «премировал» за переспам — это BM25. Но он всё равно не понимал, о чём сочинение — он просто считал слова.
YATI — это учитель, который реально читает сочинение, понимает, к чему оно ведёт, ловит сарказм, видит, что «гений русской словесности XIX века» означает то же, что «Толстой». И ставит оценку по смыслу, а не по статистике. Поэтому ученик, который пишет своими словами, теперь обгоняет того, кто заучил «правильные» формулы.
Что такое трансформер с технической стороны
Трансформер — это архитектура нейронных сетей, представленная инженерами Google в 2017 году в работе «Attention Is All You Need». Главная идея — механизм внимания (attention), который позволяет модели одновременно «видеть» все слова в тексте и понимать связи между ними, независимо от расстояния.
Это та же архитектура, на которой построены:
- GPT (включая ChatGPT, Claude, Gemini)
- BERT (от Google, текстовый ранжировщик в Google Search)
- YaLM (Языковая модель Яндекса для Алисы и Я.GPT)
- YATI (Текстовый ранжировщик Яндекса — герой этой статьи)
Все они отличаются количеством параметров, обучающими данными и решаемыми задачами, но ядро — общее. YATI Яндекс не раскрывает в деталях, но из публичных заявлений известно:
- Десятки миллиардов параметров
- Обучение на массиве из триллионов токенов русского и английского текста
- Дообучение на поведенческих данных Яндекса (что пользователи кликают и где задерживаются)
- Постоянное переобучение — модель не статичная, а регулярно обновляется
История нейросетей в ранжировании Яндекса
| Год | Алгоритм | Что нового |
|---|---|---|
| 2009 | MatrixNet | Первое машинное обучение в ранжировании Яндекса (бустинг на деревьях) |
| 2016 | Палех | Нейросеть для редких запросов, сравнивает запрос с заголовком страницы |
| 2017 | Королёв | Расширение Палеха на весь текст страницы, не только заголовок |
| 2018 | Андромеда | Глобальный апдейт; ИКС заменяет ТИЦ; усиление поведенческих факторов |
| 2020 | YATI | Полноценный трансформер; революция в текстовом ранжировании |
| 2022-2024 | Эволюция YATI | Регулярные апдейты; интеграция с YaLM (генеративные модели) |
| 2024-2026 | Яндекс Поиск с Нейро | YATI + генеративные ответы на основе LLM |
Что YATI сделал с рынком SEO
Запуск YATI в ноябре 2020 года был тектоническим сдвигом. Я работал тогда с десятком клиентов одновременно — могу описать, что увидел:
1. Массовый отток «оптимизированных» текстов
Тексты, написанные SEO-копирайтерами в 2014-2019 по схеме «20 вхождений ключа на 5000 знаков, точное вхождение в каждом подзаголовке», начали проседать в выдаче. Не моментально — позиции сначала падали на 5-10 пунктов, потом вылетали из ТОП-30. У моих клиентов выпало порядка 30-40% таких страниц за первые 3 месяца после запуска.
2. Возвращение «человеческих» текстов
Параллельно начали расти страницы, которые писали отраслевые эксперты или нормальные журналисты — с естественной лексикой, без оптимизации, иногда даже без точного вхождения главного запроса в Title. YATI «понимал», что страница про X, даже если слова X на ней мало.
3. Падение фрилансеров на биржах
Биржи копирайтеров (адвего, etxt) пострадали сильно: ТЗ типа «5000 знаков, плотность ключа 3%, LSI-слова из списка» перестали работать. Заказчики, которые годами штамповали тексты по таким ТЗ, начали жаловаться, что «контент перестал ранжироваться». Часть рынка перешла на формат «ТЗ + правки от эксперта», часть продолжает по инерции и тонет.
4. Рост требований к глубине контента
YATI хорошо «понимает», когда статья закрывает тему полностью, а когда лишь касается. Поверхностные заметки на 1500 знаков, которые раньше ранжировались за счёт оптимизации, теперь проигрывают глубоким лонгридам на 8000-15000 знаков. Это видно даже визуально: ТОП-10 по средне-частотным запросам в 2026 — это тексты по 15-30 минут чтения.
5. Усиление E-E-A-T (опыт, экспертность, авторитетность)
YATI «понимает» стиль: автор-эксперт пишет иначе, чем копирайтер. Эксперт даёт реальные примеры из практики, цифры, исключения. Копирайтер даёт обобщения и «воду». YATI ранжирует первое выше — поэтому E-E-A-T из «концепта Google для YMYL» стал универсальным правилом и для Яндекса.
Как YATI работает в общей системе ранжирования
Заблуждение: «YATI — это всё ранжирование Яндекса». Нет, ранжирование — это ансамбль из десятков моделей. YATI — одна из них, но самая тяжёлая по весу для текстовой части.
Упрощённая схема ранжирования в Яндексе 2026:
Запрос пользователя
↓
1. Понимание запроса (классификация интента, языка, региона)
↓
2. Первичный отбор кандидатов (~10 000 страниц)
— текстовые сигналы: BM25, TF-IDF, точные вхождения
— фильтрация по региону и языку
↓
3. Промежуточная оценка (~1 000 страниц)
— поведенческие факторы (CTR, отказы, dwell time)
— ссылочные сигналы
— авторитетность домена (ИКС)
↓
4. Финальное ранжирование (ТОП-100 → ТОП-10)
— YATI как тяжёлый текстовый сигнал
— другие нейросети (для коммерческих, медицинских, новостных запросов — отдельные модели)
— персонализация (история пользователя)
↓
Финальная выдача (ТОП-10)
YATI «срабатывает» на 4-м этапе. До этого страница должна пройти первичные фильтры (быть в индексе, иметь минимальную текстовую релевантность, не быть под фильтрами вроде Минусинска, Баден-Бадена, АГС).
Это означает: «писать под YATI» не отменяет базового SEO. Если страница не в индексе или забанена фильтром — YATI её даже не увидит.
Чем YATI отличается от BM25 и TF-IDF
| Критерий | TF-IDF / BM25 | YATI |
|---|---|---|
| Тип модели | Статистическая | Нейронная (трансформер) |
| Что считает | Совпадение слов | Смысловое соответствие |
| Чувствительность к синонимам | Низкая (только через стемминг) | Высокая |
| Понимает порядок слов | Нет | Да |
| Понимает контекст и сарказм | Нет | Да |
| Скорость работы | Очень быстрая (миллисекунды на миллион документов) | Медленная (секунды) |
| Где применяется | Первичный отбор кандидатов | Финальное ранжирование топа |
| «Оптимизируется» | Через плотность, длину, структуру | Через качество и глубину контента |
| Можно «накрутить» | Нельзя (BM25 насыщается) | Сложнее: переспам, написанный «по-человечески», тоже сработает плохо |
Это не «или-или», а «и-и». Современный поисковик использует обе ступени:
- Сначала статистические алгоритмы быстро отбирают кандидатов
- Потом нейросеть переоценивает топ по смыслу
Поэтому страница должна одновременно проходить BM25 (точные вхождения, плотность, структура) и YATI (смысловую глубину). Однобокая оптимизация под одно из двух теряет половину сигнала.
Как «писать под YATI» — рабочие принципы
1. Раскрывайте тему полностью, а не скользите по поверхности
Если страница про «BM25 в SEO», нельзя написать только определение. YATI «увидит», что текст не закрывает тему, и поставит ниже статьи, которая раскрывает: формулу, историю, отличия от TF-IDF, применение, мифы, чек-лист. Поэтому средняя длина ТОП-10 по информационным запросам выросла в 2-3 раза за 2020-2026 годы.
2. Используйте естественную лексику, синонимы, перефразирования
Раньше «купить станок» нужно было повторить 10 раз. Теперь — 1-3 раза «купить станок» + варианты: «приобрести оборудование», «заказать станок», «выбор промышленной техники». YATI считывает, что страница про тему покупки станков, а не «накачана ключом».
3. Структурируйте текст подзаголовками
YATI лучше понимает текст, разбитый на смысловые блоки. H2/H3 — это для алгоритма «оглавление», по которому он быстрее находит, что страница покрывает каждый аспект темы. Дополнительно — H2/H3 ловят long-tail запросы напрямую.
4. Давайте конкретику: цифры, примеры, исключения
YATI отличает экспертный текст от обобщающего. «Стоматология вышла в ТОП-10 за 4 месяца, рост заявок с 30 до 180 в месяц» — экспертно. «SEO-продвижение помогает увеличить трафик и заявки» — обобщение. Первое весит больше.
5. Отвечайте на интент сразу, а не «разжёвывайте» введение
Старая школа SEO начинала текст с «В современном мире информационных технологий каждый человек...» — это убивает поведенческие (отказы) и сигнализирует YATI о низком качестве. Современная школа: первый абзац — прямой ответ на запрос, дальше — детализация. Подробнее — в статье про интент запроса.
6. Закрывайте смежные вопросы (FAQ-блок)
YATI понимает, что страница «глубже», когда покрывает не только основной запрос, но и связанные вопросы. Поэтому FAQ-блоки в нижней части статьи (с разметкой Schema.org/FAQPage) — отличный способ расширить смысловое покрытие без «воды».
7. Не злоупотребляйте «синонимами ради синонимов»
Если YATI поймает, что текст пытается имитировать «естественность» (нагромождение неуместных синонимов, неестественные конструкции), это снизит оценку. Пишите как пишет нормальный человек, а не как «копирайтер, оптимизирующий под нейросеть».
Мифы про YATI
Миф 1. «YATI убил все ключевые слова»
Не убил, понизил роль. Точное вхождение запроса в Title и H1 по-прежнему важно — оно нужно для первичного отбора кандидатов (BM25, точные вхождения). Но дальше YATI оценивает не количество ключей в тексте, а смысловую глубину. Поэтому «без ключей вообще» не работает, и «с переспамом» не работает.
Миф 2. «Под YATI можно писать любую воду, главное — много»
Нет. YATI хорошо отличает содержательный текст от объёмного, но пустого. Длина без содержания не помогает, иногда вредит (вода = плохие поведенческие = снижение).
Миф 3. «YATI учитывает поведенческие в момент ранжирования»
Сам YATI смотрит только на текст. Поведенческие учитываются другими модулями ансамбля. Но обучают YATI с использованием поведенческих данных — это другое.
Миф 4. «YATI работает одинаково для всех запросов»
Нет. Для разных типов запросов вес YATI разный. Для информационных «как X сделать» — высокий. Для коммерческих «купить X в [город]» — ниже (там больше веса у геофакторов и поведенческих). Для навигационных «авито» — почти ноль (там работает имя бренда).
Миф 5. «YATI = AI поиск Яндекса с нейроответами»
Не путайте. YATI — это ранжировщик, который сортирует страницы. Нейроответы (запущены в 2024-2025) — это генеративная модель (на базе YaLM), которая сама пишет ответ из контекста выдачи. Это разные модули, хотя оба используют трансформеры.
Связь с другими понятиями
- Релевантность — общая оценка соответствия страницы запросу. YATI — главный текстовый компонент этой оценки.
- BM25 / TF-IDF — статистические алгоритмы, работающие до YATI на этапе отбора кандидатов.
- Эмбеддинги — векторные представления текста, ближайший родственник YATI по подходу. Векторный поиск работает на той же архитектуре трансформера.
- Интент запроса — то, чему YATI должен соответствовать. Без понимания интента «оптимизация под YATI» бессмысленна.
- ИКС — общая метрика домена. YATI оценивает страницу, ИКС — сайт целиком.
Чек-лист: «YATI-дружественная» страница
- Тема раскрыта полностью — все основные подвопросы освещены.
- Объём текста сопоставим с медианой ТОП-10 (часто 8000-15000 знаков для инфо-статей).
- Текст структурирован — есть H2 каждые 300-500 слов и H3 для подразделов.
- Точное вхождение главного запроса есть в Title, H1 и первом абзаце.
- Главный запрос встречается в тексте 1-3 раза на 1000 знаков, без перебора.
- Используются синонимы, словоформы, связанные термины (естественная лексика).
- Есть конкретика: цифры, примеры, кейсы, исключения.
- Текст отвечает на запрос в первом абзаце, без длинного «введения».
- Есть FAQ-блок (минимум 5-7 вопросов) с разметкой Schema.org/FAQPage.
- Текст читается «как человеческий», а не «как написанный для робота».
Главное за 30 секунд
YATI — нейросеть Яндекса на архитектуре трансформер, запущенная в ноябре 2020 года. Главное изменение по сравнению с предыдущими алгоритмами: оценивает не совпадение слов запроса и страницы, а смысловое соответствие. Понимает синонимы, контекст, порядок слов. С момента запуска радикально изменил рынок SEO: «оптимизированные» SEO-тексты массово выпали, выросли «человеческие» тексты от экспертов. Прямо «оптимизировать под YATI» нельзя — нет публичных параметров. Косвенно — нужно писать развёрнуто, по делу, с естественной лексикой и реальной глубиной темы.
YATI работает не один — он часть ансамбля моделей вместе с BM25, поведенческими факторами и десятками других сигналов. Поэтому «под YATI» нужно писать наряду с обычным SEO, а не вместо него.