Технология RAG

RAG (Retrieval-Augmented Generation) — «генерация, дополненная поиском». Это не отдельная модель и не ИИ, а архитектурный подход формирования контекста: ответ генерирует обычная LLM, но ее промпт предварительно дополняется фрагментами из внешней, заранее подготовленной базы знаний.

Дата составления: 2026-05-28
Статус: 💡 Актуально


Зачем это нужно юристу

У языковой модели есть параметрическая память — знания, которые «осели» в ее весах во время обучения. С этим связаны две проблемы. Во-первых, у модели есть дата среза знаний (knowledge cutoff): все, что появилось после нее, модель просто не знает. Во-вторых, отвечая «по памяти», модель склонна к галлюцинациям — выдает правдоподобные, но недостоверные сведения без ссылки на источник.

RAG решает обе проблемы сразу и дает три выгоды:

  • Актуальность — модель берет данные из базы с актуальными документами в момент ответа, а не из «памяти» месячной давности;

  • Достоверность — модель отвечает, опираясь на конкретный предоставленный ей текст, а не сочиняет;

  • Верифицируемость — видно, из какого именно фрагмента какого документа взят ответ, и это можно проверить.

RAG часто называют способом «обучить» нейросеть своими данными, но это не так. Сама LLM при этом не меняется и не запоминает ваши документы — она лишь получает нужные фрагменты как дополнительный контекст к конкретному запросу. Поэтому точнее говорить не о дообучении, а о проектировании контекста (подробнее о распространенном заблуждении «обучить нейросеть» — в статье Что такое LLM).

Где RAG полезен юристам

Технология дает наилучший результат в задачах, где нужна не общая эрудиция модели, а работа с конкретным массивом конкретных документов:

  • Ресерч и консультации с опорой на НПА, судебную и правоприменительную практику — то, чего модель часто не знает из обучения и что трудно найти в интернете без шума и устаревших версий;

  • Драфтинг по собственной библиотеке наработанных документов: ответы на претензии, меморандумы, DD-отчеты, типовые письма клиентам. Накопленная фирмой библиотека качественных документов становится живым контекстом для новых;

  • Чат-боты по внутренним документам — корпоративным политикам и локальным актам.


Что в этом разделе

  • Устройство технологии — как работает RAG-пайплайн, что такое эмбеддинги и векторный поиск, как готовят данные (чанкинг) и какие у технологии ограничения

  • Готовые решения и проекты с RAG — коробочные сервисы, юридические сервисы с RAG по российскому праву, проекты участников сообщества и вопросы, которые стоит задать провайдеру


Связанные статьи

Дополнительные материалы


Теги: #rag #управление-данными #актуальное