Технология RAG

RAG (Retrieval-Augmented Generation) — «генерация, дополненная поиском». Это не отдельная модель и не ИИ, а архитектурный подход формирования контекста: ответ генерирует обычная LLM, но ее промпт предварительно дополняется фрагментами из внешней, заранее подготовленной базы знаний.

Дата составления: 2026-05-28
Статус: 💡 Актуально

Зачем это нужно юристу

У языковой модели есть параметрическая память — знания, которые «осели» в ее весах во время обучения. С этим связаны две проблемы. Во-первых, у модели есть дата среза знаний (knowledge cutoff): все, что появилось после нее, модель просто не знает. Во-вторых, отвечая «по памяти», модель склонна к галлюцинациям — выдает правдоподобные, но недостоверные сведения без ссылки на источник.

RAG решает обе проблемы сразу и дает три выгоды:

Актуальность — модель берет данные из базы с актуальными документами в момент ответа, а не из «памяти» месячной давности;
Достоверность — модель отвечает, опираясь на конкретный предоставленный ей текст, а не сочиняет;
Верифицируемость — видно, из какого именно фрагмента какого документа взят ответ, и это можно проверить.

RAG часто называют способом «обучить» нейросеть своими данными, но это не так. Сама LLM при этом не меняется и не запоминает ваши документы — она лишь получает нужные фрагменты как дополнительный контекст к конкретному запросу. Поэтому точнее говорить не о дообучении, а о проектировании контекста (подробнее о распространенном заблуждении «обучить нейросеть» — в статье Что такое LLM).

Где RAG полезен юристам

Технология дает наилучший результат в задачах, где нужна не общая эрудиция модели, а работа с конкретным массивом конкретных документов:

Ресерч и консультации с опорой на НПА, судебную и правоприменительную практику — то, чего модель часто не знает из обучения и что трудно найти в интернете без шума и устаревших версий;
Драфтинг по собственной библиотеке наработанных документов: ответы на претензии, меморандумы, DD-отчеты, типовые письма клиентам. Накопленная фирмой библиотека качественных документов становится живым контекстом для новых;
Чат-боты по внутренним документам — корпоративным политикам и локальным актам.

Что в этом разделе

Устройство технологии — как работает RAG-пайплайн, что такое эмбеддинги и векторный поиск, как готовят данные (чанкинг) и какие у технологии ограничения
Готовые решения и проекты с RAG — коробочные сервисы, юридические сервисы с RAG по российскому праву, проекты участников сообщества и вопросы, которые стоит задать провайдеру

Связанные статьи

Глоссарий — ключевые термины: эмбеддинг, векторизация, чанкинг, косинусное сходство и другие
Галлюцинации нейросетей — почему модель выдумывает факты и как RAG снижает этот риск
Что такое LLM — как устроена языковая модель, которая генерирует ответ в RAG
Контекстное окно — как работать с большими объемами текста
Вайб-кодинговые проекты — RAG-боты и другие инструменты, собранные участниками сообщества

Дополнительные материалы

Видео «Делай RAG: как «обучить» нейросеть вашими данными (и где предел, когда проще заплатить)» — выступление на конференции Runetlex AI Conf

Теги: #rag #управление-данными #актуальное

Глоссарий

Устройство технологии