
Евгений Вылегжанин
Газпромнефть — Цифровые решения
Сервисы, генерирующие SQL-запросы из запросов на естественном языке, упрощают работу с данными для аналитиков, бизнес-пользователей и разработчиков.
Я расскажу о нашей системе Text2SQL, разработанной для специализированных доменов, где стандартные open source-решения часто оказываются недостаточно точными. Поделюсь опытом реализации, поговорим об архитектуре и итоговых метриках.
Система использует open source LLM на локальных мощностях, учитывает особенности домена, в котором она используется, и специфику его языка. Использует поиск по атрибутам БД, RAG, self-correction, prompt engineering, обработку синонимов и другие практики для решения задачи Text2SQL.
Этот доклад будет полезен всем, кто работает с NLP, базами данных или интересуется практической реализацией Text2SQL в своих проектах.
Газпромнефть — Цифровые решения