Path: blob/main/smolagents_doc/ko/text_to_sql.ipynb
5689 views
Text-to-SQL[[text-to-sql]]
이 튜토리얼에서는 smolagents
를 사용해 SQL을 다루는 에이전트를 구현해보겠습니다.
먼저 중요한 질문 하나로 시작하겠습니다. 그냥 간단하게 일반적인 text-to-SQL 파이프라인을 쓰면 안 될까요?
표준 text-to-SQL 파이프라인은 안정성이 떨어지는 경우가 많습니다. 쿼리가 잘못 생성될 수 있고, 심지어는 오류 없이 틀리거나 쓸모없는 결과를 반환할 수도 있습니다.
👉 반면, 에이전트 시스템은 출력 결과를 비판적으로 점검할 수 있고 쿼리를 수정할 필요가 있는지 스스로 결정할 수 있이 성능이 크게 향상됩니다.
이제 이 에이전트를 직접 만들어봅시다! 💪
아래 명령어를 실행해 필요한 의존성을 설치하세요:
추론 프로바이더를 호출하려면 환경 변수 HF_TOKEN
에 유효한 토큰이 설정되어 있어야 합니다. python-dotenv를 이용해 환경 변수를 불러오겠습니다.
다음으로, SQL 환경을 구성하겠습니다:
에이전트 만들기[[build-our-agent]]
이제 도구를 활용해 SQL 테이블을 조회할 수 있도록 만들어봅시다.
툴의 설명 속성은 에이전트 시스템에 의해 LLM 프롬프트에 포함되는 부분으로, LLM이 해당 도구를 어떻게 사용할 수 있는지에 대한 정보를 제공합니다. 바로 이 부분에 우리가 정의한 SQL 테이블의 설명을 작성하면 됩니다.
이제 우리만의 툴을 만들어봅시다. 도구은 아래와 같은 요소를 필요로 합니다. (자세한 내용은 도구 문서를 참고하세요)
인자(
Args:
) 목록이 포함된 docstring입력과 출력에 대한 타입 힌트
이제 이 도구를 사용하는 에이전트를 만들어보겠습니다.
여기서는 smolagent의 메인 에이전트 클래스인 CodeAgent
를 사용합니다. CodeAgent
는 코드로 액션을 작성하고 ReAct 프레임워크에 따라 이전 출력 결과를 반복적으로 개선할 수 있습니다.
모델은 에이전트 시스템을 구동하는 LLM을 의미합니다. InferenceClientModel
을 사용하면 허깅페이스의 Inference API를 통해 서버리스 또는 Dedicated 엔드포인트 방식으로 LLM을 호출할 수 있으며, 필요에 따라 다른 사설 API를 사용할 수도 있습니다.
레벨 업: 테이블 조인[[level-2-table-joins]]
이제 좀 더 어려운 과제를 해결해 볼까요? 에이전트가 여러 테이블에 걸친 조인을 처리하도록 만들어 보겠습니다.
이를 위해 각 receipt_id
에 해당하는 웨이터의 이름을 기록하는 두 번째 테이블을 만들어 보겠습니다.
테이블이 변경되었기 때문에 LLM이 테이블 정보를 올바르게 활용할 수 있도록 sql_engine
의 설명을 업데이트하겠습니다.
이번 요청은 이전보다 조금 더 어려우므로, 더 강력한 Qwen/Qwen2.5-Coder-32B-Instruct 모델을 사용하도록 LLM 엔진을 바꾸겠습니다!
바로 성공입니다! 놀라울 만큼 간단하게 설정되지 않았나요?
이번 예제는 여기까지입니다! 지금까지 다음과 같은 개념들을 살펴보았습니다.
새로운 도구 만들기
도구 설명 업데이트하기
더 강력한 LLM으로 에이전트 추론 능력 향상시키기
✅ 이제 여러분이 꿈꿔왔던 text-to-SQL 시스템을 직접 만들어 보세요! ✨