에이전틱 RAG (Agentic RAG)란 무엇인가요?
오늘날 실제 애플리케이션에서 단순한 RAG(Retrieval-Augmented Generation) 시스템은 거의 사용되지 않습니다. 사용자 질문에 정확한 답변을 제공하려면 RAG 시스템에 “에이전시(agency)“를 추가하는 것이 일반적입니다.
하지만 용어와 트렌드에 휩쓸리지 않는 것이 중요합니다. 에이전틱 RAG를 구현하는 데 있어 단일한 정답은 없으며, 여러분의 사용 사례에 맞게 시스템을 설계해야 합니다. 핵심은 용어보다는 효율적인 엔지니어링 플로우를 고민하는 것입니다.
이제 에이전틱 RAG의 주요 구성 요소를 살펴보겠습니다.
에이전틱 RAG의 주요 구성 요소
1️⃣ 사용자 쿼리 분석
사용자의 원래 쿼리를 LLM(대규모 언어 모델) 기반 에이전트에 전달하여 분석합니다. 이 단계에서는:
• 쿼리 리포맷: 원래 쿼리를 필요에 따라 하나 또는 여러 개의 쿼리로 재작성합니다.
• 추가 데이터 요구 판단: 답변에 필요한 추가 데이터 소스를 탐색해야 하는지 여부를 결정합니다.
2️⃣ 데이터 검색(Retrieval)
추가 데이터가 필요하다면 데이터 검색 단계가 실행됩니다. 에이전틱 RAG에서는 하나 이상의 에이전트가 다음과 같은 데이터 소스를 탐색합니다:
• 실시간 사용자 데이터: 예를 들어, 사용자의 현재 위치와 같은 실시간 정보를 활용할 수 있습니다.
• 내부 문서: 사용자가 관심 있을 만한 내부 데이터.
• 웹 데이터: 인터넷에서 접근 가능한 정보.
• 그 외 다양한 데이터 소스.
3️⃣ LLM을 통한 직접 생성
추가 데이터가 필요하지 않은 경우, LLM을 통해 바로 답변(또는 다수의 답변)을 생성합니다.
4️⃣ 답변 분석, 요약 및 검토
생성된 답변은 정확성과 관련성을 평가하며, 에이전트가 다음을 결정합니다:
• 최종 답변으로 제공: 답변이 충분히 좋은 경우, 사용자에게 바로 전달됩니다.
• 재작성 및 재생성: 답변이 부족하다고 판단되면 쿼리를 재작성하고 다시 생성 프로세스를 반복합니다.
에이전틱 RAG의 강점
에이전틱 RAG의 진정한 강점은 질문 처리 전후의 추가 경로 설정, 다양한 데이터 소스 통합 처리, 그리고 실패 복구 능력입니다.
• 복잡한 쿼리를 다룰 때 더욱 강력한 성능을 발휘합니다.
• 실시간 데이터와 정적 데이터를 융합해 최적의 답변을 제공합니다.
• 자동화된 루프를 통해 높은 수준의 답변 품질을 유지합니다.
결론
에이전틱 RAG는 단순한 RAG의 확장된 형태로, 더욱 정교하고 유연한 대화형 AI 시스템을 구축하는 데 필수적인 접근 방식입니다. 여러분의 비즈니스 또는 연구에 에이전틱 RAG를 어떻게 활용할 수 있을지 고민해보세요.