RAG의 배경

Background

할루시네이션

  • 할루시네이션은 모델이 잘못된 정보를 자신감 있게 제시

최신 정보의 반영 안됨

  • 대규모 언어 모델의 학습 과정이 복잡, 시간과 리소스가 많이 소요됨
  • 모델의 지식은 학습 데이터의 컷오프 날짜에 제한, 실시간 업데이트의 어려움으로 최신 정보 반영 지연

도메인 특화

  • 일반적인 LLM은 광범위한 지식을 다루지만, 특정 기업이나 조직의 고유한 정보는 포함하지 않음
  • 기업 특화 정보를 활용하기 위해서는 추가적인 파인튜닝이나 맞춤형 학습이 필요

지식의 불분명한 출처

  • LLM은 학습 데이터에서 얻은 정보를 종합하여 답변을 생성하므로, 특정 정보의 정확한 출처를 제시하기 어려움

 

What is RAG?

Retrieval(검색) - Augmented(증강) - Generation(생성)

  • 기존의 LLM 답변 생성하는 과정에 검색을 추가하여 답변에 참고할만한 정보를 제공


 

대표적인 RAG 방법론


 

RAG의 패러다임 변화

이전 방법론의 한계를 뛰어넘을 수 있는 여러가지 시도

  • Naive RAG - Advanced RAG - Modular RAG

    • 패러다임은 End-to-End RAG 파이프라인의 변화에 따라 나뉨
  • Naive RAG -> Advanced RAG

    • 더 나은 RAG 성능 개선에 초점을 맞춤
  • Advanced RAG -> Modular RAG

    • RAG를 프로덕션 레벨에서의 유지보수, 효율적인 설계를 고려

 

출처