Background
할루시네이션
- 할루시네이션은 모델이 잘못된 정보를 자신감 있게 제시
최신 정보의 반영 안됨
- 대규모 언어 모델의 학습 과정이 복잡, 시간과 리소스가 많이 소요됨
- 모델의 지식은 학습 데이터의 컷오프 날짜에 제한, 실시간 업데이트의 어려움으로 최신 정보 반영 지연
도메인 특화
- 일반적인 LLM은 광범위한 지식을 다루지만, 특정 기업이나 조직의 고유한 정보는 포함하지 않음
- 기업 특화 정보를 활용하기 위해서는 추가적인 파인튜닝이나 맞춤형 학습이 필요
지식의 불분명한 출처
- LLM은 학습 데이터에서 얻은 정보를 종합하여 답변을 생성하므로, 특정 정보의 정확한 출처를 제시하기 어려움
What is RAG?
Retrieval(검색) - Augmented(증강) - Generation(생성)
- 기존의 LLM 답변 생성하는 과정에 검색을 추가하여 답변에 참고할만한 정보를 제공
대표적인 RAG 방법론
RAG의 패러다임 변화
이전 방법론의 한계를 뛰어넘을 수 있는 여러가지 시도
Naive RAG - Advanced RAG - Modular RAG
- 패러다임은 End-to-End RAG 파이프라인의 변화에 따라 나뉨
Naive RAG -> Advanced RAG
- 더 나은 RAG 성능 개선에 초점을 맞춤
Advanced RAG -> Modular RAG
- RAG를 프로덕션 레벨에서의 유지보수, 효율적인 설계를 고려