LLM이 다양하게 등장하면서 성능을 어떻게 평가해야 하는지가 중요해졌고, 계속 중요해지고 있다.전통적인 방식부터 의미 기반, 참조 없는 평가까지 LLM 평가지표를 정리했다.1. 사전 지식1.1 n-gram정의: 문장을 n개의 단어(또는 글자)로 끊어서 만든 연속된 묶음예시: "The cat sleeps"1-gram(unigram): ["The", "cat", "sleeps"]2-gram(bigram): ["The cat", "cat sleeps"]3-gram(trigram): ["The cat sleeps"] 단순히 단어 포함 여부만 보면 의미를 반영하기 어렵다.예: "cat eats fis"” vs "fish eats cat" → 단어는 같아도 의미는 다르다. 1.2 Precision (정밀도)정의: ..
평소 저의 블로그 글을 읽어보신 분들은 아시겠지만, 해당 글은 기존 어투와 다르게 썼습니다.왜냐하면 클라우드 클럽이 너무 괜찮은 커뮤니티라 조금이라도 더 많은 분들이 이 커뮤니티를 알게 되었으면 하는 마음으로, 이번만큼은 공손한 마음으로 진지하게 써보려고 하기 때문입니다.Cloud Club은 어떤 곳?Cloud Club은 특정 벤더에 종속되지 않는 vendor-neutral한 클라우드 연합 동아리입니다.대학생부터 현직자까지 다양한 구성원이 함께하며, 스터디 / 프로젝트 / 세미나 / 번개 / 네트워킹 등을 통해 함께 성장하는 커뮤니티입니다.🛠 제가 참여한 클클 활동들저는 6기 멤버, 7기 운영진으로 활동했습니다.스터디, TF, 행사 등 정말 다양한 활동에 참여하며 인프라에 대해 넓고 깊게 배울 수 있었..