Skill 품질 관리를 위한 Rubric 설계와 시스템 구현
by | TECH_ESSAY | 2026-06-08
#Backend #AI 토스 AI DX팀이 개발자가 코딩 에이전트로 쓰는 사내 공용 Skill의 품질을 6개 영역 30개 항목 Rubric으로 평가하는 시스템을 직접 구현한 사례입니다. 결정적인 검사는 규칙 기반(정규식·AST 17개), 의미적인 평가는 모델 기반(13개)으로 분리하고 GitHub Actions와 로컬 플러그인으로 자동화했습니다.