[FairBid] Claude, GPT, Gemini... 서비스에 가장 잘 맞는 모델을 찾는 과정
by Ditto | PROJECT | 2026-04-24
FairBid의 AI 가격 추천에 가장 잘 맞는 모델을 찾기 위해 Claude, GPT-5.1, Gemini를 정확도·지연시간·이미지 거부율·가격 편향 방향까지 다각도로 비교했습니다. 그 결과 안정성과 정확도를 모두 잡은 Claude를 가격 산정에, 품질이 대등하면서 한도가 넉넉한 Gemini를 설명문 생성에 배치하는 역할 분할 구조로 정착했습니다. 다만 측정 과정에서 골든 데이터셋의 주관성과 LLM-Judge의 비결정성 같은 한계를 마주하며 '진짜 측정'은 어떻게 가능할지에 대한 숙제를 남겼습니다.