
Comet ML
코멧 ML
소개
Comet은 ML 실험 추적·모델 레지스트리·데이터셋 버전 관리·프로덕션 모니터링을 통합한 MLOps 플랫폼이다. 최근에는 LLM 에이전트 관측·평가 도구인 Opik을 추가해 LLM 호출 추적, 30+ LLM-as-a-judge 메트릭, 테스트 스위트, 자동 코드 수정 에이전트(Ollie)까지 제공한다. 오픈소스 자체 호스팅과 클라우드 SaaS 양쪽을 지원해 보안·규제 요구가 큰 엔터프라이즈도 도입할 수 있고, LangChain·LlamaIndex·OpenAI 등 주요 LLM 프레임워크와 직접 연동된다.
장점
- •ML 실험 추적과 LLM 에이전트 관측을 한 플랫폼에서 함께 다룰 수 있어 전통 ML 팀과 GenAI 팀이 공통 인프라를 쓸 수 있다
- •Opik 오픈소스 버전을 자체 호스팅으로 무료 사용 가능해 데이터를 외부에 보내지 않아도 된다
- •Free Cloud 플랜에서 10명·25k 스팬/월·60일 보존을 무료로 제공해 스타트업과 개인 연구도 부담 없이 시작할 수 있다
- •30+ LLM-as-a-judge 메트릭과 테스트 스위트로 에이전트 품질을 정량 평가할 수 있고, Ollie 코딩 에이전트가 트레이스를 보고 자동으로 코드 수정안을 제시한다
- •엔터프라이즈 플랜은 SOC 2·ISO 27001·HIPAA·GDPR 준수와 SSO·유연 배포를 지원한다
단점
- •한국어 UI나 한국어 공식 페이지가 제공되지 않아 한국 개발자는 영어 문서에 의존해야 한다
- •유료 Pro 플랜은 월 $19부터로 USD 결제이며, 한국 원화 결제·세금계산서 발행 안내가 공식 노출되지 않는다
- •ML 실험 추적·LLM 관측 양쪽 기능이 풍부한 만큼 학습 곡선이 가파르고 초기 세팅·통합 비용이 든다
- •에이전트 관측 영역은 LangSmith·Helicone 등 신규 경쟁이 빠르게 늘고 있어 기능 비교·선정에 추가 검증이 필요하다
핵심 기능
LLM 트레이스·관측(Opik)
에이전트가 호출한 LLM·툴·컨텍스트 검색을 단계별로 로깅하고 시각화한다.
LLM-as-a-judge 평가
30+ 사전 정의된 LLM 심사관 메트릭과 테스트 스위트로 에이전트 출력을 자동 채점한다.
Ollie 코딩 에이전트
트레이스를 분석해 문제 원인을 찾고 코드 수정안을 자동 작성한다.
ML 실험 추적·모델 레지스트리
모델 학습 메트릭·아티팩트·데이터셋 버전을 한 곳에서 추적·비교·관리한다.
프로덕션 모델 모니터링
프로덕션 환경의 모델 성능·드리프트를 지속 모니터링하고 거버넌스 요건을 충족한다.
오픈소스·자체 호스팅 지원
Opik을 오픈소스로 자체 호스팅하거나 Comet 클라우드에서 SaaS로 사용할 수 있다.
주요 LLM 프레임워크 통합
LangChain·LlamaIndex·OpenAI 등 주요 LLM 프레임워크와 직접 연동되어 코드 한두 줄로 트레이싱이 가능하다.
공식 사이트 2026-06-24 검증
요금제
2026-06-24 기준
Opik Open Source
Free
- 자체 호스팅
- 에이전트 트레이싱·테스트 스위트·플레이그라운드 전체 기능
Opik Free Cloud
Free
- 최대 10명
- 월 25,000 스팬·60일 보존
- 에이전트 트레이싱·테스트 스위트
Opik Pro Cloud
$19/month
- 최대 50명
- 월 100,000 스팬·60일 보존
- 스팬 한도·보존 기간 커스터마이즈
MLOps Pro
$19/user/month
- 최대 10명
- 1,500 학습 시간 포함·500GB 저장공간
- 이메일 지원
Enterprise
Custom
(문의)
- 무제한 사용자·커스텀 사용 플랜
- 유연 배포·SSO
- SOC 2·ISO 27001·HIPAA·GDPR 준수
사용자 리뷰
불러오는 중...
