Comet ML

Comet ML

코멧 ML

AI 리서치Mid

소개

Comet은 ML 실험 추적·모델 레지스트리·데이터셋 버전 관리·프로덕션 모니터링을 통합한 MLOps 플랫폼이다. 최근에는 LLM 에이전트 관측·평가 도구인 Opik을 추가해 LLM 호출 추적, 30+ LLM-as-a-judge 메트릭, 테스트 스위트, 자동 코드 수정 에이전트(Ollie)까지 제공한다. 오픈소스 자체 호스팅과 클라우드 SaaS 양쪽을 지원해 보안·규제 요구가 큰 엔터프라이즈도 도입할 수 있고, LangChain·LlamaIndex·OpenAI 등 주요 LLM 프레임워크와 직접 연동된다.

장점

  • ML 실험 추적과 LLM 에이전트 관측을 한 플랫폼에서 함께 다룰 수 있어 전통 ML 팀과 GenAI 팀이 공통 인프라를 쓸 수 있다
  • Opik 오픈소스 버전을 자체 호스팅으로 무료 사용 가능해 데이터를 외부에 보내지 않아도 된다
  • Free Cloud 플랜에서 10명·25k 스팬/월·60일 보존을 무료로 제공해 스타트업과 개인 연구도 부담 없이 시작할 수 있다
  • 30+ LLM-as-a-judge 메트릭과 테스트 스위트로 에이전트 품질을 정량 평가할 수 있고, Ollie 코딩 에이전트가 트레이스를 보고 자동으로 코드 수정안을 제시한다
  • 엔터프라이즈 플랜은 SOC 2·ISO 27001·HIPAA·GDPR 준수와 SSO·유연 배포를 지원한다

단점

  • 한국어 UI나 한국어 공식 페이지가 제공되지 않아 한국 개발자는 영어 문서에 의존해야 한다
  • 유료 Pro 플랜은 월 $19부터로 USD 결제이며, 한국 원화 결제·세금계산서 발행 안내가 공식 노출되지 않는다
  • ML 실험 추적·LLM 관측 양쪽 기능이 풍부한 만큼 학습 곡선이 가파르고 초기 세팅·통합 비용이 든다
  • 에이전트 관측 영역은 LangSmith·Helicone 등 신규 경쟁이 빠르게 늘고 있어 기능 비교·선정에 추가 검증이 필요하다

핵심 기능

LLM 트레이스·관측(Opik)

에이전트가 호출한 LLM·툴·컨텍스트 검색을 단계별로 로깅하고 시각화한다.

LLM-as-a-judge 평가

30+ 사전 정의된 LLM 심사관 메트릭과 테스트 스위트로 에이전트 출력을 자동 채점한다.

Ollie 코딩 에이전트

트레이스를 분석해 문제 원인을 찾고 코드 수정안을 자동 작성한다.

ML 실험 추적·모델 레지스트리

모델 학습 메트릭·아티팩트·데이터셋 버전을 한 곳에서 추적·비교·관리한다.

프로덕션 모델 모니터링

프로덕션 환경의 모델 성능·드리프트를 지속 모니터링하고 거버넌스 요건을 충족한다.

오픈소스·자체 호스팅 지원

Opik을 오픈소스로 자체 호스팅하거나 Comet 클라우드에서 SaaS로 사용할 수 있다.

주요 LLM 프레임워크 통합

LangChain·LlamaIndex·OpenAI 등 주요 LLM 프레임워크와 직접 연동되어 코드 한두 줄로 트레이싱이 가능하다.

공식 사이트 2026-06-24 검증

요금제

2026-06-24 기준

Opik Open Source

Free

  • 자체 호스팅
  • 에이전트 트레이싱·테스트 스위트·플레이그라운드 전체 기능

Opik Free Cloud

Free

  • 최대 10명
  • 월 25,000 스팬·60일 보존
  • 에이전트 트레이싱·테스트 스위트

Opik Pro Cloud

$19​/​month

  • 최대 50명
  • 월 100,000 스팬·60일 보존
  • 스팬 한도·보존 기간 커스터마이즈

MLOps Pro

$19​/​user​/​month

  • 최대 10명
  • 1,500 학습 시간 포함·500GB 저장공간
  • 이메일 지원

Enterprise

Custom

(문의)

  • 무제한 사용자·커스텀 사용 플랜
  • 유연 배포·SSO
  • SOC 2·ISO 27001·HIPAA·GDPR 준수

사용자 리뷰

불러오는 중...