매일 업데이트 · 2026-07-08 기준 · 20시간 전 업데이트

AI 출력 속도 순위 2026

API 기준 초당 출력 토큰 수(TPS) 실측값 순위

AI 텍스트 순위 AI 코딩 순위 AI 추론 순위 AI 속도 순위 이미지 AI 순위 영상 AI 순위 보이스 AI 순위 한국어 AI 순위

AI 출력 속도 순위 2026 TOP 20

Artificial Analysis 기반

—

Mercury 2

Inception

100 tok/s

—

Granite 4.0 H Small

IBM

39 tok/s

—

LFM2.5-VL-1.6B

Liquid AI

38 tok/s

—

Step 3.7 Flash

StepFun

35 tok/s

▲1

HyperNova 60B 2605

Multiverse Computing

33 tok/s

▼1

Granite 3.3 8B (Non-reasoning)

IBM

33 tok/s

—

Nova Micro

Amazon

30 tok/s

▲1

gpt-oss-120b (low)

OpenAI

29 tok/s

▼1

LFM2.5-8B-A1B

Liquid AI

28 tok/s

▲2

Gemini 3.1 Flash-Lite

Google

27 tok/s

▼1

Llama 3.1 Nemotron Instruct 70B

NVIDIA

27 tok/s

▲2

gpt-oss-120b (high)

OpenAI

26 tok/s

▼2

Nemotron 3 Nano Omni 30B A3B Reasoning

NVIDIA

26 tok/s

▼1

NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

NVIDIA

26 tok/s

▲5

Gemini 2.5 Flash-Lite (Reasoning)

Google

22 tok/s

▲1

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA

21 tok/s

▲5

Qwen3.5 Omni Flash

Alibaba

21 tok/s

▲5

o3-mini

OpenAI

21 tok/s

▼4

gpt-oss-20b (low)

OpenAI

20 tok/s

▲8

Nova 2.0 Lite (Non-reasoning)

Amazon

20 tok/s

점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.

자주 묻는 질문

가장 빠른 AI 모델은 무엇인가요?

출력 속도는 서버 부하에 따라 변동합니다. 소형 모델(Mini, Flash, Haiku 등)이 일반적으로 더 빠른 경향이 있습니다.

AI 속도는 어떻게 측정하나요?

Artificial Analysis가 API를 통해 초당 출력 토큰 수(tokens/sec)를 실측합니다. 동일 조건에서 반복 측정한 중앙값을 사용합니다.

다른 카테고리 순위

AI 텍스트 순위 AI 코딩 순위 AI 추론 순위 이미지 AI 순위 영상 AI 순위 보이스 AI 순위 한국어 AI 순위

전체 AI 순위 페이지로 돌아가기