Gollnick Data Solutions LogoGollnick Data
Zurück zur Übersicht

LLM-Leaderboard

Stelle rund 20 aktuelle Large Language Models direkt gegenüber. Sortiere nach der Metrik, die dir wichtig ist, filtere nach Anbieter und vergleiche die Werte auf einen Blick als Balkendiagramm.

Modelle im Vergleich

#ModellAnbieter
Modalitäten (Ein-/Ausgabe)
1GPT-5.6 SolInfosOpenAI
90
92
93
76
130 tok/s
$5.50
2.8%
400K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
2Claude Opus 4.8InfosAnthropic
89
89
84
85
58 tok/s
$15.00
2.5%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
3Claude Fable 5InfosAnthropic
88
90
85
90
72 tok/s
$12.00
2.2%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
4GPT-5.5InfosOpenAI
86
88
90
74
78 tok/s
$4.35
3.2%
400K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
5Claude Sonnet 5InfosAnthropic
85
85
82
82
72 tok/s
$4.50
2.8%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
6GPT-5.6 TerraInfosOpenAI
84
85
86
74
150 tok/s
$2.20
3.5%
400K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
7Gemini 3.1 ProInfosGoogle
83
88
90
76
137 tok/s
$1.74
3.5%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
8DeepSeek V4 ProInfosDeepSeek
82
85
88
66
62 tok/s
$0.18
5%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
9Grok 4.3InfosxAI
82
86
88
78
100 tok/s
$5.00
4%
256K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
10Gemini 3.5 FlashInfosGoogle
80
82
85
73
184 tok/s
$1.31
4.2%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
11Qwen 3.7 MaxInfosAlibaba
80
82
86
70
200 tok/s
$1.43
5%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
12Grok 4.1 ThinkingInfosxAI
78
84
84
88
80 tok/s
$5.00
4.5%
256K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
13GPT-5.6 LunaInfosOpenAI
74
74
76
70
250 tok/s
$0.70
5%
400K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
14Mistral Medium 3.5InfosMistral AI
74
75
77
71
130 tok/s
$0.90
5%
256K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
15Claude Haiku 4.5InfosAnthropic
73
71
70
74
200 tok/s
$1.50
4.5%
200K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
16Mistral Large 3InfosMistral AI
72
74
76
70
90 tok/s
$2.00
5.5%
256K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
17DeepSeek V4 FlashInfosDeepSeek
72
74
80
63
99 tok/s
$0.06
6%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
18Qwen 3.6InfosAlibaba
70
74
80
66
150 tok/s
$0.40
6%
256K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
19Llama 4 MaverickInfosMeta
66
68
70
66
160 tok/s
$0.50
7%
1M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
20Mistral Small 4InfosMistral AI
64
64
66
66
200 tok/s
$0.20
6.5%
128K
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
21Llama 4 ScoutInfosMeta
58
60
62
62
240 tok/s
$0.30
8.5%
10M
EinText: Bild: Audio: Video:
AusText: Bild: Audio: Video:
Coding-Score · GeschwindigkeitKosten / 1 Mio. Token · Halluzinationsrate (niedriger ist besser)

So liest du das Leaderboard

Jede numerische Metrik wird als Balken relativ zum stärksten Modell dieser Spalte dargestellt – der Zahlenwert steht immer daneben. Blaue Balken bedeuten „höher ist besser“ (z. B. Coding, Geschwindigkeit, Kontextfenster), terrakottafarbene Balken „niedriger ist besser“ (Kosten, Halluzinationsrate). Klicke auf eine Spaltenüberschrift oder nutze das Auswahlfeld, um zu sortieren; über die Filter für Anbieter sowie Ein- und Ausgabe-Modalität grenzt du die Auswahl ein (z. B. nur Modelle, die Video verarbeiten oder Bilder erzeugen). Ein Klick auf das ⓘ neben einer Spalte zeigt, aus welchem Benchmark der jeweilige Wert stammt. Coding, Reasoning, Mathematik und EQ sind Benchmark-Indizes (0–100), Geschwindigkeit in Token/Sekunde, Kosten als gemischter Preis pro einer Million Token. Die Modalitäts-Symbole zeigen, welche Ein- und Ausgaben ein Modell beherrscht (T = Text, ◨ = Bild, ♪ = Audio, ▶ = Video).

Quellen: Näherungswerte aus öffentlichen Ranglisten und Anbieterangaben (u. a. Artificial Analysis, LMArena, EQ-Bench 3, Vectara/HHEM Hallucination Leaderboard).

Stand Juli 2026 · Modelle, Benchmarks und Preise ändern sich sehr schnell – die Werte sind gerundete Orientierungswerte, kein exakter Benchmark. Bitte vor wichtigen Entscheidungen an der Originalquelle prüfen.