Benchmarks · /benchmarks/artificial-analysis-gdpval

GDPval-AA

Name: GDPval-AA
Creator: Artificial Analysis

GDPval-AA result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 47

Test details

Visible tradeoffsThis is a rubric-judged signal, so it is more structured than arena taste but still depends on the scoring rubric.

source

Artificial Analysis

metric

Elo (rating)

judge

Rubric

direction

higher better

group id

aa_gdpval_current

domain

Professional reasoning

What it measures vs what it misses

✓ Measures

Agentic performance on economically valuable work tasks.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Why this countsAgentic performance on economically valuable work tasks.Same-test ruleThis percentile only compares models inside the exact benchmark/version group shown here. It is not a universal score.What it missesAdjacent capabilities, subjective preference, latency, and cost.

Leaderboard · this benchmark version

#1 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,771

#2 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,605

#3 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,521

#4 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,507

#5 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,401

#6 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,399

#7 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,384

#8 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,349

#9 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,311

#10 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,286

#11 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,273

#12 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,260

#13 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,225

#14 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,199

#15 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,194

#16 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,189

#17 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,171

#18 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,170

#19 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,157

#20 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,156

#21 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,152

#22 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,123

#23 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,091

#24 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,052

#25 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,026

#26 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

979

#27 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

967

#28 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

955

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

939

#30 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

922

#31 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

916

#32 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

890

#33 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

780

#34 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

772

#35 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

755

#36 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

715

#37 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5.4 nano (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

714

#38 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

658

#39 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

636

#40 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

608

#41 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

603

#42 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

523

#43 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

462

#44 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

419

#45 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

#46 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

-11

#47 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

-115

Benchmarks · /benchmarks/artificial-analysis-gdpval

GDPval-AA

GDPval-AA result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 47

Test details

Visible tradeoffsThis is a rubric-judged signal, so it is more structured than arena taste but still depends on the scoring rubric.

source

Artificial Analysis

metric

Elo (rating)

judge

Rubric

direction

higher better

group id

aa_gdpval_current

domain

Professional reasoning

What it measures vs what it misses

✓ Measures

Agentic performance on economically valuable work tasks.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Leaderboard · this benchmark version

#1 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,771

#2 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,605

#3 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,521

#4 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,507

#5 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,401

#6 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,399

#7 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,384

#8 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,349

#9 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,311

#10 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,286

#11 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,273

#12 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,260

#13 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,225

#14 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,199

#15 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,194

#16 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,189

#17 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,171

#18 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,170

#19 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,157

#20 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,156

#21 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,152

#22 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,123

#23 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,091

#24 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,052

#25 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

1,026

#26 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

979

#27 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

967

#28 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

955

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

939

#30 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

922

#31 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

916

#32 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

890

#33 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

780

#34 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

772

#35 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

755

#36 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

715

#37 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5.4 nano (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

714

#38 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

658

#39 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

636

#40 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

608

#41 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

603

#42 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

523

#43 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

462

#44 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

419

#45 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

#46 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

-11

#47 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gdpvalBreakdown.elo`.

-115

GDPval-AA

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version

Loading benchmark evidence.

GDPval-AA

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version