Benchmarks · /benchmarks/artificial-analysis-agentic-index

Agentic Index

Name: Agentic Index
Creator: Artificial Analysis

Artificial Analysis agentic-work combined score when exposed by the API.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 47

Test details

Visible tradeoffsThis is a combined signal, so it bundles multiple inputs and should not be treated as one clean test.

source

Artificial Analysis

metric

Index (index)

judge

Combined

direction

higher better

group id

aa_agentic_index_current

domain

Coding

What it measures vs what it misses

✓ Measures

Multi-step agentic task performance across supported evaluations.

✗ Misses

Standalone chat preference and raw API latency.

Why this countsIt tells you whether the model can generate, repair, and reason over code under evaluator pressure rather than marketing examples.Same-test ruleThis percentile only compares models inside the exact benchmark/version group shown here. It is not a universal score.What it missesIt does not fully capture repo-scale iteration, IDE ergonomics, or long debugging loops.

Leaderboard · this benchmark version

#1 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#2 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#3 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#4 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#5 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#6 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#7 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#8 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#9 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#10 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#11 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#12 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#13 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#14 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#15 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#16 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#17 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#18 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#19 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#20 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5.4 nano (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#21 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#22 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#23 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#24 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#25 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#26 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#27 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#28 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#30 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#31 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#32 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#33 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#34 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#35 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#36 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#37 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#38 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#39 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#40 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#41 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#42 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#43 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#44 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#45 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#46 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#47 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

Benchmarks · /benchmarks/artificial-analysis-agentic-index

Agentic Index

Artificial Analysis agentic-work combined score when exposed by the API.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 47

Test details

Visible tradeoffsThis is a combined signal, so it bundles multiple inputs and should not be treated as one clean test.

source

Artificial Analysis

metric

Index (index)

judge

Combined

direction

higher better

group id

aa_agentic_index_current

domain

Coding

What it measures vs what it misses

✓ Measures

Multi-step agentic task performance across supported evaluations.

✗ Misses

Standalone chat preference and raw API latency.

Leaderboard · this benchmark version

#1 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#2 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#3 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#4 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#5 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#6 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#7 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (high)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#8 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#9 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#10 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#11 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#12 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#13 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#14 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#15 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#16 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#17 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#18 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#19 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#20 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5.4 nano (xhigh)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#21 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#22 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#23 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#24 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#25 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#26 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#27 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#28 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#30 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#31 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#32 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#33 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#34 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#35 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#36 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#37 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#38 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#39 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#40 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#41 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#42 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#43 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#44 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#45 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#46 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

#47 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `agenticIndex`.

Agentic Index

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version

Loading benchmark evidence.

Agentic Index

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version