Benchmarks · /benchmarks/artificial-analysis-tau2-telecom

Tau2-Bench Telecom

Name: Tau2-Bench Telecom
Creator: Artificial Analysis

Tau2-Bench Telecom result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 310

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Artificial Analysis

metric

Score (%)

judge

Objective

direction

higher better

group id

aa_tau2_telecom_current

domain

Search / tool use

What it measures vs what it misses

✓ Measures

Tool-use behavior in a telecom task environment.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Why this countsIt matters when the model must browse, call tools, and recover useful answers from external systems.Same-test ruleThis percentile only compares models inside the exact benchmark/version group shown here. It is not a universal score.What it missesIt does not fully capture production agent orchestration, cost ceilings, or safety policy behavior.

Leaderboard · this benchmark version

#1 · JT-35B-Flash

AA · Jun 24, 2026

Source label: JT-35B-Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

99.1%

#2 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

99.1%

#3 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#4 · GLM 5 Turbo

AA · Jun 24, 2026

Source label: GLM-5-Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: Benchmark-derived GLM 5 Turbo is visible for receipts but excluded from default overall rankings.
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#5 · glm-5v-turbo

AA · Jun 24, 2026

Source label: GLM 5V Turbo (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#6 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#7 · glm-5

AA · Jun 24, 2026

Source label: GLM-5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.2%

#8 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.7%

#9 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.7%

#10 · GLM-5 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.4%

#11 · GLM-5.1 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.1%

#12 · Qwen3.6 Max Preview

AA · Jun 24, 2026

Source label: Qwen3.6 Max Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.9%

#13 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.6%

#14 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.3%

#15 · minimax-m2.5

AA · Jun 24, 2026

Source label: MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.3%

#16 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#17 · mimo-v2-pro

AA · Jun 24, 2026

Source label: MiMo-V2-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#18 · MiMo-V2-Flash (Reasoning)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#19 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.7%

#20 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#21 · DeepSeek V4 Flash (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#22 · Step 3.5 Flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#23 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#24 · glm-4.7

AA · Jun 24, 2026

Source label: GLM-4.7 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#25 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#26 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#27 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93.9%

#28 · Qwen3.6 27B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93.6%

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#30 · Kimi K2 Thinking

AA · Jun 24, 2026

Source label: Kimi K2 Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#31 · JT-MINI

AA · Jun 24, 2026

Source label: JT-MINI

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#32 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.7%

#33 · Hy3-preview (Reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.7%

#34 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.4%

#35 · Qwen3.5 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.1%

#36 · glm-4.7-flash

AA · Jun 24, 2026

Source label: GLM-4.7-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.8%

#37 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.5%

#38 · mimo-v2-omni

AA · Jun 24, 2026

Source label: MiMo-V2-Omni

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.2%

#39 · DeepSeek V4 Pro (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.2%

#40 · mimo-v2.5

AA · Jun 24, 2026

Source label: MiMo-V2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.6%

#41 · Grok 3 mini Reasoning (high)

AA · Jun 24, 2026

Source label: Grok 3 mini Reasoning (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.4%

#42 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.1%

#43 · trinity-large-thinking

AA · Jun 24, 2026

Source label: Trinity Large Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.1%

#44 · Ling-2.6-1T

AA · Jun 24, 2026

Source label: Ling-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

89.8%

#45 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88.9%

#46 · Qwen3.5 Omni Plus

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88.3%

#47 · MiMo-V2-Omni-0327

AA · Jun 24, 2026

Source label: MiMo-V2-Omni-0327

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88%

#48 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.7%

#49 · Qwen3.5 4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.7%

#50 · step-3.5-flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash 2603

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.4%

#51 · Qwen3.5 27B

AA · Jun 24, 2026

Source label: Qwen3.5 27B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.1%

#52 · minimax-m2

AA · Jun 24, 2026

Source label: MiniMax-M2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.8%

#53 · Mi:dm K 2.5 Pro

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.5%

#54 · Claude Opus 4.5

AA · Jun 24, 2026

Source label: Claude Opus 4.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#55 · Qwen3.5 35B A3B

AA · Jun 24, 2026

Source label: Qwen3.5 35B A3B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#56 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#57 · GPT-5.3 Codex

AA · Jun 24, 2026

Source label: GPT-5.3 Codex (xhigh)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.9%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86%

#58 · Ling 2.6 Flash

AA · Jun 24, 2026

Source label: Ling 2.6 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86%

#59 · MiniMax-M2.1

AA · Jun 24, 2026

Source label: MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.4%

#60 · Qwen3.5 9B

AA · Jun 24, 2026

Source label: Qwen3.5 9B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.1%

#61 · Qwen3.6 35B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.1%

#62 · Claude Opus 4.6

AA · Jun 24, 2026

Source label: Claude Opus 4.6 (Non-reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.8%

#63 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.8%

#64 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.5%

#65 · Qwen3.5 Omni Flash

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.5%

#66 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#67 · mimo-v2-flash (non-thinking)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#68 · ERNIE 5.0 Thinking Preview

AA · Jun 24, 2026

Source label: ERNIE 5.0 Thinking Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#69 · Qwen3 Max Thinking

AA · Jun 24, 2026

Source label: Qwen3 Max Thinking (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.6%

#70 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.3%

#71 · MiniCPM5-1B (Non-reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

82.5%

#72 · Kimi K2.5 (Reasoning)

AA · Jun 24, 2026

Source label: Kimi K2.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

81.3%

#73 · MiniCPM5-1B (Reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

81%

#74 · o3

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

80.7%

#75 · Nova 2.0 Omni (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

80.4%

#76 · LongCat Flash Lite

AA · Jun 24, 2026

Source label: LongCat Flash Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

79.5%

#77 · Qwen3 Coder Next

AA · Jun 24, 2026

Source label: Qwen3 Coder Next

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

79.5%

#78 · DeepSeek Chat

AA · Jun 24, 2026

Source label: DeepSeek V3.2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

78.9%

#79 · EXAONE 4.5 33B

AA · Jun 24, 2026

Source label: EXAONE 4.5 33B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

78.1%

#80 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#81 · Grok Code Fast

AA · Jun 24, 2026

Source label: Grok Code Fast 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#82 · Nova 2.0 Lite (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#83 · Grok 4

AA · Jun 24, 2026

Source label: Grok 4

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74.9%

#84 · K-EXAONE (Reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74.3%

#85 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Non-reasoning, High Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74%

#86 · Claude 4 Opus (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

73.4%

#87 · Kimi K2 0905

AA · Jun 24, 2026

Source label: Kimi K2 0905

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

73.4%

#88 · Nova 2.0 Lite (high)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

72.8%

#89 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

72.5%

#90 · Nova 2.0 Lite (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.9%

#91 · Nova 2.0 Pro Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.6%

#92 · Claude Opus 4.1

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.4%

#93 · Claude Opus 4

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

backfilledproxy backfilledBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: Fallback benchmark identity is visible for context but excluded from default ranking.
Identity: benchmark proxy (0.58)

Parsed from Artificial Analysis public leaderboard field `tau2`. Backfilled from Claude Opus 4.1 via approved benchmark identity mapping map-claude-opus-4-to-4-1.

71.4%

#94 · mercury-2

AA · Jun 24, 2026

Source label: Mercury 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.8%

#95 · Claude Sonnet 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.5%

#96 · glm-4.6

AA · Jun 24, 2026

Source label: GLM-4.6 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.5%

#97 · Grok 4.20 0309 (Non-reasoning)

AA · Jun 24, 2026

Source label: Grok 4.20 0309 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69.6%

#98 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69.3%

#99 · Qwen3.5 2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69%

#100 · Gemini 3 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3 Pro Preview (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

68.1%

#101 · Nova 2.0 Omni (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.8%

#102 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.8%

#103 · Hy3-preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.5%

#104 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

65.8%

#105 · Claude 4 Sonnet (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

64.6%

#106 · Grok 4.1 Fast

AA · Jun 24, 2026

Source label: Grok 4.1 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.7%

#107 · Grok 4 Fast

AA · Jun 24, 2026

Source label: Grok 4 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.7%

#108 · HyperNova 60B 2605

AA · Jun 24, 2026

Source label: HyperNova 60B 2605

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.2%

#109 · o1

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

62.6%

#110 · Nova 2.0 Lite (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

62%

#111 · Kimi K2

AA · Jun 24, 2026

Source label: Kimi K2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

61.1%

#112 · Grok 4.20

AA · Jun 24, 2026

Source label: Grok 4.20 0309 v2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.9%

#113 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.9%

#114 · K-EXAONE (Non-reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.1%

#115 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

58.8%

#116 · Doubao Seed Code

AA · Jun 24, 2026

Source label: Doubao Seed Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

58.2%

#117 · o4 mini

AA · Jun 24, 2026

Source label: o4-mini (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

55.6%

#118 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.7%

#119 · Gemini 2.5 Pro

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.1%

#120 · Qwen3 VL 235B A22B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.1%

#121 · Nemotron Cascade 2 30B A3B

AA · Jun 24, 2026

Source label: Nemotron Cascade 2 30B A3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

53.2%

#122 · Qwen3 235B A22B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

53.2%

#123 · GPT-4.1 mini

AA · Jun 24, 2026

Source label: GPT-4.1 mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52.9%

#124 · Claude Sonnet 4

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52.3%

#125 · Magistral Medium 1.2

AA · Jun 24, 2026

Source label: Magistral Medium 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52%

#126 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

50.3%

#127 · Claude Sonnet 3.7

AA · Jun 24, 2026

Source label: Claude 3.7 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

50%

#128 · gpt-5.5-instant

AA · Jun 24, 2026

Source label: GPT-5.5 Instant (May 2026)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#129 · Mi:dm K 2.5 Pro Preview

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#130 · Seed-OSS-36B-Instruct

AA · Jun 24, 2026

Source label: Seed-OSS-36B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#131 · Grok 3

AA · Jun 24, 2026

Source label: Grok 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

48.8%

#132 · Solar Open 100B (Reasoning)

AA · Jun 24, 2026

Source label: Solar Open 100B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

48.2%

#133 · Qwen3.5 0.8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 0.8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.7%

#134 · GPT-4.1

AA · Jun 24, 2026

Source label: GPT-4.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.1%

#135 · deepseek-v3-0324

AA · Jun 24, 2026

Source label: DeepSeek V3 0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.1%

#136 · Sarvam 105B (high)

AA · Jun 24, 2026

Source label: Sarvam 105B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.8%

#137 · GPT-5.2

AA · Jun 24, 2026

Source label: GPT-5.2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#138 · GPT-5.1

AA · Jun 24, 2026

Source label: GPT-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#139 · Motif-2-12.7B-Reasoning

AA · Jun 24, 2026

Source label: Motif-2-12.7B-Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#140 · glm-4.5-air

AA · Jun 24, 2026

Source label: GLM-4.5-Air

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#141 · Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45.6%

#142 · Nemotron 3 Nano Omni 30B A3B Reasoning

AA · Jun 24, 2026

Source label: Nemotron 3 Nano Omni 30B A3B Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45.3%

#143 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45%

#144 · Nova 2.0 Omni (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

44.7%

#145 · Qwen3-Coder 480B A35B

AA · Jun 24, 2026

Source label: Qwen3 Coder 480B A35B Instruct

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43.6%

#146 · Gemini 3 Flash

AA · Jun 24, 2026

Source label: Gemini 3 Flash Preview (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43.3%

#147 · glm-4.5

AA · Jun 24, 2026

Source label: GLM-4.5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43%

#148 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

42.1%

#149 · Mistral Medium 3.1

AA · Jun 24, 2026

Source label: Mistral Medium 3.1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

40.6%

#150 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

40.4%

#151 · Nova Premier

AA · Jun 24, 2026

Source label: Nova Premier

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

38.3%

#152 · North Mini Code

AA · Jun 24, 2026

Source label: North Mini Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

37.4%

#153 · deepseek-v3.1-terminus

AA · Jun 24, 2026

Source label: DeepSeek V3.1 Terminus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

37.1%

#154 · pixtral-large-2411

AA · Jun 24, 2026

Source label: Pixtral Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

36.5%

#155 · Gemma 4 12B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

36.3%

#156 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

35.1%

#157 · qwen3-vl-235b-a22b-instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

35.1%

#158 · deepseek-v3.1

AA · Jun 24, 2026

Source label: DeepSeek V3.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.8%

#159 · Sarvam 30B (high)

AA · Jun 24, 2026

Source label: Sarvam 30B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#160 · qwen2.5-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#161 · Qwen3 Coder 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Coder 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#162 · MiniMax M1 80k

AA · Jun 24, 2026

Source label: MiniMax M1 80k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.2%

#163 · DeepSeek V3.2 Exp

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Exp (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33.9%

#164 · qwen3-235b-a22b-instruct-2507

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33.3%

#165 · mistral-large-2407

AA · Jun 24, 2026

Source label: Mistral Large 2 (Jul '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33%

#166 · Qwen3 Max

AA · Jun 24, 2026

Source label: Qwen3 Max (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.7%

#167 · Ling-1T

AA · Jun 24, 2026

Source label: Ling-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.7%

#168 · Claude Haiku 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.5%

#169 · Qwen3 14B

AA · Jun 24, 2026

Source label: Qwen3 14B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.2%

#170 · Gemma 4 12B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.9%

#171 · Solar Pro 2 (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.9%

#172 · MiniMax M1 40k

AA · Jun 24, 2026

Source label: MiniMax M1 40k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.6%

#173 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.3%

#174 · glm-4.6v

AA · Jun 24, 2026

Source label: GLM-4.6V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

30.7%

#175 · Mistral Large 2 (Nov '24)

AA · Jun 24, 2026

Source label: Mistral Large 2 (Nov '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

30.7%

#176 · Qwen3 32B

AA · Jun 24, 2026

Source label: Qwen3 32B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.8%

#177 · Gemini 2.0 Flash

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.5%

#178 · Mistral Small 3.2

AA · Jun 24, 2026

Source label: Mistral Small 3.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.5%

#179 · Qwen3 VL 32B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 32B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.2%

#180 · Qwen3 VL 8B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.2%

#181 · o3 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.7%

#182 · Devstral Small (Jul '25)

AA · Jun 24, 2026

Source label: Devstral Small (Jul '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.4%

#183 · Solar Pro 2 (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#184 · NVIDIA Nemotron 3 Nano 4B

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 4B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#185 · Qwen3 30B A3B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#186 · Falcon-H1R-7B

AA · Jun 24, 2026

Source label: Falcon-H1R-7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#187 · Magistral Small 1.2

AA · Jun 24, 2026

Source label: Magistral Small 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#188 · granite-4.1-8b

AA · Jun 24, 2026

Source label: Granite 4.1 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#189 · Ministral 3 14B

AA · Jun 24, 2026

Source label: Ministral 3 14B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.2%

#190 · Llama 3.3 Nemotron Super 49B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.9%

#191 · Qwen3 4B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#192 · Llama 3.3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#193 · Ministral 3 8B

AA · Jun 24, 2026

Source label: Ministral 3 8B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#194 · intellect-3

AA · Jun 24, 2026

Source label: INTELLECT-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#195 · Magistral Small 1

AA · Jun 24, 2026

Source label: Magistral Small 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#196 · Ring-1T

AA · Jun 24, 2026

Source label: Ring-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.3%

#197 · Gemma 4 E4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26%

#198 · Qwen3 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26%

#199 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5 nano (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.7%

#200 · NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.4%

#201 · Qwen3 4B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.4%

#202 · GPT-4o

AA · Jun 24, 2026

Source label: GPT-4o (Nov '24)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#203 · Llama Nemotron Super 49B v1.5 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama Nemotron Super 49B v1.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#204 · Mistral Small 3.1

AA · Jun 24, 2026

Source label: Mistral Small 3.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#205 · Qwen3 8B

AA · Jun 24, 2026

Source label: Qwen3 8B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#206 · Devstral 2

AA · Jun 24, 2026

Source label: Devstral 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#207 · Ministral 3 3B

AA · Jun 24, 2026

Source label: Ministral 3 3B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#208 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.6%

#209 · Claude Haiku 3.5

AA · Jun 24, 2026

Source label: Claude 3.5 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.6%

#210 · Mistral Medium 3

AA · Jun 24, 2026

Source label: Mistral Medium 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.3%

#211 · Qwen3 235B A22B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24%

#212 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#213 · Devstral Small 2

AA · Jun 24, 2026

Source label: Devstral Small 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#214 · NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#215 · Qwen3 VL 4B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#216 · Llama 3.1 Nemotron Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.1%

#217 · Magistral Medium 1

AA · Jun 24, 2026

Source label: Magistral Medium 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.1%

#218 · Granite 4.0 1B

AA · Jun 24, 2026

Source label: Granite 4.0 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.8%

#219 · deepseek-v3

AA · Jun 24, 2026

Source label: DeepSeek V3 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.8%

#220 · Qwen3 VL 8B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.5%

#221 · Gemma 4 E2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.2%

#222 · Qwen3 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.2%

#223 · NVIDIA Nemotron Nano 9B V2 (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.9%

#224 · DeepSeek R1 Distill Llama 70B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.9%

#225 · qwen3-next-80b-a3b-instruct

AA · Jun 24, 2026

Source label: Qwen3 Next 80B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#226 · Qwen3 1.7B

AA · Jun 24, 2026

Source label: Qwen3 1.7B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#227 · Nanbeige4.1-3B

AA · Jun 24, 2026

Source label: Nanbeige4.1-3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#228 · Qwen3 Omni 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.3%

#229 · Llama 3.2 Instruct 3B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.1%

#230 · Claude Haiku 3

AA · Jun 24, 2026

Source label: Claude 3 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.1%

#231 · Gemma 4 E2B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#232 · ling-flash-2.0

AA · Jun 24, 2026

Source label: Ling-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#233 · Gemma 4 E4B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#234 · Exaone 4.0 1.2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.5%

#235 · Solar Mini

AA · Jun 24, 2026

Source label: Solar Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.2%

#236 · Devstral Medium

AA · Jun 24, 2026

Source label: Devstral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.9%

#237 · glm-4.5v

AA · Jun 24, 2026

Source label: GLM-4.5V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#238 · Granite 4.0 H 1B

AA · Jun 24, 2026

Source label: Granite 4.0 H 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#239 · Granite 4.1 3B

AA · Jun 24, 2026

Source label: Granite 4.1 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#240 · LFM2.5-1.2B-Thinking

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#241 · Mistral Small 3

AA · Jun 24, 2026

Source label: Mistral Small 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#242 · NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.3%

#243 · Qwen3 VL 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#244 · Llama 3.1 Instruct 405B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 405B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#245 · Qwen3 4B

AA · Jun 24, 2026

Source label: Qwen3 4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#246 · Mistral Small 4

AA · Jun 24, 2026

Source label: Mistral Small 4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

18.4%

#247 · Gemini 2.5 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash-Lite (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

18.4%

#248 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.8%

#249 · Nova Lite

AA · Jun 24, 2026

Source label: Nova Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.5%

#250 · EXAONE 4.0 32B (Reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#251 · Granite 4.0 H Small

AA · Jun 24, 2026

Source label: Granite 4.0 H Small

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#252 · GPT-4.1 nano

AA · Jun 24, 2026

Source label: GPT-4.1 nano

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#253 · Exaone 4.0 1.2B (Reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#254 · Qwen3 Omni 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#255 · Llama 3.1 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#256 · LFM2.5-8B-A1B

AA · Jun 24, 2026

Source label: LFM2.5-8B-A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.1%

#257 · Step3 VL 10B

AA · Jun 24, 2026

Source label: Step3 VL 10B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.1%

#258 · Jamba Reasoning 3B

AA · Jun 24, 2026

Source label: Jamba Reasoning 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.8%

#259 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.5%

#260 · Qwen3 VL 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.5%

#261 · Command A+

AA · Jun 24, 2026

Source label: Command A

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.2%

#262 · Llama 3.1 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.2%

#263 · Gemini 2.5 Flash

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.9%

#264 · Qwen3 0.6B

AA · Jun 24, 2026

Source label: Qwen3 0.6B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#265 · Granite 4.0 H 350M

AA · Jun 24, 2026

Source label: Granite 4.0 H 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#266 · Llama 3.2 Instruct 11B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 11B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#267 · Nova Micro

AA · Jun 24, 2026

Source label: Nova Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14%

#268 · Nova Pro

AA · Jun 24, 2026

Source label: Nova Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14%

#269 · Jamba 1.7 Large

AA · Jun 24, 2026

Source label: Jamba 1.7 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.5%

#270 · LFM2 2.6B

AA · Jun 24, 2026

Source label: LFM2 2.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.5%

#271 · Granite 4.0 350M

AA · Jun 24, 2026

Source label: Granite 4.0 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.2%

#272 · Ling-mini-2.0

AA · Jun 24, 2026

Source label: Ling-mini-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.2%

#273 · Apertus 70B Instruct

AA · Jun 24, 2026

Source label: Apertus 70B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.9%

#274 · Granite 4.0 Micro

AA · Jun 24, 2026

Source label: Granite 4.0 Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#275 · Jamba 1.7 Mini

AA · Jun 24, 2026

Source label: Jamba 1.7 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#276 · LFM2 1.2B

AA · Jun 24, 2026

Source label: LFM2 1.2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#277 · Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.7%

#278 · DeepSeek Reasoner

AA · Jun 24, 2026

Source label: DeepSeek R1 (Jan '25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#279 · Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#280 · Apertus 8B Instruct

AA · Jun 24, 2026

Source label: Apertus 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#281 · LFM2 24B A2B

AA · Jun 24, 2026

Source label: LFM2 24B A2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.1%

#282 · LFM2.5-1.2B-Instruct

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.8%

#283 · Gemma 3 12B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 12B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.8%

#284 · LFM2 8B A1B

AA · Jun 24, 2026

Source label: LFM2 8B A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#285 · Gemma 3 1B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 1B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#286 · Gemma 3 27B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 27B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#287 · Granite 3.3 8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Granite 3.3 8B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#288 · Qwen3 30B A3B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.2%

#289 · Gemma 3 270M

AA · Jun 24, 2026

Source label: Gemma 3 270M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

9.1%

#290 · LFM2.5-VL-1.6B

AA · Jun 24, 2026

Source label: LFM2.5-VL-1.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

8.5%

#291 · Phi-4 Mini Instruct

AA · Jun 24, 2026

Source label: Phi-4 Mini Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

8.2%

#292 · Gemma 3n E4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#293 · Gemma 3 4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#294 · EXAONE 4.0 32B (Non-reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

4.1%

#295 · GPT-5

AA · Jun 24, 2026

Source label: GPT-5 (ChatGPT)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#296 · ring-flash-2.0

AA · Jun 24, 2026

Source label: Ring-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#297 · Reka Flash 3

AA · Jun 24, 2026

Source label: Reka Flash 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#298 · Tiny Aya Global

AA · Jun 24, 2026

Source label: Tiny Aya Global

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#299 · phi-4

AA · Jun 24, 2026

Source label: Phi-4

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#300 · ERNIE 4.5 300B A47B

AA · Jun 24, 2026

Source label: ERNIE 4.5 300B A47B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#301 · Llama 3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#302 · Llama 3 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#303 · Llama 3.2 Instruct 1B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#304 · Gemma 3n E2B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E2B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#305 · mistral-7b-instruct

AA · Jun 24, 2026

Source label: Mistral 7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#306 · DeepSeek V3.2 Speciale

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Speciale

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#307 · DeepSeek R1 0528 Qwen3 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 0528 Qwen3 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#308 · Phi-3 Mini Instruct 3.8B

AA · Jun 24, 2026

Source label: Phi-3 Mini Instruct 3.8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#309 · Sarvam M (Reasoning)

AA · Jun 24, 2026

Source label: Sarvam M (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#310 · Kimi Linear 48B A3B Instruct

AA · Jun 24, 2026

Source label: Kimi Linear 48B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

Benchmarks · /benchmarks/artificial-analysis-tau2-telecom

Tau2-Bench Telecom

Tau2-Bench Telecom result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 310

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Artificial Analysis

metric

Score (%)

judge

Objective

direction

higher better

group id

aa_tau2_telecom_current

domain

Search / tool use

What it measures vs what it misses

✓ Measures

Tool-use behavior in a telecom task environment.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Leaderboard · this benchmark version

#1 · JT-35B-Flash

AA · Jun 24, 2026

Source label: JT-35B-Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

99.1%

#2 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

99.1%

#3 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#4 · GLM 5 Turbo

AA · Jun 24, 2026

Source label: GLM-5-Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: Benchmark-derived GLM 5 Turbo is visible for receipts but excluded from default overall rankings.
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#5 · glm-5v-turbo

AA · Jun 24, 2026

Source label: GLM 5V Turbo (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#6 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.5%

#7 · glm-5

AA · Jun 24, 2026

Source label: GLM-5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

98.2%

#8 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.7%

#9 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.7%

#10 · GLM-5 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.4%

#11 · GLM-5.1 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

97.1%

#12 · Qwen3.6 Max Preview

AA · Jun 24, 2026

Source label: Qwen3.6 Max Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.9%

#13 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.6%

#14 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.3%

#15 · minimax-m2.5

AA · Jun 24, 2026

Source label: MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95.3%

#16 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#17 · mimo-v2-pro

AA · Jun 24, 2026

Source label: MiMo-V2-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#18 · MiMo-V2-Flash (Reasoning)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

95%

#19 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.7%

#20 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#21 · DeepSeek V4 Flash (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#22 · Step 3.5 Flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.4%

#23 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#24 · glm-4.7

AA · Jun 24, 2026

Source label: GLM-4.7 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#25 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#26 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

94.2%

#27 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93.9%

#28 · Qwen3.6 27B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93.6%

#29 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#30 · Kimi K2 Thinking

AA · Jun 24, 2026

Source label: Kimi K2 Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#31 · JT-MINI

AA · Jun 24, 2026

Source label: JT-MINI

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

93%

#32 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.7%

#33 · Hy3-preview (Reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.7%

#34 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.4%

#35 · Qwen3.5 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

92.1%

#36 · glm-4.7-flash

AA · Jun 24, 2026

Source label: GLM-4.7-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.8%

#37 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.5%

#38 · mimo-v2-omni

AA · Jun 24, 2026

Source label: MiMo-V2-Omni

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.2%

#39 · DeepSeek V4 Pro (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

91.2%

#40 · mimo-v2.5

AA · Jun 24, 2026

Source label: MiMo-V2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.6%

#41 · Grok 3 mini Reasoning (high)

AA · Jun 24, 2026

Source label: Grok 3 mini Reasoning (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.4%

#42 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.1%

#43 · trinity-large-thinking

AA · Jun 24, 2026

Source label: Trinity Large Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

90.1%

#44 · Ling-2.6-1T

AA · Jun 24, 2026

Source label: Ling-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

89.8%

#45 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88.9%

#46 · Qwen3.5 Omni Plus

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88.3%

#47 · MiMo-V2-Omni-0327

AA · Jun 24, 2026

Source label: MiMo-V2-Omni-0327

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

88%

#48 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.7%

#49 · Qwen3.5 4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.7%

#50 · step-3.5-flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash 2603

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.4%

#51 · Qwen3.5 27B

AA · Jun 24, 2026

Source label: Qwen3.5 27B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

87.1%

#52 · minimax-m2

AA · Jun 24, 2026

Source label: MiniMax-M2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.8%

#53 · Mi:dm K 2.5 Pro

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.5%

#54 · Claude Opus 4.5

AA · Jun 24, 2026

Source label: Claude Opus 4.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#55 · Qwen3.5 35B A3B

AA · Jun 24, 2026

Source label: Qwen3.5 35B A3B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#56 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86.3%

#57 · GPT-5.3 Codex

AA · Jun 24, 2026

Source label: GPT-5.3 Codex (xhigh)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.9%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86%

#58 · Ling 2.6 Flash

AA · Jun 24, 2026

Source label: Ling 2.6 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

86%

#59 · MiniMax-M2.1

AA · Jun 24, 2026

Source label: MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.4%

#60 · Qwen3.5 9B

AA · Jun 24, 2026

Source label: Qwen3.5 9B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.1%

#61 · Qwen3.6 35B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

85.1%

#62 · Claude Opus 4.6

AA · Jun 24, 2026

Source label: Claude Opus 4.6 (Non-reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.8%

#63 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.8%

#64 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.5%

#65 · Qwen3.5 Omni Flash

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

84.5%

#66 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#67 · mimo-v2-flash (non-thinking)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#68 · ERNIE 5.0 Thinking Preview

AA · Jun 24, 2026

Source label: ERNIE 5.0 Thinking Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.9%

#69 · Qwen3 Max Thinking

AA · Jun 24, 2026

Source label: Qwen3 Max Thinking (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.6%

#70 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

83.3%

#71 · MiniCPM5-1B (Non-reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

82.5%

#72 · Kimi K2.5 (Reasoning)

AA · Jun 24, 2026

Source label: Kimi K2.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

81.3%

#73 · MiniCPM5-1B (Reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

81%

#74 · o3

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

80.7%

#75 · Nova 2.0 Omni (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

80.4%

#76 · LongCat Flash Lite

AA · Jun 24, 2026

Source label: LongCat Flash Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

79.5%

#77 · Qwen3 Coder Next

AA · Jun 24, 2026

Source label: Qwen3 Coder Next

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

79.5%

#78 · DeepSeek Chat

AA · Jun 24, 2026

Source label: DeepSeek V3.2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

78.9%

#79 · EXAONE 4.5 33B

AA · Jun 24, 2026

Source label: EXAONE 4.5 33B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

78.1%

#80 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#81 · Grok Code Fast

AA · Jun 24, 2026

Source label: Grok Code Fast 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#82 · Nova 2.0 Lite (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

75.7%

#83 · Grok 4

AA · Jun 24, 2026

Source label: Grok 4

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74.9%

#84 · K-EXAONE (Reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74.3%

#85 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Non-reasoning, High Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

74%

#86 · Claude 4 Opus (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

73.4%

#87 · Kimi K2 0905

AA · Jun 24, 2026

Source label: Kimi K2 0905

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

73.4%

#88 · Nova 2.0 Lite (high)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

72.8%

#89 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

72.5%

#90 · Nova 2.0 Lite (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.9%

#91 · Nova 2.0 Pro Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.6%

#92 · Claude Opus 4.1

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

71.4%

#93 · Claude Opus 4

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

backfilledproxy backfilledBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: Fallback benchmark identity is visible for context but excluded from default ranking.
Identity: benchmark proxy (0.58)

Parsed from Artificial Analysis public leaderboard field `tau2`. Backfilled from Claude Opus 4.1 via approved benchmark identity mapping map-claude-opus-4-to-4-1.

71.4%

#94 · mercury-2

AA · Jun 24, 2026

Source label: Mercury 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.8%

#95 · Claude Sonnet 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.5%

#96 · glm-4.6

AA · Jun 24, 2026

Source label: GLM-4.6 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

70.5%

#97 · Grok 4.20 0309 (Non-reasoning)

AA · Jun 24, 2026

Source label: Grok 4.20 0309 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69.6%

#98 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69.3%

#99 · Qwen3.5 2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

69%

#100 · Gemini 3 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3 Pro Preview (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

68.1%

#101 · Nova 2.0 Omni (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.8%

#102 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.8%

#103 · Hy3-preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

67.5%

#104 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

65.8%

#105 · Claude 4 Sonnet (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

64.6%

#106 · Grok 4.1 Fast

AA · Jun 24, 2026

Source label: Grok 4.1 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.7%

#107 · Grok 4 Fast

AA · Jun 24, 2026

Source label: Grok 4 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.7%

#108 · HyperNova 60B 2605

AA · Jun 24, 2026

Source label: HyperNova 60B 2605

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

63.2%

#109 · o1

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

62.6%

#110 · Nova 2.0 Lite (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

62%

#111 · Kimi K2

AA · Jun 24, 2026

Source label: Kimi K2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

61.1%

#112 · Grok 4.20

AA · Jun 24, 2026

Source label: Grok 4.20 0309 v2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.9%

#113 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.9%

#114 · K-EXAONE (Non-reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

59.1%

#115 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

58.8%

#116 · Doubao Seed Code

AA · Jun 24, 2026

Source label: Doubao Seed Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

58.2%

#117 · o4 mini

AA · Jun 24, 2026

Source label: o4-mini (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

55.6%

#118 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.7%

#119 · Gemini 2.5 Pro

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.1%

#120 · Qwen3 VL 235B A22B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

54.1%

#121 · Nemotron Cascade 2 30B A3B

AA · Jun 24, 2026

Source label: Nemotron Cascade 2 30B A3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

53.2%

#122 · Qwen3 235B A22B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

53.2%

#123 · GPT-4.1 mini

AA · Jun 24, 2026

Source label: GPT-4.1 mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52.9%

#124 · Claude Sonnet 4

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52.3%

#125 · Magistral Medium 1.2

AA · Jun 24, 2026

Source label: Magistral Medium 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

52%

#126 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

50.3%

#127 · Claude Sonnet 3.7

AA · Jun 24, 2026

Source label: Claude 3.7 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

50%

#128 · gpt-5.5-instant

AA · Jun 24, 2026

Source label: GPT-5.5 Instant (May 2026)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#129 · Mi:dm K 2.5 Pro Preview

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#130 · Seed-OSS-36B-Instruct

AA · Jun 24, 2026

Source label: Seed-OSS-36B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

49.4%

#131 · Grok 3

AA · Jun 24, 2026

Source label: Grok 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

48.8%

#132 · Solar Open 100B (Reasoning)

AA · Jun 24, 2026

Source label: Solar Open 100B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

48.2%

#133 · Qwen3.5 0.8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 0.8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.7%

#134 · GPT-4.1

AA · Jun 24, 2026

Source label: GPT-4.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.1%

#135 · deepseek-v3-0324

AA · Jun 24, 2026

Source label: DeepSeek V3 0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

47.1%

#136 · Sarvam 105B (high)

AA · Jun 24, 2026

Source label: Sarvam 105B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.8%

#137 · GPT-5.2

AA · Jun 24, 2026

Source label: GPT-5.2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#138 · GPT-5.1

AA · Jun 24, 2026

Source label: GPT-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#139 · Motif-2-12.7B-Reasoning

AA · Jun 24, 2026

Source label: Motif-2-12.7B-Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#140 · glm-4.5-air

AA · Jun 24, 2026

Source label: GLM-4.5-Air

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

46.5%

#141 · Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45.6%

#142 · Nemotron 3 Nano Omni 30B A3B Reasoning

AA · Jun 24, 2026

Source label: Nemotron 3 Nano Omni 30B A3B Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45.3%

#143 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

45%

#144 · Nova 2.0 Omni (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

44.7%

#145 · Qwen3-Coder 480B A35B

AA · Jun 24, 2026

Source label: Qwen3 Coder 480B A35B Instruct

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43.6%

#146 · Gemini 3 Flash

AA · Jun 24, 2026

Source label: Gemini 3 Flash Preview (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43.3%

#147 · glm-4.5

AA · Jun 24, 2026

Source label: GLM-4.5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

43%

#148 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

42.1%

#149 · Mistral Medium 3.1

AA · Jun 24, 2026

Source label: Mistral Medium 3.1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

40.6%

#150 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

40.4%

#151 · Nova Premier

AA · Jun 24, 2026

Source label: Nova Premier

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

38.3%

#152 · North Mini Code

AA · Jun 24, 2026

Source label: North Mini Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

37.4%

#153 · deepseek-v3.1-terminus

AA · Jun 24, 2026

Source label: DeepSeek V3.1 Terminus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

37.1%

#154 · pixtral-large-2411

AA · Jun 24, 2026

Source label: Pixtral Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

36.5%

#155 · Gemma 4 12B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

36.3%

#156 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

35.1%

#157 · qwen3-vl-235b-a22b-instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

35.1%

#158 · deepseek-v3.1

AA · Jun 24, 2026

Source label: DeepSeek V3.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.8%

#159 · Sarvam 30B (high)

AA · Jun 24, 2026

Source label: Sarvam 30B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#160 · qwen2.5-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#161 · Qwen3 Coder 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Coder 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.5%

#162 · MiniMax M1 80k

AA · Jun 24, 2026

Source label: MiniMax M1 80k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

34.2%

#163 · DeepSeek V3.2 Exp

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Exp (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33.9%

#164 · qwen3-235b-a22b-instruct-2507

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33.3%

#165 · mistral-large-2407

AA · Jun 24, 2026

Source label: Mistral Large 2 (Jul '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

33%

#166 · Qwen3 Max

AA · Jun 24, 2026

Source label: Qwen3 Max (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.7%

#167 · Ling-1T

AA · Jun 24, 2026

Source label: Ling-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.7%

#168 · Claude Haiku 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.5%

#169 · Qwen3 14B

AA · Jun 24, 2026

Source label: Qwen3 14B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

32.2%

#170 · Gemma 4 12B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.9%

#171 · Solar Pro 2 (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.9%

#172 · MiniMax M1 40k

AA · Jun 24, 2026

Source label: MiniMax M1 40k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.6%

#173 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

31.3%

#174 · glm-4.6v

AA · Jun 24, 2026

Source label: GLM-4.6V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

30.7%

#175 · Mistral Large 2 (Nov '24)

AA · Jun 24, 2026

Source label: Mistral Large 2 (Nov '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

30.7%

#176 · Qwen3 32B

AA · Jun 24, 2026

Source label: Qwen3 32B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.8%

#177 · Gemini 2.0 Flash

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.5%

#178 · Mistral Small 3.2

AA · Jun 24, 2026

Source label: Mistral Small 3.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.5%

#179 · Qwen3 VL 32B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 32B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.2%

#180 · Qwen3 VL 8B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

29.2%

#181 · o3 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.7%

#182 · Devstral Small (Jul '25)

AA · Jun 24, 2026

Source label: Devstral Small (Jul '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.4%

#183 · Solar Pro 2 (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#184 · NVIDIA Nemotron 3 Nano 4B

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 4B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#185 · Qwen3 30B A3B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

28.1%

#186 · Falcon-H1R-7B

AA · Jun 24, 2026

Source label: Falcon-H1R-7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#187 · Magistral Small 1.2

AA · Jun 24, 2026

Source label: Magistral Small 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#188 · granite-4.1-8b

AA · Jun 24, 2026

Source label: Granite 4.1 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.8%

#189 · Ministral 3 14B

AA · Jun 24, 2026

Source label: Ministral 3 14B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

27.2%

#190 · Llama 3.3 Nemotron Super 49B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.9%

#191 · Qwen3 4B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#192 · Llama 3.3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#193 · Ministral 3 8B

AA · Jun 24, 2026

Source label: Ministral 3 8B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#194 · intellect-3

AA · Jun 24, 2026

Source label: INTELLECT-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#195 · Magistral Small 1

AA · Jun 24, 2026

Source label: Magistral Small 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.6%

#196 · Ring-1T

AA · Jun 24, 2026

Source label: Ring-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26.3%

#197 · Gemma 4 E4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26%

#198 · Qwen3 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

26%

#199 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5 nano (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.7%

#200 · NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.4%

#201 · Qwen3 4B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.4%

#202 · GPT-4o

AA · Jun 24, 2026

Source label: GPT-4o (Nov '24)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#203 · Llama Nemotron Super 49B v1.5 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama Nemotron Super 49B v1.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#204 · Mistral Small 3.1

AA · Jun 24, 2026

Source label: Mistral Small 3.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

25.1%

#205 · Qwen3 8B

AA · Jun 24, 2026

Source label: Qwen3 8B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#206 · Devstral 2

AA · Jun 24, 2026

Source label: Devstral 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#207 · Ministral 3 3B

AA · Jun 24, 2026

Source label: Ministral 3 3B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.9%

#208 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.6%

#209 · Claude Haiku 3.5

AA · Jun 24, 2026

Source label: Claude 3.5 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.6%

#210 · Mistral Medium 3

AA · Jun 24, 2026

Source label: Mistral Medium 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24.3%

#211 · Qwen3 235B A22B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

24%

#212 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#213 · Devstral Small 2

AA · Jun 24, 2026

Source label: Devstral Small 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#214 · NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#215 · Qwen3 VL 4B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.4%

#216 · Llama 3.1 Nemotron Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.1%

#217 · Magistral Medium 1

AA · Jun 24, 2026

Source label: Magistral Medium 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

23.1%

#218 · Granite 4.0 1B

AA · Jun 24, 2026

Source label: Granite 4.0 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.8%

#219 · deepseek-v3

AA · Jun 24, 2026

Source label: DeepSeek V3 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.8%

#220 · Qwen3 VL 8B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.5%

#221 · Gemma 4 E2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.2%

#222 · Qwen3 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

22.2%

#223 · NVIDIA Nemotron Nano 9B V2 (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.9%

#224 · DeepSeek R1 Distill Llama 70B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.9%

#225 · qwen3-next-80b-a3b-instruct

AA · Jun 24, 2026

Source label: Qwen3 Next 80B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#226 · Qwen3 1.7B

AA · Jun 24, 2026

Source label: Qwen3 1.7B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#227 · Nanbeige4.1-3B

AA · Jun 24, 2026

Source label: Nanbeige4.1-3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.6%

#228 · Qwen3 Omni 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.3%

#229 · Llama 3.2 Instruct 3B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.1%

#230 · Claude Haiku 3

AA · Jun 24, 2026

Source label: Claude 3 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

21.1%

#231 · Gemma 4 E2B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#232 · ling-flash-2.0

AA · Jun 24, 2026

Source label: Ling-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#233 · Gemma 4 E4B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.8%

#234 · Exaone 4.0 1.2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.5%

#235 · Solar Mini

AA · Jun 24, 2026

Source label: Solar Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

20.2%

#236 · Devstral Medium

AA · Jun 24, 2026

Source label: Devstral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.9%

#237 · glm-4.5v

AA · Jun 24, 2026

Source label: GLM-4.5V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#238 · Granite 4.0 H 1B

AA · Jun 24, 2026

Source label: Granite 4.0 H 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#239 · Granite 4.1 3B

AA · Jun 24, 2026

Source label: Granite 4.1 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#240 · LFM2.5-1.2B-Thinking

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#241 · Mistral Small 3

AA · Jun 24, 2026

Source label: Mistral Small 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.6%

#242 · NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19.3%

#243 · Qwen3 VL 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#244 · Llama 3.1 Instruct 405B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 405B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#245 · Qwen3 4B

AA · Jun 24, 2026

Source label: Qwen3 4B (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

19%

#246 · Mistral Small 4

AA · Jun 24, 2026

Source label: Mistral Small 4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

18.4%

#247 · Gemini 2.5 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash-Lite (Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

18.4%

#248 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.8%

#249 · Nova Lite

AA · Jun 24, 2026

Source label: Nova Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.5%

#250 · EXAONE 4.0 32B (Reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#251 · Granite 4.0 H Small

AA · Jun 24, 2026

Source label: Granite 4.0 H Small

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#252 · GPT-4.1 nano

AA · Jun 24, 2026

Source label: GPT-4.1 nano

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

17.3%

#253 · Exaone 4.0 1.2B (Reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#254 · Qwen3 Omni 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#255 · Llama 3.1 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.4%

#256 · LFM2.5-8B-A1B

AA · Jun 24, 2026

Source label: LFM2.5-8B-A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.1%

#257 · Step3 VL 10B

AA · Jun 24, 2026

Source label: Step3 VL 10B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

16.1%

#258 · Jamba Reasoning 3B

AA · Jun 24, 2026

Source label: Jamba Reasoning 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.8%

#259 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.5%

#260 · Qwen3 VL 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.5%

#261 · Command A+

AA · Jun 24, 2026

Source label: Command A

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.2%

#262 · Llama 3.1 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

15.2%

#263 · Gemini 2.5 Flash

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.9%

#264 · Qwen3 0.6B

AA · Jun 24, 2026

Source label: Qwen3 0.6B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#265 · Granite 4.0 H 350M

AA · Jun 24, 2026

Source label: Granite 4.0 H 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#266 · Llama 3.2 Instruct 11B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 11B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14.6%

#267 · Nova Micro

AA · Jun 24, 2026

Source label: Nova Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14%

#268 · Nova Pro

AA · Jun 24, 2026

Source label: Nova Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

14%

#269 · Jamba 1.7 Large

AA · Jun 24, 2026

Source label: Jamba 1.7 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.5%

#270 · LFM2 2.6B

AA · Jun 24, 2026

Source label: LFM2 2.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.5%

#271 · Granite 4.0 350M

AA · Jun 24, 2026

Source label: Granite 4.0 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.2%

#272 · Ling-mini-2.0

AA · Jun 24, 2026

Source label: Ling-mini-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

13.2%

#273 · Apertus 70B Instruct

AA · Jun 24, 2026

Source label: Apertus 70B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.9%

#274 · Granite 4.0 Micro

AA · Jun 24, 2026

Source label: Granite 4.0 Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#275 · Jamba 1.7 Mini

AA · Jun 24, 2026

Source label: Jamba 1.7 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#276 · LFM2 1.2B

AA · Jun 24, 2026

Source label: LFM2 1.2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

12.6%

#277 · Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.7%

#278 · DeepSeek Reasoner

AA · Jun 24, 2026

Source label: DeepSeek R1 (Jan '25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#279 · Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#280 · Apertus 8B Instruct

AA · Jun 24, 2026

Source label: Apertus 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.4%

#281 · LFM2 24B A2B

AA · Jun 24, 2026

Source label: LFM2 24B A2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

11.1%

#282 · LFM2.5-1.2B-Instruct

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.8%

#283 · Gemma 3 12B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 12B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.8%

#284 · LFM2 8B A1B

AA · Jun 24, 2026

Source label: LFM2 8B A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#285 · Gemma 3 1B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 1B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#286 · Gemma 3 27B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 27B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#287 · Granite 3.3 8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Granite 3.3 8B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.5%

#288 · Qwen3 30B A3B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

10.2%

#289 · Gemma 3 270M

AA · Jun 24, 2026

Source label: Gemma 3 270M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

9.1%

#290 · LFM2.5-VL-1.6B

AA · Jun 24, 2026

Source label: LFM2.5-VL-1.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

8.5%

#291 · Phi-4 Mini Instruct

AA · Jun 24, 2026

Source label: Phi-4 Mini Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

8.2%

#292 · Gemma 3n E4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#293 · Gemma 3 4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#294 · EXAONE 4.0 32B (Non-reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

4.1%

#295 · GPT-5

AA · Jun 24, 2026

Source label: GPT-5 (ChatGPT)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#296 · ring-flash-2.0

AA · Jun 24, 2026

Source label: Ring-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#297 · Reka Flash 3

AA · Jun 24, 2026

Source label: Reka Flash 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#298 · Tiny Aya Global

AA · Jun 24, 2026

Source label: Tiny Aya Global

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#299 · phi-4

AA · Jun 24, 2026

Source label: Phi-4

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#300 · ERNIE 4.5 300B A47B

AA · Jun 24, 2026

Source label: ERNIE 4.5 300B A47B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#301 · Llama 3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#302 · Llama 3 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#303 · Llama 3.2 Instruct 1B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#304 · Gemma 3n E2B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E2B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#305 · mistral-7b-instruct

AA · Jun 24, 2026

Source label: Mistral 7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#306 · DeepSeek V3.2 Speciale

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Speciale

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#307 · DeepSeek R1 0528 Qwen3 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 0528 Qwen3 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#308 · Phi-3 Mini Instruct 3.8B

AA · Jun 24, 2026

Source label: Phi-3 Mini Instruct 3.8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#309 · Sarvam M (Reasoning)

AA · Jun 24, 2026

Source label: Sarvam M (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

#310 · Kimi Linear 48B A3B Instruct

AA · Jun 24, 2026

Source label: Kimi Linear 48B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `tau2`.

Tau2-Bench Telecom

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version

Loading benchmark evidence.

Tau2-Bench Telecom

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version