Benchmarks · /benchmarks/artificial-analysis-gpqa

GPQA

Name: GPQA
Creator: Artificial Analysis

GPQA result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 375

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Artificial Analysis

metric

Accuracy (%)

judge

Objective

direction

higher better

group id

aa_gpqa_current

domain

Reasoning / math / science

What it measures vs what it misses

✓ Measures

Graduate-level scientific reasoning.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Why this countsIt is one of the cleaner reads on deliberate reasoning strength rather than style or popularity.Same-test ruleThis percentile only compares models inside the exact benchmark/version group shown here. It is not a universal score.What it missesIt still misses product usability, latency, and whether the model stays correct in messy real workflows.

Leaderboard · this benchmark version

#1 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

94.1%

#2 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.9%

#3 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.6%

#4 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.3%

#5 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92%

#6 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

90%

#7 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.6%

#8 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.5%

#9 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.5%

#10 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.8%

#11 · Qwen3.6 Max Preview

AA · Jun 24, 2026

Source label: Qwen3.6 Max Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.8%

#12 · Gemini 3 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3 Pro Preview (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.7%

#13 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Non-reasoning, High Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.5%

#14 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.4%

#15 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.2%

#16 · Grok 4

AA · Jun 24, 2026

Source label: Grok 4

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.7%

#17 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.4%

#18 · DeepSeek V3.2 Speciale

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Speciale

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.1%

#19 · mimo-v2-pro

AA · Jun 24, 2026

Source label: MiMo-V2-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87%

#20 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.8%

#21 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#22 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#23 · Hy3-preview (Reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#24 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.1%

#25 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

85.7%

#26 · MiMo-V2-Omni-0327

AA · Jun 24, 2026

Source label: MiMo-V2-Omni-0327

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

85.5%

#27 · mimo-v2.5

AA · Jun 24, 2026

Source label: MiMo-V2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.9%

#28 · Nanbeige4.1-3B

AA · Jun 24, 2026

Source label: Nanbeige4.1-3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.9%

#29 · minimax-m2.5

AA · Jun 24, 2026

Source label: MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.8%

#30 · GLM 5 Turbo

AA · Jun 24, 2026

Source label: GLM-5-Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.2%
Last updated: recent
Eligibility: Benchmark-derived GLM 5 Turbo is visible for receipts but excluded from default overall rankings.
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.7%

#31 · MiMo-V2-Flash (Reasoning)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.6%

#32 · gpt-5.5-instant

AA · Jun 24, 2026

Source label: GPT-5.5 Instant (May 2026)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.6%

#33 · o3-pro

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.5%

#34 · Qwen3.5 27B

AA · Jun 24, 2026

Source label: Qwen3.5 27B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.2%

#35 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.2%

#36 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.1%

#37 · Claude Opus 4.6

AA · Jun 24, 2026

Source label: Claude Opus 4.6 (Non-reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84%

#38 · GLM-5.1 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.9%

#39 · Kimi K2 Thinking

AA · Jun 24, 2026

Source label: Kimi K2 Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.8%

#40 · GPT-5.3 Codex

AA · Jun 24, 2026

Source label: GPT-5 Codex (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.6%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.7%

#41 · Gemini 2.5 Pro Preview (Mar' 25)

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro Preview (Mar' 25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.6%

#42 · Step 3.5 Flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.1%

#43 · MiniMax-M2.1

AA · Jun 24, 2026

Source label: MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83%

#44 · JT-35B-Flash

AA · Jun 24, 2026

Source label: JT-35B-Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.9%

#45 · Qwen3.6 27B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.9%

#46 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.8%

#47 · mimo-v2-omni

AA · Jun 24, 2026

Source label: MiMo-V2-Omni

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.8%

#48 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.7%

#49 · o3

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.7%

#50 · step-3.5-flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash 2603

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.6%

#51 · Qwen3.5 Omni Plus

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.6%

#52 · Gemini 2.5 Pro

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro Preview (May' 25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.2%

#53 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.2%

#54 · glm-5

AA · Jun 24, 2026

Source label: GLM-5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82%

#55 · Qwen3.5 35B A3B

AA · Jun 24, 2026

Source label: Qwen3.5 35B A3B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.9%

#56 · Qwen3.6 35B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.7%

#57 · Gemini 3 Flash

AA · Jun 24, 2026

Source label: Gemini 3 Flash Preview (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.2%

#58 · Nova 2.0 Lite (high)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.1%

#59 · ERNIE 4.5 300B A47B

AA · Jun 24, 2026

Source label: ERNIE 4.5 300B A47B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.1%

#60 · Claude Opus 4.5

AA · Jun 24, 2026

Source label: Claude Opus 4.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81%

#61 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#62 · glm-5v-turbo

AA · Jun 24, 2026

Source label: GLM 5V Turbo (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#63 · Claude Opus 4.1

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#64 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80%

#65 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Non-reasoning, Low Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.7%

#66 · Claude 4 Opus (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.6%

#67 · EXAONE 4.5 33B

AA · Jun 24, 2026

Source label: EXAONE 4.5 33B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.4%

#68 · Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.3%

#69 · Grok 3 mini Reasoning (high)

AA · Jun 24, 2026

Source label: Grok 3 mini Reasoning (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.1%

#70 · Qwen3 235B A22B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79%

#71 · Kimi K2.5 (Reasoning)

AA · Jun 24, 2026

Source label: Kimi K2.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.9%

#72 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.8%

#73 · Qwen3.5 9B

AA · Jun 24, 2026

Source label: Qwen3.5 9B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.6%

#74 · Grok 4.20 0309 (Non-reasoning)

AA · Jun 24, 2026

Source label: Grok 4.20 0309 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.5%

#75 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.5%

#76 · o4 mini

AA · Jun 24, 2026

Source label: o4-mini (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.4%

#77 · K-EXAONE (Reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.3%

#78 · glm-4.5

AA · Jun 24, 2026

Source label: GLM-4.5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.2%

#79 · Claude 4 Sonnet (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#80 · minimax-m2

AA · Jun 24, 2026

Source label: MiniMax-M2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#81 · ERNIE 5.0 Thinking Preview

AA · Jun 24, 2026

Source label: ERNIE 5.0 Thinking Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#82 · Grok 4.20

AA · Jun 24, 2026

Source label: Grok 4.20 0309 v2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.6%

#83 · Qwen3 Max Thinking

AA · Jun 24, 2026

Source label: Qwen3 Max Thinking (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.6%

#84 · Ring-1T

AA · Jun 24, 2026

Source label: Ring-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.4%

#85 · Qwen3 VL 235B A22B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.2%

#86 · Qwen3.5 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.1%

#87 · mercury-2

AA · Jun 24, 2026

Source label: Mercury 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77%

#88 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.8%

#89 · Nova 2.0 Lite (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.8%

#90 · Kimi K2 0905

AA · Jun 24, 2026

Source label: Kimi K2 0905

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.7%

#91 · Kimi K2

AA · Jun 24, 2026

Source label: Kimi K2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.6%

#92 · Qwen3 Max

AA · Jun 24, 2026

Source label: Qwen3 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.4%

#93 · Doubao Seed Code

AA · Jun 24, 2026

Source label: Doubao Seed Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.4%

#94 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.3%

#95 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.2%

#96 · intellect-3

AA · Jun 24, 2026

Source label: INTELLECT-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.1%

#97 · Nova 2.0 Omni (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76%

#98 · Nemotron Cascade 2 30B A3B

AA · Jun 24, 2026

Source label: Nemotron Cascade 2 30B A3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.8%

#99 · North Mini Code

AA · Jun 24, 2026

Source label: North Mini Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.7%

#100 · qwen3-235b-a22b-instruct-2507

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.3%

#101 · Gemma 4 12B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.3%

#102 · Ling-2.6-1T

AA · Jun 24, 2026

Source label: Ling-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.2%

#103 · trinity-large-thinking

AA · Jun 24, 2026

Source label: Trinity Large Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.2%

#104 · DeepSeek Chat

AA · Jun 24, 2026

Source label: DeepSeek V3.2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.1%

#105 · deepseek-v3.1-terminus

AA · Jun 24, 2026

Source label: DeepSeek V3.1 Terminus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.1%

#106 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#107 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#108 · o3 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#109 · o1

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.7%

#110 · Qwen3.5 Omni Flash

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.2%

#111 · Magistral Medium 1.2

AA · Jun 24, 2026

Source label: Magistral Medium 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.9%

#112 · EXAONE 4.0 32B (Reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.9%

#113 · DeepSeek V3.2 Exp

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Exp (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#114 · qwen3-next-80b-a3b-instruct

AA · Jun 24, 2026

Source label: Qwen3 Next 80B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#115 · Sarvam 105B (high)

AA · Jun 24, 2026

Source label: Sarvam 105B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#116 · Qwen3 Coder Next

AA · Jun 24, 2026

Source label: Qwen3 Coder Next

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.7%

#117 · deepseek-v3.1

AA · Jun 24, 2026

Source label: DeepSeek V3.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.5%

#118 · HyperNova 60B 2605

AA · Jun 24, 2026

Source label: HyperNova 60B 2605

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.3%

#119 · glm-4.5-air

AA · Jun 24, 2026

Source label: GLM-4.5-Air

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.3%

#120 · Hy3-preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.2%

#121 · Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.8%

#122 · Claude Sonnet 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.7%

#123 · Grok Code Fast

AA · Jun 24, 2026

Source label: Grok Code Fast 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.7%

#124 · Qwen3 Omni 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.6%

#125 · Seed-OSS-36B-Instruct

AA · Jun 24, 2026

Source label: Seed-OSS-36B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.6%

#126 · ring-flash-2.0

AA · Jun 24, 2026

Source label: Ring-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.5%

#127 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.4%

#128 · Mi:dm K 2.5 Pro Preview

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.2%

#129 · Ling-1T

AA · Jun 24, 2026

Source label: Ling-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.9%

#130 · DeepSeek V4 Pro (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.7%

#131 · DeepSeek V4 Flash (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.6%

#132 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.4%

#133 · GPT-5.2

AA · Jun 24, 2026

Source label: GPT-5.2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#134 · Qwen3.5 4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#135 · qwen3-vl-235b-a22b-instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#136 · DeepSeek Reasoner

AA · Jun 24, 2026

Source label: DeepSeek R1 (Jan '25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.8%

#137 · Qwen3 30B A3B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.7%

#138 · Mi:dm K 2.5 Pro

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#139 · Gemini 2.0 Flash Thinking Experimental (Jan '25)

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash Thinking Experimental (Jan '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#140 · Claude Opus 4

AA · Jun 24, 2026

Source label: Claude 4 Opus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#141 · Nova 2.0 Omni (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.9%

#142 · Nova 2.0 Lite (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.8%

#143 · Gemini 2.5 Flash Preview (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.8%

#144 · MiniMax M1 80k

AA · Jun 24, 2026

Source label: MiniMax M1 80k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.7%

#145 · Qwen3 VL 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#146 · K-EXAONE (Non-reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#147 · Motif-2-12.7B-Reasoning

AA · Jun 24, 2026

Source label: Motif-2-12.7B-Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#148 · Grok 3

AA · Jun 24, 2026

Source label: Grok 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.3%

#149 · Step3 VL 10B

AA · Jun 24, 2026

Source label: Step3 VL 10B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69%

#150 · Solar Pro 2 (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.7%

#151 · Gemini 2.5 Flash

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.3%

#152 · Claude Sonnet 4

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.3%

#153 · MiniMax M1 40k

AA · Jun 24, 2026

Source label: MiniMax M1 40k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.2%

#154 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68%

#155 · Magistral Medium 1

AA · Jun 24, 2026

Source label: Magistral Medium 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.9%

#156 · JT-MINI

AA · Jun 24, 2026

Source label: JT-MINI

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.6%

#157 · GPT-5

AA · Jun 24, 2026

Source label: GPT-5 (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.3%

#158 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.2%

#159 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.2%

#160 · Qwen3 VL 32B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 32B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.1%

#161 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.1%

#162 · Qwen3 4B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.7%

#163 · GPT-4.1

AA · Jun 24, 2026

Source label: GPT-4.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.6%

#164 · GLM-5 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.6%

#165 · glm-4.7

AA · Jun 24, 2026

Source label: GLM-4.7 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.4%

#166 · GPT-4.1 mini

AA · Jun 24, 2026

Source label: GPT-4.1 mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.4%

#167 · Magistral Small 1.2

AA · Jun 24, 2026

Source label: Magistral Small 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.3%

#168 · Falcon-H1R-7B

AA · Jun 24, 2026

Source label: Falcon-H1R-7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.1%

#169 · Gemma 4 12B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.1%

#170 · Qwen3 30B A3B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.9%

#171 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.8%

#172 · ling-flash-2.0

AA · Jun 24, 2026

Source label: Ling-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.7%

#173 · Solar Open 100B (Reasoning)

AA · Jun 24, 2026

Source label: Solar Open 100B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.7%

#174 · mimo-v2-flash (non-thinking)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.6%

#175 · Claude Sonnet 3.7

AA · Jun 24, 2026

Source label: Claude 3.7 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.6%

#176 · deepseek-v3-0324

AA · Jun 24, 2026

Source label: DeepSeek V3 0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.5%

#177 · Claude Haiku 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.6%

#178 · GPT-5.1

AA · Jun 24, 2026

Source label: GPT-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.3%

#179 · Llama 3.3 Nemotron Super 49B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.3%

#180 · Magistral Small 1

AA · Jun 24, 2026

Source label: Magistral Small 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.1%

#181 · Grok 4.1 Fast

AA · Jun 24, 2026

Source label: Grok 4.1 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.7%

#182 · Nova 2.0 Pro Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.6%

#183 · LongCat Flash Lite

AA · Jun 24, 2026

Source label: LongCat Flash Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.6%

#184 · Sarvam 30B (high)

AA · Jun 24, 2026

Source label: Sarvam 30B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.3%

#185 · glm-4.6

AA · Jun 24, 2026

Source label: GLM-4.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.2%

#186 · EXAONE 4.0 32B (Non-reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.8%

#187 · Gemini 2.0 Flash

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.3%

#188 · Sonar Reasoning

AA · Jun 24, 2026

Source label: Sonar Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.3%

#189 · Gemini 2.0 Pro Experimental

AA · Jun 24, 2026

Source label: Gemini 2.0 Pro Experimental (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.2%

#190 · Qwen3 Omni 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62%

#191 · Qwen3-Coder 480B A35B

AA · Jun 24, 2026

Source label: Qwen3 Coder 480B A35B Instruct

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.8%

#192 · Qwen3 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.6%

#193 · DeepSeek R1 Distill Qwen 32B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.5%

#194 · Qwen3 235B A22B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.3%

#195 · DeepSeek R1 0528 Qwen3 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 0528 Qwen3 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.2%

#196 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.1%

#197 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.6%

#198 · Grok 4 Fast

AA · Jun 24, 2026

Source label: Grok 4 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.6%

#199 · Nova 2.0 Lite (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.3%

#200 · o1 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.3%

#201 · Claude 3.5 Sonnet (Oct '24)

AA · Jun 24, 2026

Source label: Claude 3.5 Sonnet (Oct '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.9%

#202 · Devstral 2

AA · Jun 24, 2026

Source label: Devstral 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.3%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.4%

#203 · Gemini 2.5 Flash Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.4%

#204 · Ling 2.6 Flash

AA · Jun 24, 2026

Source label: Ling 2.6 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.3%

#205 · qwq-32b

AA · Jun 24, 2026

Source label: QwQ 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.3%

#206 · Mistral Medium 3.1

AA · Jun 24, 2026

Source label: Mistral Medium 3.1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.8%

#207 · qwen2.5-max

AA · Jun 24, 2026

Source label: Qwen2.5 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.7%

#208 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.7%

#209 · Qwen3 VL 8B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.9%

#210 · Sonar Pro

AA · Jun 24, 2026

Source label: Sonar Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#211 · Solar Pro 2 (Preview) (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Preview) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#212 · Mistral Medium 3

AA · Jun 24, 2026

Source label: Mistral Medium 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#213 · Gemma 4 E4B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.6%

#214 · phi-4

AA · Jun 24, 2026

Source label: Phi-4

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.5%

#215 · glm-4.5v

AA · Jun 24, 2026

Source label: GLM-4.5V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.3%

#216 · Ministral 3 14B

AA · Jun 24, 2026

Source label: Ministral 3 14B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.2%

#217 · Mistral Small 4

AA · Jun 24, 2026

Source label: Mistral Small 4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.1%

#218 · NVIDIA Nemotron Nano 9B V2 (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57%

#219 · Nova Premier

AA · Jun 24, 2026

Source label: Nova Premier

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.9%

#220 · glm-4.6v

AA · Jun 24, 2026

Source label: GLM-4.6V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.6%

#221 · Ling-mini-2.0

AA · Jun 24, 2026

Source label: Ling-mini-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.2%

#222 · Solar Pro 2 (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.1%

#223 · Claude 3.5 Sonnet (June '24)

AA · Jun 24, 2026

Source label: Claude 3.5 Sonnet (June '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56%

#224 · NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#225 · deepseek-v3

AA · Jun 24, 2026

Source label: DeepSeek V3 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#226 · qwq-32b-preview

AA · Jun 24, 2026

Source label: QwQ 32B-Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#227 · Nova 2.0 Omni (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.5%

#228 · Gemma 4 E4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

54.9%

#229 · Solar Pro 2 (Preview) (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Preview) (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

54.4%

#230 · Qwen3 32B

AA · Jun 24, 2026

Source label: Qwen3 32B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.5%

#231 · Gemini 2.0 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash-Lite (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.5%

#232 · Devstral Small 2

AA · Jun 24, 2026

Source label: Devstral Small 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.2%

#233 · Reka Flash 3

AA · Jun 24, 2026

Source label: Reka Flash 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

52.9%

#234 · Command A+

AA · Jun 24, 2026

Source label: Command A

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

52.7%

#235 · Qwen3 4B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.7%

#236 · Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.7%

#237 · Qwen3 Coder 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Coder 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.6%

#238 · Exaone 4.0 1.2B (Reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#239 · Llama 3.1 Instruct 405B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 405B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#240 · Qwen3 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#241 · LFM2.5-8B-A1B

AA · Jun 24, 2026

Source label: LFM2.5-8B-A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.3%

#242 · NVIDIA Nemotron 3 Nano 4B

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 4B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.3%

#243 · GPT-4.1 nano

AA · Jun 24, 2026

Source label: GPT-4.1 nano

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.2%

#244 · GPT-4o

AA · Jun 24, 2026

Source label: GPT-4o (ChatGPT)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.1%

#245 · Grok 2

AA · Jun 24, 2026

Source label: Grok 2 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51%

#246 · pixtral-large-2411

AA · Jun 24, 2026

Source label: Pixtral Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

50.5%

#247 · Mistral Small 3.2

AA · Jun 24, 2026

Source label: Mistral Small 3.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

50.5%

#248 · Nova Pro

AA · Jun 24, 2026

Source label: Nova Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.9%

#249 · Llama 3.3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.8%

#250 · Qwen3 VL 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.4%

#251 · Devstral Medium

AA · Jun 24, 2026

Source label: Devstral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.2%

#252 · qwen2.5-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.1%

#253 · Claude Opus 3

AA · Jun 24, 2026

Source label: Claude 3 Opus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.9%

#254 · Mistral Large 2 (Nov '24)

AA · Jun 24, 2026

Source label: Mistral Large 2 (Nov '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.6%

#255 · DeepSeek R1 Distill Qwen 14B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 14B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.4%

#256 · Llama Nemotron Super 49B v1.5 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama Nemotron Super 49B v1.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.1%

#257 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.1%

#258 · Gemini 2.5 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash-Lite (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.4%

#259 · LFM2 24B A2B

AA · Jun 24, 2026

Source label: LFM2 24B A2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.4%

#260 · mistral-large-2407

AA · Jun 24, 2026

Source label: Mistral Large 2 (Jul '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.2%

#261 · Sonar

AA · Jun 24, 2026

Source label: Sonar

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#262 · Grok Beta

AA · Jun 24, 2026

Source label: Grok Beta

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#263 · Ministral 3 8B

AA · Jun 24, 2026

Source label: Ministral 3 8B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#264 · Qwen3 14B

AA · Jun 24, 2026

Source label: Qwen3 14B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47%

#265 · Nemotron 3 Nano Omni 30B A3B Reasoning

AA · Jun 24, 2026

Source label: Nemotron 3 Nano Omni 30B A3B Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.9%

#266 · Qwen2.5 Instruct 32B

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.6%

#267 · Llama 3.1 Nemotron Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.5%

#268 · Mistral Small 3

AA · Jun 24, 2026

Source label: Mistral Small 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.2%

#269 · Mistral Small 3.1

AA · Jun 24, 2026

Source label: Mistral Small 3.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.4%

#270 · Qwen3 8B

AA · Jun 24, 2026

Source label: Qwen3 8B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.2%

#271 · glm-4.7-flash

AA · Jun 24, 2026

Source label: GLM-4.7-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.2%

#272 · NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.9%

#273 · Qwen3.5 2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.8%

#274 · Gemma 4 E2B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#275 · Nova Lite

AA · Jun 24, 2026

Source label: Nova Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#276 · granite-4.1-8b

AA · Jun 24, 2026

Source label: Granite 4.1 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#277 · Llama 3.2 Instruct 90B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 90B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.2%

#278 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5 nano (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.8%

#279 · Gemma 3 27B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 27B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.8%

#280 · jamba-1.5-large

AA · Jun 24, 2026

Source label: Jamba 1.5 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.7%

#281 · Qwen3 VL 8B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.7%

#282 · GPT-4o mini

AA · Jun 24, 2026

Source label: GPT-4o mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.6%

#283 · Exaone 4.0 1.2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.4%

#284 · Mistral Saba

AA · Jun 24, 2026

Source label: Mistral Saba

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.4%

#285 · qwen2.5-coder-32b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Coder Instruct 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.7%

#286 · Granite 4.0 H Small

AA · Jun 24, 2026

Source label: Granite 4.0 H Small

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.6%

#287 · Sarvam M (Reasoning)

AA · Jun 24, 2026

Source label: Sarvam M (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.6%

#288 · Devstral Small (Jul '25)

AA · Jun 24, 2026

Source label: Devstral Small (Jul '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.4%

#289 · Kimi Linear 48B A3B Instruct

AA · Jun 24, 2026

Source label: Kimi Linear 48B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.2%

#290 · Qwen2.5 Turbo

AA · Jun 24, 2026

Source label: Qwen2.5 Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41%

#291 · Llama 3.1 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.9%

#292 · Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.8%

#293 · Claude Haiku 3.5

AA · Jun 24, 2026

Source label: Claude 3.5 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.8%

#294 · Gemma 4 E2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.5%

#295 · DeepSeek R1 Distill Llama 70B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.2%

#296 · Claude Sonnet 3

AA · Jun 24, 2026

Source label: Claude 3 Sonnet

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40%

#297 · NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39.9%

#298 · Qwen3 4B

AA · Jun 24, 2026

Source label: Qwen3 4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39.8%

#299 · Jamba 1.7 Large

AA · Jun 24, 2026

Source label: Jamba 1.7 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39%

#300 · Jamba 1.6 Large

AA · Jun 24, 2026

Source label: Jamba 1.6 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

38.7%

#301 · Mistral Small (Sep '24)

AA · Jun 24, 2026

Source label: Mistral Small (Sep '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

38.1%

#302 · Llama 3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.9%

#303 · Claude Haiku 3

AA · Jun 24, 2026

Source label: Claude 3 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.4%

#304 · Gemini 1.5 Pro

AA · Jun 24, 2026

Source label: Gemini 1.5 Pro (May '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#305 · qwen2-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#306 · Qwen3 VL 4B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#307 · Gemini 1.5 Flash 8B

AA · Jun 24, 2026

Source label: Gemini 1.5 Flash-8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.9%

#308 · Nova Micro

AA · Jun 24, 2026

Source label: Nova Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.8%

#309 · Ministral 3 3B

AA · Jun 24, 2026

Source label: Ministral 3 3B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.8%

#310 · Mistral Large (Feb '24)

AA · Jun 24, 2026

Source label: Mistral Large (Feb '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.1%

#311 · mistral-medium

AA · Jun 24, 2026

Source label: Mistral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.9%

#312 · Gemma 3 12B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 12B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.9%

#313 · Claude 2.0

AA · Jun 24, 2026

Source label: Claude 2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.4%

#314 · LFM2 8B A1B

AA · Jun 24, 2026

Source label: LFM2 8B A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.4%

#315 · LFM2.5-1.2B-Thinking

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.9%

#316 · Qwen2.5 Coder Instruct 7B

AA · Jun 24, 2026

Source label: Qwen2.5 Coder Instruct 7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.9%

#317 · Granite 3.3 8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Granite 3.3 8B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.8%

#318 · Granite 4.0 Micro

AA · Jun 24, 2026

Source label: Granite 4.0 Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.6%

#319 · Jamba Reasoning 3B

AA · Jun 24, 2026

Source label: Jamba Reasoning 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.3%

#320 · Mixtral 8x22B Instruct

AA · Jun 24, 2026

Source label: Mixtral 8x22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.2%

#321 · Phi-4 Mini Instruct

AA · Jun 24, 2026

Source label: Phi-4 Mini Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.1%

#322 · DBRX Instruct

AA · Jun 24, 2026

Source label: DBRX Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.1%

#323 · Claude Instant

AA · Jun 24, 2026

Source label: Claude Instant

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33%

#324 · LFM 40B

AA · Jun 24, 2026

Source label: LFM 40B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.7%

#325 · Llama 2 Chat 70B

AA · Jun 24, 2026

Source label: Llama 2 Chat 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.7%

#326 · LFM2.5-1.2B-Instruct

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.6%

#327 · Gemini 1.5 Flash

AA · Jun 24, 2026

Source label: Gemini 1.5 Flash (May '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.4%

#328 · Command-R+ (Apr '24)

AA · Jun 24, 2026

Source label: Command-R+ (Apr '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.3%

#329 · Jamba 1.7 Mini

AA · Jun 24, 2026

Source label: Jamba 1.7 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.2%

#330 · Llama 2 Chat 13B

AA · Jun 24, 2026

Source label: Llama 2 Chat 13B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.1%

#331 · Claude 2.1

AA · Jun 24, 2026

Source label: Claude 2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#332 · DeepSeek Coder V2 Lite Instruct

AA · Jun 24, 2026

Source label: DeepSeek Coder V2 Lite Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#333 · Phi-3 Mini Instruct 3.8B

AA · Jun 24, 2026

Source label: Phi-3 Mini Instruct 3.8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#334 · Phi-4 Multimodal Instruct

AA · Jun 24, 2026

Source label: Phi-4 Multimodal Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.5%

#335 · Granite 4.1 3B

AA · Jun 24, 2026

Source label: Granite 4.1 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.4%

#336 · LFM2 2.6B

AA · Jun 24, 2026

Source label: LFM2 2.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.6%

#337 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.5%

#338 · Tiny Aya Global

AA · Jun 24, 2026

Source label: Tiny Aya Global

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.5%

#339 · DeepSeek R1 Distill Llama 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#340 · Mistral Small (Feb '24)

AA · Jun 24, 2026

Source label: Mistral Small (Feb '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#341 · jamba-1.5-mini

AA · Jun 24, 2026

Source label: Jamba 1.5 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#342 · Jamba 1.6 Mini

AA · Jun 24, 2026

Source label: Jamba 1.6 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30%

#343 · GPT-3.5 Turbo

AA · Jun 24, 2026

Source label: GPT-3.5 Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.7%

#344 · Gemma 3n E4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.6%

#345 · Llama 3 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.6%

#346 · Mixtral 8x7B Instruct

AA · Jun 24, 2026

Source label: Mixtral 8x7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.2%

#347 · Gemma 3 4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.1%

#348 · LFM2.5-VL-1.6B

AA · Jun 24, 2026

Source label: LFM2.5-VL-1.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.9%

#349 · qwen1.5-110b-chat

AA · Jun 24, 2026

Source label: Qwen1.5 Chat 110B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.9%

#350 · Command-R (Mar '24)

AA · Jun 24, 2026

Source label: Command-R (Mar '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.4%

#351 · Qwen3 1.7B

AA · Jun 24, 2026

Source label: Qwen3 1.7B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.3%

#352 · Granite 4.0 1B

AA · Jun 24, 2026

Source label: Granite 4.0 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.1%

#353 · MiniCPM5-1B (Reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.8%

#354 · Gemma 3n E4B Instruct Preview (May '25)

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct Preview (May '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.8%

#355 · Gemini 1.0 Pro

AA · Jun 24, 2026

Source label: Gemini 1.0 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.7%

#356 · Apertus 70B Instruct

AA · Jun 24, 2026

Source label: Apertus 70B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.2%

#357 · MiniCPM5-1B (Non-reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.9%

#358 · Granite 4.0 H 1B

AA · Jun 24, 2026

Source label: Granite 4.0 H 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.3%

#359 · Granite 4.0 350M

AA · Jun 24, 2026

Source label: Granite 4.0 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.1%

#360 · Llama 3.1 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.9%

#361 · Granite 4.0 H 350M

AA · Jun 24, 2026

Source label: Granite 4.0 H 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.7%

#362 · Apertus 8B Instruct

AA · Jun 24, 2026

Source label: Apertus 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.6%

#363 · Llama 3.2 Instruct 3B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.5%

#364 · Gemma 3 1B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 1B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23.7%

#365 · Qwen3 0.6B

AA · Jun 24, 2026

Source label: Qwen3 0.6B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23.1%

#366 · openchat-3.5

AA · Jun 24, 2026

Source label: OpenChat 3.5 (1210)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23%

#367 · Gemma 3n E2B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E2B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.9%

#368 · LFM2 1.2B

AA · Jun 24, 2026

Source label: LFM2 1.2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.8%

#369 · Llama 2 Chat 7B

AA · Jun 24, 2026

Source label: Llama 2 Chat 7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.7%

#370 · Gemma 3 270M

AA · Jun 24, 2026

Source label: Gemma 3 270M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.4%

#371 · Llama 3.2 Instruct 11B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 11B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.1%

#372 · Llama 3.2 Instruct 1B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

19.6%

#373 · mistral-7b-instruct

AA · Jun 24, 2026

Source label: Mistral 7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

17.7%

#374 · Qwen3.5 0.8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 0.8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

11.1%

#375 · DeepSeek R1 Distill Qwen 1.5B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 1.5B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

9.8%

Benchmarks · /benchmarks/artificial-analysis-gpqa

GPQA

GPQA result as reported through Artificial Analysis.

Source · Artificial Analysis
Version · artificial-analysis snapshot 2026-06-24
Scores · 375

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Artificial Analysis

metric

Accuracy (%)

judge

Objective

direction

higher better

group id

aa_gpqa_current

domain

Reasoning / math / science

What it measures vs what it misses

✓ Measures

Graduate-level scientific reasoning.

✗ Misses

Adjacent capabilities, subjective preference, latency, and cost.

Leaderboard · this benchmark version

#1 · Gemini 3.1 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 100%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

94.1%

#2 · minimax-m3

AA · Jun 24, 2026

Source label: MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.9%

#3 · Claude Fable 5

AA · Jun 24, 2026

Source label: Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.6%

#4 · Qwen3.7 Max

AA · Jun 24, 2026

Source label: Qwen3.7 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 99.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92.3%

#5 · Claude Opus 4.8

AA · Jun 24, 2026

Source label: Claude Opus 4.8 (Adaptive Reasoning, Max Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

92%

#6 · Qwen3.7 Plus

AA · Jun 24, 2026

Source label: Qwen3.7 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

90%

#7 · Kimi K2.7 Code

AA · Jun 24, 2026

Source label: Kimi K2.7 Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.6%

#8 · grok-build-0-1-06-16

AA · Jun 24, 2026

Source label: Grok Build 0.1 0616

verified runtimeexact direct

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: headline eligible
Identity: exact (1.00)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.5%

#9 · GLM-5.2 (max)

AA · Jun 24, 2026

Source label: GLM-5.2 (max)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 98.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

89.5%

#10 · deepseek-v4-pro

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Reasoning, Max Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.8%

#11 · Qwen3.6 Max Preview

AA · Jun 24, 2026

Source label: Qwen3.6 Max Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.8%

#12 · Gemini 3 Pro Preview

AA · Jun 24, 2026

Source label: Gemini 3 Pro Preview (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 97.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.7%

#13 · Claude Opus 4.7

AA · Jun 24, 2026

Source label: Claude Opus 4.7 (Non-reasoning, High Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.5%

#14 · muse-spark

AA · Jun 24, 2026

Source label: Muse Spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.4%

#15 · qwen3.6-plus

AA · Jun 24, 2026

Source label: Qwen3.6 Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

88.2%

#16 · Grok 4

AA · Jun 24, 2026

Source label: Grok 4

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 96%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.7%

#17 · minimax-m2.7

AA · Jun 24, 2026

Source label: MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.4%

#18 · DeepSeek V3.2 Speciale

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Speciale

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87.1%

#19 · mimo-v2-pro

AA · Jun 24, 2026

Source label: MiMo-V2-Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 95.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

87%

#20 · glm-5.1

AA · Jun 24, 2026

Source label: GLM-5.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.8%

#21 · deepseek-v4-flash

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#22 · Nemotron 3 Ultra 550B A55B (Reasoning)

AA · Jun 24, 2026

Source label: Nemotron 3 Ultra 550B A55B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#23 · Hy3-preview (Reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 94.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.7%

#24 · Qwen3.5 397B A17B

AA · Jun 24, 2026

Source label: Qwen3.5 397B A17B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

86.1%

#25 · Ring-2.6-1T

AA · Jun 24, 2026

Source label: Ring-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

85.7%

#26 · MiMo-V2-Omni-0327

AA · Jun 24, 2026

Source label: MiMo-V2-Omni-0327

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

85.5%

#27 · mimo-v2.5

AA · Jun 24, 2026

Source label: MiMo-V2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.9%

#28 · Nanbeige4.1-3B

AA · Jun 24, 2026

Source label: Nanbeige4.1-3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 93%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.9%

#29 · minimax-m2.5

AA · Jun 24, 2026

Source label: MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.8%

#30 · GLM 5 Turbo

AA · Jun 24, 2026

Source label: GLM-5-Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92.2%
Last updated: recent
Eligibility: Benchmark-derived GLM 5 Turbo is visible for receipts but excluded from default overall rankings.
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.7%

#31 · MiMo-V2-Flash (Reasoning)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 92%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.6%

#32 · gpt-5.5-instant

AA · Jun 24, 2026

Source label: GPT-5.5 Instant (May 2026)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.6%

#33 · o3-pro

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.5%

#34 · Qwen3.5 27B

AA · Jun 24, 2026

Source label: Qwen3.5 27B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.2%

#35 · Qwen3.6 27B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 91.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.2%

#36 · Qwen3.6 35B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84.1%

#37 · Claude Opus 4.6

AA · Jun 24, 2026

Source label: Claude Opus 4.6 (Non-reasoning, High Effort)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

84%

#38 · GLM-5.1 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 90.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.9%

#39 · Kimi K2 Thinking

AA · Jun 24, 2026

Source label: Kimi K2 Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.8%

#40 · GPT-5.3 Codex

AA · Jun 24, 2026

Source label: GPT-5 Codex (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.6%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.7%

#41 · Gemini 2.5 Pro Preview (Mar' 25)

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro Preview (Mar' 25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.6%

#42 · Step 3.5 Flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 89%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83.1%

#43 · MiniMax-M2.1

AA · Jun 24, 2026

Source label: MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

83%

#44 · JT-35B-Flash

AA · Jun 24, 2026

Source label: JT-35B-Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.9%

#45 · Qwen3.6 27B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 27B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.9%

#46 · Gemini 3.5 Flash

AA · Jun 24, 2026

Source label: Gemini 3.5 Flash (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.8%

#47 · mimo-v2-omni

AA · Jun 24, 2026

Source label: MiMo-V2-Omni

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 88%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.8%

#48 · Qwen3.5 122B A10B

AA · Jun 24, 2026

Source label: Qwen3.5 122B A10B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.7%

#49 · o3

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 87.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.7%

#50 · step-3.5-flash

AA · Jun 24, 2026

Source label: Step 3.5 Flash 2603

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.6%

#51 · Qwen3.5 Omni Plus

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.6%

#52 · Gemini 2.5 Pro

AA · Jun 24, 2026

Source label: Gemini 2.5 Pro Preview (May' 25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.2%

#53 · Gemini 3.1 Flash-Lite Preview

AA · Jun 24, 2026

Source label: Gemini 3.1 Flash-Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 86.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82.2%

#54 · glm-5

AA · Jun 24, 2026

Source label: GLM-5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

82%

#55 · Qwen3.5 35B A3B

AA · Jun 24, 2026

Source label: Qwen3.5 35B A3B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.9%

#56 · Qwen3.6 35B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.6 35B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.7%

#57 · Gemini 3 Flash

AA · Jun 24, 2026

Source label: Gemini 3 Flash Preview (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 85%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.2%

#58 · Nova 2.0 Lite (high)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.1%

#59 · ERNIE 4.5 300B A47B

AA · Jun 24, 2026

Source label: ERNIE 4.5 300B A47B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81.1%

#60 · Claude Opus 4.5

AA · Jun 24, 2026

Source label: Claude Opus 4.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

81%

#61 · Step 3.7 Flash

AA · Jun 24, 2026

Source label: Step 3.7 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#62 · glm-5v-turbo

AA · Jun 24, 2026

Source label: GLM 5V Turbo (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 84%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#63 · Claude Opus 4.1

AA · Jun 24, 2026

Source label: Claude 4.1 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80.9%

#64 · nvidia-nemotron-3-super-120b-a12b

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 83.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

80%

#65 · Claude Sonnet 4.6

AA · Jun 24, 2026

Source label: Claude Sonnet 4.6 (Non-reasoning, Low Effort)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.7%

#66 · Claude 4 Opus (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Opus (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.6%

#67 · EXAONE 4.5 33B

AA · Jun 24, 2026

Source label: EXAONE 4.5 33B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.4%

#68 · Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 82.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.3%

#69 · Grok 3 mini Reasoning (high)

AA · Jun 24, 2026

Source label: Grok 3 mini Reasoning (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79.1%

#70 · Qwen3 235B A22B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

79%

#71 · Kimi K2.5 (Reasoning)

AA · Jun 24, 2026

Source label: Kimi K2.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.9%

#72 · kimi-k2.6

AA · Jun 24, 2026

Source label: Kimi K2.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 81%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.8%

#73 · Qwen3.5 9B

AA · Jun 24, 2026

Source label: Qwen3.5 9B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.6%

#74 · Grok 4.20 0309 (Non-reasoning)

AA · Jun 24, 2026

Source label: Grok 4.20 0309 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.5%

#75 · Nova 2.0 Pro Preview (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 80.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.5%

#76 · o4 mini

AA · Jun 24, 2026

Source label: o4-mini (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.4%

#77 · K-EXAONE (Reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.3%

#78 · glm-4.5

AA · Jun 24, 2026

Source label: GLM-4.5 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

78.2%

#79 · Claude 4 Sonnet (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#80 · minimax-m2

AA · Jun 24, 2026

Source label: MiniMax-M2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#81 · ERNIE 5.0 Thinking Preview

AA · Jun 24, 2026

Source label: ERNIE 5.0 Thinking Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 79.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.7%

#82 · Grok 4.20

AA · Jun 24, 2026

Source label: Grok 4.20 0309 v2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.6%

#83 · Qwen3 Max Thinking

AA · Jun 24, 2026

Source label: Qwen3 Max Thinking (Preview)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 78.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.6%

#84 · Ring-1T

AA · Jun 24, 2026

Source label: Ring-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.4%

#85 · Qwen3 VL 235B A22B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.2%

#86 · Qwen3.5 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77.1%

#87 · mercury-2

AA · Jun 24, 2026

Source label: Mercury 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 77%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

77%

#88 · GPT-5.5

AA · Jun 24, 2026

Source label: GPT-5.5 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.8%

#89 · Nova 2.0 Lite (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.8%

#90 · Kimi K2 0905

AA · Jun 24, 2026

Source label: Kimi K2 0905

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 76.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.7%

#91 · Kimi K2

AA · Jun 24, 2026

Source label: Kimi K2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.6%

#92 · Qwen3 Max

AA · Jun 24, 2026

Source label: Qwen3 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.4%

#93 · Doubao Seed Code

AA · Jun 24, 2026

Source label: Doubao Seed Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.4%

#94 · gemma-4-31b

AA · Jun 24, 2026

Source label: Gemma 4 31B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 75.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.3%

#95 · mimo-v2.5-pro

AA · Jun 24, 2026

Source label: MiMo-V2.5-Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.2%

#96 · intellect-3

AA · Jun 24, 2026

Source label: INTELLECT-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76.1%

#97 · Nova 2.0 Omni (medium)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (medium)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

76%

#98 · Nemotron Cascade 2 30B A3B

AA · Jun 24, 2026

Source label: Nemotron Cascade 2 30B A3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 74.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.8%

#99 · North Mini Code

AA · Jun 24, 2026

Source label: North Mini Code

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.7%

#100 · qwen3-235b-a22b-instruct-2507

AA · Jun 24, 2026

Source label: Qwen3 235B A22B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.3%

#101 · Gemma 4 12B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.3%

#102 · Ling-2.6-1T

AA · Jun 24, 2026

Source label: Ling-2.6-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.2%

#103 · trinity-large-thinking

AA · Jun 24, 2026

Source label: Trinity Large Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 73%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.2%

#104 · DeepSeek Chat

AA · Jun 24, 2026

Source label: DeepSeek V3.2 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.1%

#105 · deepseek-v3.1-terminus

AA · Jun 24, 2026

Source label: DeepSeek V3.1 Terminus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 72.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

75.1%

#106 · mistral-medium-3.5

AA · Jun 24, 2026

Source label: Mistral Medium 3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#107 · GPT-5.4

AA · Jun 24, 2026

Source label: GPT-5.4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#108 · o3 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.8%

#109 · o1

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 71.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.7%

#110 · Qwen3.5 Omni Flash

AA · Jun 24, 2026

Source label: Qwen3.5 Omni Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

74.2%

#111 · Magistral Medium 1.2

AA · Jun 24, 2026

Source label: Magistral Medium 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.9%

#112 · EXAONE 4.0 32B (Reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.9%

#113 · DeepSeek V3.2 Exp

AA · Jun 24, 2026

Source label: DeepSeek V3.2 Exp (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#114 · qwen3-next-80b-a3b-instruct

AA · Jun 24, 2026

Source label: Qwen3 Next 80B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#115 · Sarvam 105B (high)

AA · Jun 24, 2026

Source label: Sarvam 105B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 70.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.8%

#116 · Qwen3 Coder Next

AA · Jun 24, 2026

Source label: Qwen3 Coder Next

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.7%

#117 · deepseek-v3.1

AA · Jun 24, 2026

Source label: DeepSeek V3.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 69%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.5%

#118 · HyperNova 60B 2605

AA · Jun 24, 2026

Source label: HyperNova 60B 2605

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.3%

#119 · glm-4.5-air

AA · Jun 24, 2026

Source label: GLM-4.5-Air

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.3%

#120 · Hy3-preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Hy3-preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 68.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

73.2%

#121 · Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.8%

#122 · Claude Sonnet 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.7%

#123 · Grok Code Fast

AA · Jun 24, 2026

Source label: Grok Code Fast 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.6%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.7%

#124 · Qwen3 Omni 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.6%

#125 · Seed-OSS-36B-Instruct

AA · Jun 24, 2026

Source label: Seed-OSS-36B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 67.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.6%

#126 · ring-flash-2.0

AA · Jun 24, 2026

Source label: Ring-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.5%

#127 · Solar Pro 3

AA · Jun 24, 2026

Source label: Solar Pro 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.4%

#128 · Mi:dm K 2.5 Pro Preview

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 66%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

72.2%

#129 · Ling-1T

AA · Jun 24, 2026

Source label: Ling-1T

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.9%

#130 · DeepSeek V4 Pro (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Pro (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.7%

#131 · DeepSeek V4 Flash (Non-reasoning)

AA · Jun 24, 2026

Source label: DeepSeek V4 Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.6%

#132 · Gemma 4 26B A4B

AA · Jun 24, 2026

Source label: Gemma 4 26B A4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 65%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.4%

#133 · GPT-5.2

AA · Jun 24, 2026

Source label: GPT-5.2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#134 · Qwen3.5 4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#135 · qwen3-vl-235b-a22b-instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 235B A22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 64.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

71.2%

#136 · DeepSeek Reasoner

AA · Jun 24, 2026

Source label: DeepSeek R1 (Jan '25)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.8%

#137 · Qwen3 30B A3B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.7%

#138 · Mi:dm K 2.5 Pro

AA · Jun 24, 2026

Source label: Mi:dm K 2.5 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#139 · Gemini 2.0 Flash Thinking Experimental (Jan '25)

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash Thinking Experimental (Jan '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#140 · Claude Opus 4

AA · Jun 24, 2026

Source label: Claude 4 Opus (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 63.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

70.1%

#141 · Nova 2.0 Omni (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.9%

#142 · Nova 2.0 Lite (low)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.8%

#143 · Gemini 2.5 Flash Preview (Reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 62.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.8%

#144 · MiniMax M1 80k

AA · Jun 24, 2026

Source label: MiniMax M1 80k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.7%

#145 · Qwen3 VL 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#146 · K-EXAONE (Non-reasoning)

AA · Jun 24, 2026

Source label: K-EXAONE (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#147 · Motif-2-12.7B-Reasoning

AA · Jun 24, 2026

Source label: Motif-2-12.7B-Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 61.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.5%

#148 · Grok 3

AA · Jun 24, 2026

Source label: Grok 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69.3%

#149 · Step3 VL 10B

AA · Jun 24, 2026

Source label: Step3 VL 10B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

69%

#150 · Solar Pro 2 (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 60.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.7%

#151 · Gemini 2.5 Flash

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.3%

#152 · Claude Sonnet 4

AA · Jun 24, 2026

Source label: Claude 4 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.3%

#153 · MiniMax M1 40k

AA · Jun 24, 2026

Source label: MiniMax M1 40k

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68.2%

#154 · Mistral Large 3

AA · Jun 24, 2026

Source label: Mistral Large 3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 59.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

68%

#155 · Magistral Medium 1

AA · Jun 24, 2026

Source label: Magistral Medium 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.9%

#156 · JT-MINI

AA · Jun 24, 2026

Source label: JT-MINI

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.6%

#157 · GPT-5

AA · Jun 24, 2026

Source label: GPT-5 (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.3%

#158 · GPT-OSS 120B

AA · Jun 24, 2026

Source label: gpt-oss-120b (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.2%

#159 · Claude 4.5 Haiku (Reasoning)

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 58%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.2%

#160 · Qwen3 VL 32B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 32B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.1%

#161 · Llama 4 Maverick

AA · Jun 24, 2026

Source label: Llama 4 Maverick

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

67.1%

#162 · Qwen3 4B 2507 (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 57%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.7%

#163 · GPT-4.1

AA · Jun 24, 2026

Source label: GPT-4.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.6%

#164 · GLM-5 (Non-reasoning)

AA · Jun 24, 2026

Source label: GLM-5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.6%

#165 · glm-4.7

AA · Jun 24, 2026

Source label: GLM-4.7 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.4%

#166 · GPT-4.1 mini

AA · Jun 24, 2026

Source label: GPT-4.1 mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 56.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.4%

#167 · Magistral Small 1.2

AA · Jun 24, 2026

Source label: Magistral Small 1.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.3%

#168 · Falcon-H1R-7B

AA · Jun 24, 2026

Source label: Falcon-H1R-7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.1%

#169 · Gemma 4 12B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 12B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 55.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

66.1%

#170 · Qwen3 30B A3B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 30B A3B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.9%

#171 · Grok 4.3

AA · Jun 24, 2026

Source label: Grok 4.3 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.8%

#172 · ling-flash-2.0

AA · Jun 24, 2026

Source label: Ling-flash-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.7%

#173 · Solar Open 100B (Reasoning)

AA · Jun 24, 2026

Source label: Solar Open 100B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 54.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.7%

#174 · mimo-v2-flash (non-thinking)

AA · Jun 24, 2026

Source label: MiMo-V2-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.6%

#175 · Claude Sonnet 3.7

AA · Jun 24, 2026

Source label: Claude 3.7 Sonnet (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.6%

#176 · deepseek-v3-0324

AA · Jun 24, 2026

Source label: DeepSeek V3 0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 53.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

65.5%

#177 · Claude Haiku 4.5

AA · Jun 24, 2026

Source label: Claude 4.5 Haiku (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.6%

#178 · GPT-5.1

AA · Jun 24, 2026

Source label: GPT-5.1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.3%

#179 · Llama 3.3 Nemotron Super 49B v1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.3%

#180 · Magistral Small 1

AA · Jun 24, 2026

Source label: Magistral Small 1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 52.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

64.1%

#181 · Grok 4.1 Fast

AA · Jun 24, 2026

Source label: Grok 4.1 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.7%

#182 · Nova 2.0 Pro Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Pro Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.6%

#183 · LongCat Flash Lite

AA · Jun 24, 2026

Source label: LongCat Flash Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.6%

#184 · Sarvam 30B (high)

AA · Jun 24, 2026

Source label: Sarvam 30B (high)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.3%

#185 · glm-4.6

AA · Jun 24, 2026

Source label: GLM-4.6 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

63.2%

#186 · EXAONE 4.0 32B (Non-reasoning)

AA · Jun 24, 2026

Source label: EXAONE 4.0 32B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.8%

#187 · Gemini 2.0 Flash

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.3%

#188 · Sonar Reasoning

AA · Jun 24, 2026

Source label: Sonar Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 50.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.3%

#189 · Gemini 2.0 Pro Experimental

AA · Jun 24, 2026

Source label: Gemini 2.0 Pro Experimental (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62.2%

#190 · Qwen3 Omni 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Omni 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

62%

#191 · Qwen3-Coder 480B A35B

AA · Jun 24, 2026

Source label: Qwen3 Coder 480B A35B Instruct

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 49.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.8%

#192 · Qwen3 30B A3B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.6%

#193 · DeepSeek R1 Distill Qwen 32B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.5%

#194 · Qwen3 235B A22B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 235B A22B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.3%

#195 · DeepSeek R1 0528 Qwen3 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 0528 Qwen3 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 48.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.2%

#196 · GPT-OSS 20B

AA · Jun 24, 2026

Source label: gpt-oss-20B (low)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

61.1%

#197 · GPT-5.4 mini

AA · Jun 24, 2026

Source label: GPT-5.4 mini (Non-Reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.6%

#198 · Grok 4 Fast

AA · Jun 24, 2026

Source label: Grok 4 Fast (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.6%

#199 · Nova 2.0 Lite (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Lite (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.3%

#200 · o1 mini

AA · Jun 24, 2026

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 47.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

60.3%

#201 · Claude 3.5 Sonnet (Oct '24)

AA · Jun 24, 2026

Source label: Claude 3.5 Sonnet (Oct '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.9%

#202 · Devstral 2

AA · Jun 24, 2026

Source label: Devstral 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.3%
Last updated: recent
Eligibility: specialized_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.4%

#203 · Gemini 2.5 Flash Preview (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash Preview (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 46.3%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.4%

#204 · Ling 2.6 Flash

AA · Jun 24, 2026

Source label: Ling 2.6 Flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.3%

#205 · qwq-32b

AA · Jun 24, 2026

Source label: QwQ 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

59.3%

#206 · Mistral Medium 3.1

AA · Jun 24, 2026

Source label: Mistral Medium 3.1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 45.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.8%

#207 · qwen2.5-max

AA · Jun 24, 2026

Source label: Qwen2.5 Max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.7%

#208 · Llama 4 Scout

AA · Jun 24, 2026

Source label: Llama 4 Scout

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

58.7%

#209 · Qwen3 VL 8B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.9%

#210 · Sonar Pro

AA · Jun 24, 2026

Source label: Sonar Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#211 · Solar Pro 2 (Preview) (Reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Preview) (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#212 · Mistral Medium 3

AA · Jun 24, 2026

Source label: Mistral Medium 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 44.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.8%

#213 · Gemma 4 E4B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.6%

#214 · phi-4

AA · Jun 24, 2026

Source label: Phi-4

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 43%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.5%

#215 · glm-4.5v

AA · Jun 24, 2026

Source label: GLM-4.5V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.3%

#216 · Ministral 3 14B

AA · Jun 24, 2026

Source label: Ministral 3 14B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.2%

#217 · Mistral Small 4

AA · Jun 24, 2026

Source label: Mistral Small 4 (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57.1%

#218 · NVIDIA Nemotron Nano 9B V2 (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 42%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

57%

#219 · Nova Premier

AA · Jun 24, 2026

Source label: Nova Premier

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.9%

#220 · glm-4.6v

AA · Jun 24, 2026

Source label: GLM-4.6V (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.6%

#221 · Ling-mini-2.0

AA · Jun 24, 2026

Source label: Ling-mini-2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 41.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.2%

#222 · Solar Pro 2 (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56.1%

#223 · Claude 3.5 Sonnet (June '24)

AA · Jun 24, 2026

Source label: Claude 3.5 Sonnet (June '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

56%

#224 · NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#225 · deepseek-v3

AA · Jun 24, 2026

Source label: DeepSeek V3 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 40.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#226 · qwq-32b-preview

AA · Jun 24, 2026

Source label: QwQ 32B-Preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.7%

#227 · Nova 2.0 Omni (Non-reasoning)

AA · Jun 24, 2026

Source label: Nova 2.0 Omni (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

55.5%

#228 · Gemma 4 E4B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E4B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

54.9%

#229 · Solar Pro 2 (Preview) (Non-reasoning)

AA · Jun 24, 2026

Source label: Solar Pro 2 (Preview) (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 39%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

54.4%

#230 · Qwen3 32B

AA · Jun 24, 2026

Source label: Qwen3 32B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.5%

#231 · Gemini 2.0 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.0 Flash-Lite (Feb '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.5%

#232 · Devstral Small 2

AA · Jun 24, 2026

Source label: Devstral Small 2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

53.2%

#233 · Reka Flash 3

AA · Jun 24, 2026

Source label: Reka Flash 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 38%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

52.9%

#234 · Command A+

AA · Jun 24, 2026

Source label: Command A

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

52.7%

#235 · Qwen3 4B 2507 Instruct

AA · Jun 24, 2026

Source label: Qwen3 4B 2507 Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.7%

#236 · Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 37.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.7%

#237 · Qwen3 Coder 30B A3B Instruct

AA · Jun 24, 2026

Source label: Qwen3 Coder 30B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.6%

#238 · Exaone 4.0 1.2B (Reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#239 · Llama 3.1 Instruct 405B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 405B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#240 · Qwen3 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 36.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.5%

#241 · LFM2.5-8B-A1B

AA · Jun 24, 2026

Source label: LFM2.5-8B-A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.3%

#242 · NVIDIA Nemotron 3 Nano 4B

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 4B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.3%

#243 · GPT-4.1 nano

AA · Jun 24, 2026

Source label: GPT-4.1 nano

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.2%

#244 · GPT-4o

AA · Jun 24, 2026

Source label: GPT-4o (ChatGPT)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 35%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51.1%

#245 · Grok 2

AA · Jun 24, 2026

Source label: Grok 2 (Dec '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

51%

#246 · pixtral-large-2411

AA · Jun 24, 2026

Source label: Pixtral Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

50.5%

#247 · Mistral Small 3.2

AA · Jun 24, 2026

Source label: Mistral Small 3.2

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

50.5%

#248 · Nova Pro

AA · Jun 24, 2026

Source label: Nova Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 34%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.9%

#249 · Llama 3.3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.8%

#250 · Qwen3 VL 4B (Reasoning)

AA · Jun 24, 2026

Source label: Qwen3 VL 4B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.4%

#251 · Devstral Medium

AA · Jun 24, 2026

Source label: Devstral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 33.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.2%

#252 · qwen2.5-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

49.1%

#253 · Claude Opus 3

AA · Jun 24, 2026

Source label: Claude 3 Opus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.9%

#254 · Mistral Large 2 (Nov '24)

AA · Jun 24, 2026

Source label: Mistral Large 2 (Nov '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.6%

#255 · DeepSeek R1 Distill Qwen 14B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 14B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 32.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.4%

#256 · Llama Nemotron Super 49B v1.5 (Non-reasoning)

AA · Jun 24, 2026

Source label: Llama Nemotron Super 49B v1.5 (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.1%

#257 · Granite 4.1 30B

AA · Jun 24, 2026

Source label: Granite 4.1 30B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

48.1%

#258 · Gemini 2.5 Flash-Lite

AA · Jun 24, 2026

Source label: Gemini 2.5 Flash-Lite (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.4%

#259 · LFM2 24B A2B

AA · Jun 24, 2026

Source label: LFM2 24B A2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 31.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.4%

#260 · mistral-large-2407

AA · Jun 24, 2026

Source label: Mistral Large 2 (Jul '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.2%

#261 · Sonar

AA · Jun 24, 2026

Source label: Sonar

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#262 · Grok Beta

AA · Jun 24, 2026

Source label: Grok Beta

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#263 · Ministral 3 8B

AA · Jun 24, 2026

Source label: Ministral 3 8B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 30.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47.1%

#264 · Qwen3 14B

AA · Jun 24, 2026

Source label: Qwen3 14B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

47%

#265 · Nemotron 3 Nano Omni 30B A3B Reasoning

AA · Jun 24, 2026

Source label: Nemotron 3 Nano Omni 30B A3B Reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.9%

#266 · Qwen2.5 Instruct 32B

AA · Jun 24, 2026

Source label: Qwen2.5 Instruct 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 29.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.6%

#267 · Llama 3.1 Nemotron Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.5%

#268 · Mistral Small 3

AA · Jun 24, 2026

Source label: Mistral Small 3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

46.2%

#269 · Mistral Small 3.1

AA · Jun 24, 2026

Source label: Mistral Small 3.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.4%

#270 · Qwen3 8B

AA · Jun 24, 2026

Source label: Qwen3 8B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 28.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.2%

#271 · glm-4.7-flash

AA · Jun 24, 2026

Source label: GLM-4.7-Flash (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

45.2%

#272 · NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.9%

#273 · Qwen3.5 2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.8%

#274 · Gemma 4 E2B (Reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#275 · Nova Lite

AA · Jun 24, 2026

Source label: Nova Lite

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#276 · granite-4.1-8b

AA · Jun 24, 2026

Source label: Granite 4.1 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 27%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.3%

#277 · Llama 3.2 Instruct 90B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 90B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 26.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

43.2%

#278 · GPT-5.4 nano

AA · Jun 24, 2026

Source label: GPT-5 nano (minimal)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.8%

#279 · Gemma 3 27B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 27B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.8%

#280 · jamba-1.5-large

AA · Jun 24, 2026

Source label: Jamba 1.5 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.7%

#281 · Qwen3 VL 8B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 25.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.7%

#282 · GPT-4o mini

AA · Jun 24, 2026

Source label: GPT-4o mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.6%

#283 · Exaone 4.0 1.2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Exaone 4.0 1.2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.4%

#284 · Mistral Saba

AA · Jun 24, 2026

Source label: Mistral Saba

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

42.4%

#285 · qwen2.5-coder-32b-instruct

AA · Jun 24, 2026

Source label: Qwen2.5 Coder Instruct 32B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 24.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.7%

#286 · Granite 4.0 H Small

AA · Jun 24, 2026

Source label: Granite 4.0 H Small

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.6%

#287 · Sarvam M (Reasoning)

AA · Jun 24, 2026

Source label: Sarvam M (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.6%

#288 · Devstral Small (Jul '25)

AA · Jun 24, 2026

Source label: Devstral Small (Jul '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.4%

#289 · Kimi Linear 48B A3B Instruct

AA · Jun 24, 2026

Source label: Kimi Linear 48B A3B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 23%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41.2%

#290 · Qwen2.5 Turbo

AA · Jun 24, 2026

Source label: Qwen2.5 Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

41%

#291 · Llama 3.1 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.9%

#292 · Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

AA · Jun 24, 2026

Source label: Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.8%

#293 · Claude Haiku 3.5

AA · Jun 24, 2026

Source label: Claude 3.5 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 22.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.8%

#294 · Gemma 4 E2B (Non-reasoning)

AA · Jun 24, 2026

Source label: Gemma 4 E2B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.5%

#295 · DeepSeek R1 Distill Llama 70B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40.2%

#296 · Claude Sonnet 3

AA · Jun 24, 2026

Source label: Claude 3 Sonnet

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 21.1%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

40%

#297 · NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

AA · Jun 24, 2026

Source label: NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39.9%

#298 · Qwen3 4B

AA · Jun 24, 2026

Source label: Qwen3 4B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39.8%

#299 · Jamba 1.7 Large

AA · Jun 24, 2026

Source label: Jamba 1.7 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

39%

#300 · Jamba 1.6 Large

AA · Jun 24, 2026

Source label: Jamba 1.6 Large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 20.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

38.7%

#301 · Mistral Small (Sep '24)

AA · Jun 24, 2026

Source label: Mistral Small (Sep '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

38.1%

#302 · Llama 3 Instruct 70B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.9%

#303 · Claude Haiku 3

AA · Jun 24, 2026

Source label: Claude 3 Haiku

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.4%

#304 · Gemini 1.5 Pro

AA · Jun 24, 2026

Source label: Gemini 1.5 Pro (May '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#305 · qwen2-72b-instruct

AA · Jun 24, 2026

Source label: Qwen2 Instruct 72B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#306 · Qwen3 VL 4B Instruct

AA · Jun 24, 2026

Source label: Qwen3 VL 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 19%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

37.1%

#307 · Gemini 1.5 Flash 8B

AA · Jun 24, 2026

Source label: Gemini 1.5 Flash-8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 18.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.9%

#308 · Nova Micro

AA · Jun 24, 2026

Source label: Nova Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.8%

#309 · Ministral 3 3B

AA · Jun 24, 2026

Source label: Ministral 3 3B

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.8%

#310 · Mistral Large (Feb '24)

AA · Jun 24, 2026

Source label: Mistral Large (Feb '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

35.1%

#311 · mistral-medium

AA · Jun 24, 2026

Source label: Mistral Medium

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.9%

#312 · Gemma 3 12B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 12B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 17.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.9%

#313 · Claude 2.0

AA · Jun 24, 2026

Source label: Claude 2.0

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.4%

#314 · LFM2 8B A1B

AA · Jun 24, 2026

Source label: LFM2 8B A1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

34.4%

#315 · LFM2.5-1.2B-Thinking

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.9%

#316 · Qwen2.5 Coder Instruct 7B

AA · Jun 24, 2026

Source label: Qwen2.5 Coder Instruct 7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 16%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.9%

#317 · Granite 3.3 8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Granite 3.3 8B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.8%

#318 · Granite 4.0 Micro

AA · Jun 24, 2026

Source label: Granite 4.0 Micro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.6%

#319 · Jamba Reasoning 3B

AA · Jun 24, 2026

Source label: Jamba Reasoning 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 15%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.3%

#320 · Mixtral 8x22B Instruct

AA · Jun 24, 2026

Source label: Mixtral 8x22B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.2%

#321 · Phi-4 Mini Instruct

AA · Jun 24, 2026

Source label: Phi-4 Mini Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.1%

#322 · DBRX Instruct

AA · Jun 24, 2026

Source label: DBRX Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 14.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33.1%

#323 · Claude Instant

AA · Jun 24, 2026

Source label: Claude Instant

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

33%

#324 · LFM 40B

AA · Jun 24, 2026

Source label: LFM 40B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.7%

#325 · Llama 2 Chat 70B

AA · Jun 24, 2026

Source label: Llama 2 Chat 70B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.7%

#326 · LFM2.5-1.2B-Instruct

AA · Jun 24, 2026

Source label: LFM2.5-1.2B-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 13.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.6%

#327 · Gemini 1.5 Flash

AA · Jun 24, 2026

Source label: Gemini 1.5 Flash (May '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.4%

#328 · Command-R+ (Apr '24)

AA · Jun 24, 2026

Source label: Command-R+ (Apr '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.3%

#329 · Jamba 1.7 Mini

AA · Jun 24, 2026

Source label: Jamba 1.7 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.2%

#330 · Llama 2 Chat 13B

AA · Jun 24, 2026

Source label: Llama 2 Chat 13B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 12%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

32.1%

#331 · Claude 2.1

AA · Jun 24, 2026

Source label: Claude 2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#332 · DeepSeek Coder V2 Lite Instruct

AA · Jun 24, 2026

Source label: DeepSeek Coder V2 Lite Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#333 · Phi-3 Mini Instruct 3.8B

AA · Jun 24, 2026

Source label: Phi-3 Mini Instruct 3.8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.9%

#334 · Phi-4 Multimodal Instruct

AA · Jun 24, 2026

Source label: Phi-4 Multimodal Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 11%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.5%

#335 · Granite 4.1 3B

AA · Jun 24, 2026

Source label: Granite 4.1 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

31.4%

#336 · LFM2 2.6B

AA · Jun 24, 2026

Source label: LFM2 2.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.6%

#337 · MiniCPM-V 4.6 1.3B

AA · Jun 24, 2026

Source label: MiniCPM-V 4.6 1.3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.5%

#338 · Tiny Aya Global

AA · Jun 24, 2026

Source label: Tiny Aya Global

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 10.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.5%

#339 · DeepSeek R1 Distill Llama 8B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Llama 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#340 · Mistral Small (Feb '24)

AA · Jun 24, 2026

Source label: Mistral Small (Feb '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#341 · jamba-1.5-mini

AA · Jun 24, 2026

Source label: Jamba 1.5 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 9.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30.2%

#342 · Jamba 1.6 Mini

AA · Jun 24, 2026

Source label: Jamba 1.6 Mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

30%

#343 · GPT-3.5 Turbo

AA · Jun 24, 2026

Source label: GPT-3.5 Turbo

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.7%

#344 · Gemma 3n E4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.6%

#345 · Llama 3 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 8.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.6%

#346 · Mixtral 8x7B Instruct

AA · Jun 24, 2026

Source label: Mixtral 8x7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.2%

#347 · Gemma 3 4B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 4B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

29.1%

#348 · LFM2.5-VL-1.6B

AA · Jun 24, 2026

Source label: LFM2.5-VL-1.6B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.9%

#349 · qwen1.5-110b-chat

AA · Jun 24, 2026

Source label: Qwen1.5 Chat 110B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 7.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.9%

#350 · Command-R (Mar '24)

AA · Jun 24, 2026

Source label: Command-R (Mar '24)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.4%

#351 · Qwen3 1.7B

AA · Jun 24, 2026

Source label: Qwen3 1.7B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.4%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.3%

#352 · Granite 4.0 1B

AA · Jun 24, 2026

Source label: Granite 4.0 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 6.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

28.1%

#353 · MiniCPM5-1B (Reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.8%

#354 · Gemma 3n E4B Instruct Preview (May '25)

AA · Jun 24, 2026

Source label: Gemma 3n E4B Instruct Preview (May '25)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.8%

#355 · Gemini 1.0 Pro

AA · Jun 24, 2026

Source label: Gemini 1.0 Pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.7%

#356 · Apertus 70B Instruct

AA · Jun 24, 2026

Source label: Apertus 70B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 5.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

27.2%

#357 · MiniCPM5-1B (Non-reasoning)

AA · Jun 24, 2026

Source label: MiniCPM5-1B (Non-reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.9%

#358 · Granite 4.0 H 1B

AA · Jun 24, 2026

Source label: Granite 4.0 H 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.3%

#359 · Granite 4.0 350M

AA · Jun 24, 2026

Source label: Granite 4.0 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

26.1%

#360 · Llama 3.1 Instruct 8B

AA · Jun 24, 2026

Source label: Llama 3.1 Instruct 8B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.9%

#361 · Granite 4.0 H 350M

AA · Jun 24, 2026

Source label: Granite 4.0 H 350M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.7%

#362 · Apertus 8B Instruct

AA · Jun 24, 2026

Source label: Apertus 8B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.6%

#363 · Llama 3.2 Instruct 3B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 3B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 3.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

25.5%

#364 · Gemma 3 1B Instruct

AA · Jun 24, 2026

Source label: Gemma 3 1B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23.7%

#365 · Qwen3 0.6B

AA · Jun 24, 2026

Source label: Qwen3 0.6B (Non-reasoning)

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23.1%

#366 · openchat-3.5

AA · Jun 24, 2026

Source label: OpenChat 3.5 (1210)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

23%

#367 · Gemma 3n E2B Instruct

AA · Jun 24, 2026

Source label: Gemma 3n E2B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 2.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.9%

#368 · LFM2 1.2B

AA · Jun 24, 2026

Source label: LFM2 1.2B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.8%

#369 · Llama 2 Chat 7B

AA · Jun 24, 2026

Source label: Llama 2 Chat 7B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.7%

#370 · Gemma 3 270M

AA · Jun 24, 2026

Source label: Gemma 3 270M

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.4%

#371 · Llama 3.2 Instruct 11B (Vision)

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 11B (Vision)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 1.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

22.1%

#372 · Llama 3.2 Instruct 1B

AA · Jun 24, 2026

Source label: Llama 3.2 Instruct 1B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

19.6%

#373 · mistral-7b-instruct

AA · Jun 24, 2026

Source label: Mistral 7B Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

17.7%

#374 · Qwen3.5 0.8B (Non-reasoning)

AA · Jun 24, 2026

Source label: Qwen3.5 0.8B (Reasoning)

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

11.1%

#375 · DeepSeek R1 Distill Qwen 1.5B

AA · Jun 24, 2026

Source label: DeepSeek R1 Distill Qwen 1.5B

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://artificialanalysis.ai/leaderboards/models
Percentile: 0%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.94)

Parsed from Artificial Analysis public leaderboard field `gpqa`.

9.8%

GPQA

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version

Loading benchmark evidence.

GPQA

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version