Benchmarks · /benchmarks/vals-ai-corp_fin_v2

CorpFin v2

Name: CorpFin v2
Creator: Vals AI

CorpFin v2 result as reported by Vals AI.

Source · Vals AI
Version · vals-ai snapshot 2026-06-24
Scores · 89

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Vals AI

metric

Accuracy (%)

judge

Objective

direction

higher better

group id

vals_corp_fin_v2_current

domain

Long context

What it measures vs what it misses

✓ Measures

Understanding and synthesizing long credit agreements.

✗ Misses

Adjacent skills outside the benchmark task mix, latency, and cost.

Why this countsIt checks whether long-context claims survive contact with retrieval, memory, or long-document tasks.Same-test ruleThis percentile only compares models inside the exact benchmark/version group shown here. It is not a universal score.What it missesIt does not guarantee good synthesis quality once real documents, tools, and latency constraints are involved.

Leaderboard · this benchmark version

#1 · Claude Fable 5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-fable-5

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

71.8%70.1% - 73.6%

#2 · Grok 4.3

VALS-AI · Jun 17, 2026

Source label: grok/grok-4.3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 98.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

68.5%66.7% - 70.3%

#3 · GPT-5.5

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.5

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 97.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

68.4%66.6% - 70.2%

#4 · kimi-k2.5-thinking

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2.5-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 96.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

68.3%66.5% - 70.1%

#5 · minimax-m3

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 95.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

68.1%66.3% - 69.9%

#6 · Qwen3 Max

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3-max-2026-01-23

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 94.3%
Last updated: recent
Eligibility: preview_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

68%66.2% - 69.8%

#7 · Claude Opus 4.6

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-6-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 93.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

67%65.2% - 68.8%

#8 · Grok 4 Fast

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-fast-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 92%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66.9%65.1% - 68.7%

#9 · kimi-k2.6

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

66.7%64.9% - 68.6%

#10 · Claude Opus 4.8

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-8

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 89.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

66.7%64.9% - 68.5%

#11 · Qwen3.6 Max Preview

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-max-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 88.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

66.5%64.7% - 68.3%

#12 · Gemini 3 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-3-flash-preview

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 87.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

66.4%64.6% - 68.3%

#13 · GLM-5.2 (max)

VALS-AI · Jun 17, 2026

Source label: zai/glm-5.2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 86.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

66.1%64.3% - 67.9%

#14 · Claude Opus 4.7

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-7

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 85.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

66.1%64.3% - 67.9%

#15 · Grok 4

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-0709

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 84.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66%64.2% - 67.9%

#16 · Grok 4.1 Fast

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-1-fast-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 83%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66%64.1% - 67.8%

#17 · GPT-5.2

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.2-2025-12-11

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 81.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

65.9%64.1% - 67.7%

#18 · Nemotron 3 Ultra 550B A55B (Reasoning)

VALS-AI · Jun 17, 2026

Source label: nvidia/nemotron-3-ultra-550b-a55b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 80.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Nvidia.

65.5%63.6% - 67.3%

#19 · Claude Sonnet 4.6

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-6

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 79.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

65.3%63.5% - 67.1%

#20 · Qwen3.5 Plus

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.5-plus-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 79.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

65.3%63.5% - 67.1%

#21 · GPT-5.4

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-2026-03-05

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 77.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

65.3%63.4% - 67.1%

#22 · muse-spark

VALS-AI · Jun 17, 2026

Source label: meta/muse_spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Meta.

65.1%63.3% - 66.9%

#23 · Claude Opus 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-5-20251101-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 75%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

65.1%63.2% - 66.9%

#24 · Gemini 3.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.5-flash

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

64.7%62.8% - 66.5%

#25 · Gemini 3.1 Pro Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.1-pro-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 72.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

64.5%62.6% - 66.3%

#26 · glm-5.1

VALS-AI · Jun 17, 2026

Source label: zai/glm-5.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 71.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

64.5%62.6% - 66.3%

#27 · GPT-5.1

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.1-2025-11-13

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 70.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

63.8%62% - 65.7%

#28 · Qwen3.7 Max

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.7-max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 69.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

63.7%61.9% - 65.6%

#29 · Grok 4.20

VALS-AI · Jun 17, 2026

Source label: grok/grok-4.20-0309-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 68.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

63.7%61.8% - 65.5%

#30 · Gemini 3 Pro Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3-pro-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 68.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

63.7%61.8% - 65.5%

#31 · Qwen3.5 Flash

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.5-flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 65.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

63.6%61.7% - 65.4%

#32 · GPT-4.1

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 64.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

63.1%61.2% - 64.9%

#33 · glm-5

VALS-AI · Jun 17, 2026

Source label: zai/glm-5-thinking

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 63.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

62.9%61% - 64.8%

#34 · Qwen3.6 27B (Reasoning)

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-27b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 62.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

62.3%60.4% - 64.2%

#35 · Claude Sonnet 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-5-20250929-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 61.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

62%60.1% - 63.8%

#36 · qwen3.6-plus

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 60.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

61.9%60.1% - 63.8%

#37 · mimo-v2.5-pro

VALS-AI · Jun 17, 2026

Source label: xiaomi/mimo-v2.5-pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 59.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Xiaomi.

61.4%59.5% - 63.3%

#38 · deepseek-v4-pro

VALS-AI · Jun 17, 2026

Source label: deepseek/deepseek-v4-pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 58%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: DeepSeek.

61.4%59.5% - 63.3%

#39 · Claude Sonnet 4

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-20250514-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 56.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

61.2%59.3% - 63.1%

#40 · GPT-5.4 nano

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-nano-2026-03-17

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 55.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

61.2%59.3% - 63.1%

#41 · minimax-m2.7

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 55.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

61.2%59.3% - 63.1%

#42 · Grok 3 mini

VALS-AI · Jun 17, 2026

Source label: grok/grok-3-mini-fast-high-reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 53.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

61.1%59.2% - 63%

#43 · GPT-5

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5-2025-08-07

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 52.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

61.1%59.2% - 63%

#44 · Mistral Large (Feb '24)

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-large-2512

verified runtimevariant directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: dated variant (0.80)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

61%59.2% - 62.9%

#45 · glm-4.5

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

61%59.1% - 62.8%

#46 · GPT-5.4 mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-mini-2026-03-17

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 48.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

60.9%59% - 62.8%

#47 · Gemini 2.5 Pro

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-pro

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 47.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

60.8%58.9% - 62.7%

#48 · Claude Haiku 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-haiku-4-5-20251001-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 46.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

60.6%58.7% - 62.5%

#49 · Kimi K2 Thinking

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 45.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

60.6%58.7% - 62.5%

#50 · Claude Sonnet 3.7

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-7-sonnet-20250219-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 44.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

60.4%58.5% - 62.3%

#51 · mimo-v2.5

VALS-AI · Jun 17, 2026

Source label: xiaomi/mimo-v2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 43.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Xiaomi.

59.9%58% - 61.8%

#52 · Gemini 2.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-flash-preview-09-2025-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 42%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

59.8%57.9% - 61.6%

#53 · o3

VALS-AI · Jun 17, 2026

Source label: openai/o3-2025-04-16

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 40.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

59.7%57.8% - 61.6%

#54 · Grok 3

VALS-AI · Jun 17, 2026

Source label: grok/grok-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 40.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

59.7%57.8% - 61.6%

#55 · minimax-m2.5

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 38.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

59.6%57.7% - 61.5%

#56 · Gemini 3.1 Flash-Lite Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.1-flash-lite-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 37.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

59.4%57.5% - 61.3%

#57 · o4 mini

VALS-AI · Jun 17, 2026

Source label: openai/o4-mini-2025-04-16

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 36.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

59%57.1% - 60.9%

#58 · MiniMax-M2.1

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 35.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

58.9%57% - 60.8%

#59 · mistral-medium-3.5

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-medium-3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 34.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

58.8%56.9% - 60.7%

#60 · GPT-OSS 120B

VALS-AI · Jun 17, 2026

Source label: fireworks/gpt-oss-120b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 33%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

58.2%56.3% - 60.1%

#61 · GPT-4.1 mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-mini-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 31.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

57.9%56% - 59.8%

#62 · Gemini 2.5 Flash-Lite

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-flash-lite-preview-09-2025-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 30.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

57.6%55.7% - 59.5%

#63 · glm-4.6

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 29.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

56.8%54.9% - 58.7%

#64 · deepseek-v3-0324

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-v3-0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 28.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

54.7%52.8% - 56.7%

#65 · trinity-large-thinking

VALS-AI · Jun 17, 2026

Source label: arcee-ai/trinity-large-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 27.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Arcee-Ai.

54.7%52.7% - 56.6%

#66 · DeepSeek Reasoner

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-r1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 26.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

54.1%52.2% - 56%

#67 · Claude Sonnet 3.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-5-sonnet-20241022

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 25%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

53.6%51.7% - 55.5%

#68 · GPT-OSS 20B

VALS-AI · Jun 17, 2026

Source label: fireworks/gpt-oss-20b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 23.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

53.1%51.2% - 55.1%

#69 · deepseek-v3

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-v3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 22.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

52.5%50.6% - 54.4%

#70 · Grok 2

VALS-AI · Jun 17, 2026

Source label: grok/grok-2-1212

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 21.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

51.1%49.2% - 53%

#71 · Claude Haiku 3.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-5-haiku-20241022

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 20.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

50.8%48.9% - 52.7%

#72 · mistral-medium-2505

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-medium-2505

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 19.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

50.7%48.8% - 52.6%

#73 · kimi-k2-instruct

VALS-AI · Jun 17, 2026

Source label: together/moonshotai/Kimi-K2-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 18.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Together AI.

50.4%48.5% - 52.3%

#74 · Magistral Medium 1.2

VALS-AI · Jun 17, 2026

Source label: mistralai/magistral-medium-2509

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 17%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

47.4%45.5% - 49.3%

#75 · llama-4-scout-17b-16e-instruct

VALS-AI · Jun 17, 2026

Source label: together/meta-llama/Llama-4-Scout-17B-16E-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Together AI.

46.8%44.9% - 48.7%

#76 · glm-4.7

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 14.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

46.4%44.6% - 48.1%

#77 · command-a-03-2025

VALS-AI · Jun 17, 2026

Source label: cohere/command-a-03-2025

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Cohere.

46%44.1% - 47.9%

#78 · GPT-4o

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4o-2024-11-20

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 12.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.9%44% - 47.8%

#79 · GPT-4o mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4o-mini-2024-07-18

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 11.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.5%43.5% - 47.4%

#80 · o3 mini

VALS-AI · Jun 17, 2026

Source label: openai/o3-mini-2025-01-31

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 10.2%
Last updated: recent
Eligibility: historical_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.3%43.4% - 47.2%

#81 · Mistral Small (Sep '24)

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-small-2503

verified runtimevariant directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: dated variant (0.80)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

44.2%42.3% - 46.1%

#82 · Magistral Small 1.2

VALS-AI · Jun 17, 2026

Source label: mistralai/magistral-small-2509

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

44%42.1% - 45.9%

#83 · Gemini 2.0 Pro Experimental

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.0-pro-exp-02-05

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 6.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

43.4%41.5% - 45.3%

#84 · GPT-4.1 nano

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-nano-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 5.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

42.1%40.2% - 44%

#85 · Gemini 1.5 Pro

VALS-AI · Jun 17, 2026

Source label: google/gemini-1.5-pro-002

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 4.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

40.5%38.6% - 42.4%

#86 · jamba-1.5-large

VALS-AI · Jun 17, 2026

Source label: ai21labs/jamba-1.5-large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 3.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: AI21 Labs.

39.4%37.6% - 41.3%

#87 · Gemini 1.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-1.5-flash-002

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 2.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

38.2%36.3% - 40.1%

#88 · jamba-1.5-mini

VALS-AI · Jun 17, 2026

Source label: ai21labs/jamba-1.5-mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 1.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: AI21 Labs.

33.9%32.1% - 35.7%

#89 · Gemini 2.0 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.0-flash-001

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 0%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

33.7%31.9% - 35.5%

Benchmarks · /benchmarks/vals-ai-corp_fin_v2

CorpFin v2

CorpFin v2 result as reported by Vals AI.

Source · Vals AI
Version · vals-ai snapshot 2026-06-24
Scores · 89

Test details

Visible tradeoffsThis is an objective signal, so it is mainly about measurable task performance rather than public taste.

source

Vals AI

metric

Accuracy (%)

judge

Objective

direction

higher better

group id

vals_corp_fin_v2_current

domain

Long context

What it measures vs what it misses

✓ Measures

Understanding and synthesizing long credit agreements.

✗ Misses

Adjacent skills outside the benchmark task mix, latency, and cost.

Leaderboard · this benchmark version

#1 · Claude Fable 5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-fable-5

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 100%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

71.8%70.1% - 73.6%

#2 · Grok 4.3

VALS-AI · Jun 17, 2026

Source label: grok/grok-4.3

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 98.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

68.5%66.7% - 70.3%

#3 · GPT-5.5

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.5

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 97.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

68.4%66.6% - 70.2%

#4 · kimi-k2.5-thinking

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2.5-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 96.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

68.3%66.5% - 70.1%

#5 · minimax-m3

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 95.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

68.1%66.3% - 69.9%

#6 · Qwen3 Max

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3-max-2026-01-23

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 94.3%
Last updated: recent
Eligibility: preview_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

68%66.2% - 69.8%

#7 · Claude Opus 4.6

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-6-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 93.2%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

67%65.2% - 68.8%

#8 · Grok 4 Fast

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-fast-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 92%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66.9%65.1% - 68.7%

#9 · kimi-k2.6

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 90.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

66.7%64.9% - 68.6%

#10 · Claude Opus 4.8

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-8

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 89.8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

66.7%64.9% - 68.5%

#11 · Qwen3.6 Max Preview

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-max-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 88.6%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

66.5%64.7% - 68.3%

#12 · Gemini 3 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-3-flash-preview

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 87.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

66.4%64.6% - 68.3%

#13 · GLM-5.2 (max)

VALS-AI · Jun 17, 2026

Source label: zai/glm-5.2

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 86.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

66.1%64.3% - 67.9%

#14 · Claude Opus 4.7

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-7

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 85.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

66.1%64.3% - 67.9%

#15 · Grok 4

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-0709

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 84.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66%64.2% - 67.9%

#16 · Grok 4.1 Fast

VALS-AI · Jun 17, 2026

Source label: grok/grok-4-1-fast-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 83%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

66%64.1% - 67.8%

#17 · GPT-5.2

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.2-2025-12-11

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 81.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

65.9%64.1% - 67.7%

#18 · Nemotron 3 Ultra 550B A55B (Reasoning)

VALS-AI · Jun 17, 2026

Source label: nvidia/nemotron-3-ultra-550b-a55b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 80.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Nvidia.

65.5%63.6% - 67.3%

#19 · Claude Sonnet 4.6

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-6

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 79.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

65.3%63.5% - 67.1%

#20 · Qwen3.5 Plus

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.5-plus-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 79.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

65.3%63.5% - 67.1%

#21 · GPT-5.4

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-2026-03-05

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 77.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

65.3%63.4% - 67.1%

#22 · muse-spark

VALS-AI · Jun 17, 2026

Source label: meta/muse_spark

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 76.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Meta.

65.1%63.3% - 66.9%

#23 · Claude Opus 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-opus-4-5-20251101-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 75%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

65.1%63.2% - 66.9%

#24 · Gemini 3.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.5-flash

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 73.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

64.7%62.8% - 66.5%

#25 · Gemini 3.1 Pro Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.1-pro-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 72.7%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

64.5%62.6% - 66.3%

#26 · glm-5.1

VALS-AI · Jun 17, 2026

Source label: zai/glm-5.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 71.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

64.5%62.6% - 66.3%

#27 · GPT-5.1

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.1-2025-11-13

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 70.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

63.8%62% - 65.7%

#28 · Qwen3.7 Max

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.7-max

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 69.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

63.7%61.9% - 65.6%

#29 · Grok 4.20

VALS-AI · Jun 17, 2026

Source label: grok/grok-4.20-0309-reasoning

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 68.2%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

63.7%61.8% - 65.5%

#30 · Gemini 3 Pro Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3-pro-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 68.2%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

63.7%61.8% - 65.5%

#31 · Qwen3.5 Flash

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.5-flash

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 65.9%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

63.6%61.7% - 65.4%

#32 · GPT-4.1

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 64.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

63.1%61.2% - 64.9%

#33 · glm-5

VALS-AI · Jun 17, 2026

Source label: zai/glm-5-thinking

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 63.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

62.9%61% - 64.8%

#34 · Qwen3.6 27B (Reasoning)

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-27b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 62.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

62.3%60.4% - 64.2%

#35 · Claude Sonnet 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-5-20250929-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 61.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

62%60.1% - 63.8%

#36 · qwen3.6-plus

VALS-AI · Jun 17, 2026

Source label: alibaba/qwen3.6-plus

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 60.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Alibaba.

61.9%60.1% - 63.8%

#37 · mimo-v2.5-pro

VALS-AI · Jun 17, 2026

Source label: xiaomi/mimo-v2.5-pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 59.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Xiaomi.

61.4%59.5% - 63.3%

#38 · deepseek-v4-pro

VALS-AI · Jun 17, 2026

Source label: deepseek/deepseek-v4-pro

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 58%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: DeepSeek.

61.4%59.5% - 63.3%

#39 · Claude Sonnet 4

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-sonnet-4-20250514-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 56.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

61.2%59.3% - 63.1%

#40 · GPT-5.4 nano

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-nano-2026-03-17

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 55.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

61.2%59.3% - 63.1%

#41 · minimax-m2.7

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 55.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

61.2%59.3% - 63.1%

#42 · Grok 3 mini

VALS-AI · Jun 17, 2026

Source label: grok/grok-3-mini-fast-high-reasoning

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 53.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

61.1%59.2% - 63%

#43 · GPT-5

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5-2025-08-07

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 52.3%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

61.1%59.2% - 63%

#44 · Mistral Large (Feb '24)

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-large-2512

verified runtimevariant directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 51.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: dated variant (0.80)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

61%59.2% - 62.9%

#45 · glm-4.5

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 50%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

61%59.1% - 62.8%

#46 · GPT-5.4 mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-5.4-mini-2026-03-17

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 48.9%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

60.9%59% - 62.8%

#47 · Gemini 2.5 Pro

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-pro

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 47.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

60.8%58.9% - 62.7%

#48 · Claude Haiku 4.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-haiku-4-5-20251001-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 46.6%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

60.6%58.7% - 62.5%

#49 · Kimi K2 Thinking

VALS-AI · Jun 17, 2026

Source label: kimi/kimi-k2-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 45.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Moonshot AI.

60.6%58.7% - 62.5%

#50 · Claude Sonnet 3.7

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-7-sonnet-20250219-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 44.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

60.4%58.5% - 62.3%

#51 · mimo-v2.5

VALS-AI · Jun 17, 2026

Source label: xiaomi/mimo-v2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 43.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Xiaomi.

59.9%58% - 61.8%

#52 · Gemini 2.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-flash-preview-09-2025-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 42%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

59.8%57.9% - 61.6%

#53 · o3

VALS-AI · Jun 17, 2026

Source label: openai/o3-2025-04-16

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 40.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

59.7%57.8% - 61.6%

#54 · Grok 3

VALS-AI · Jun 17, 2026

Source label: grok/grok-3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 40.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

59.7%57.8% - 61.6%

#55 · minimax-m2.5

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 38.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

59.6%57.7% - 61.5%

#56 · Gemini 3.1 Flash-Lite Preview

VALS-AI · Jun 17, 2026

Source label: google/gemini-3.1-flash-lite-preview

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 37.5%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

59.4%57.5% - 61.3%

#57 · o4 mini

VALS-AI · Jun 17, 2026

Source label: openai/o4-mini-2025-04-16

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 36.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

59%57.1% - 60.9%

#58 · MiniMax-M2.1

VALS-AI · Jun 17, 2026

Source label: minimax/MiniMax-M2.1

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 35.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: MiniMax.

58.9%57% - 60.8%

#59 · mistral-medium-3.5

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-medium-3.5

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 34.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

58.8%56.9% - 60.7%

#60 · GPT-OSS 120B

VALS-AI · Jun 17, 2026

Source label: fireworks/gpt-oss-120b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 33%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

58.2%56.3% - 60.1%

#61 · GPT-4.1 mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-mini-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 31.8%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

57.9%56% - 59.8%

#62 · Gemini 2.5 Flash-Lite

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.5-flash-lite-preview-09-2025-thinking

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 30.7%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

57.6%55.7% - 59.5%

#63 · glm-4.6

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.6

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 29.5%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

56.8%54.9% - 58.7%

#64 · deepseek-v3-0324

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-v3-0324

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 28.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

54.7%52.8% - 56.7%

#65 · trinity-large-thinking

VALS-AI · Jun 17, 2026

Source label: arcee-ai/trinity-large-thinking

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 27.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Arcee-Ai.

54.7%52.7% - 56.6%

#66 · DeepSeek Reasoner

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-r1

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 26.1%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

54.1%52.2% - 56%

#67 · Claude Sonnet 3.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-5-sonnet-20241022

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 25%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

53.6%51.7% - 55.5%

#68 · GPT-OSS 20B

VALS-AI · Jun 17, 2026

Source label: fireworks/gpt-oss-20b

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 23.9%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

53.1%51.2% - 55.1%

#69 · deepseek-v3

VALS-AI · Jun 17, 2026

Source label: fireworks/deepseek-v3

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 22.7%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Fireworks AI.

52.5%50.6% - 54.4%

#70 · Grok 2

VALS-AI · Jun 17, 2026

Source label: grok/grok-2-1212

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 21.6%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: xAI.

51.1%49.2% - 53%

#71 · Claude Haiku 3.5

VALS-AI · Jun 17, 2026

Source label: anthropic/claude-3-5-haiku-20241022

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 20.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Anthropic.

50.8%48.9% - 52.7%

#72 · mistral-medium-2505

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-medium-2505

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 19.3%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

50.7%48.8% - 52.6%

#73 · kimi-k2-instruct

VALS-AI · Jun 17, 2026

Source label: together/moonshotai/Kimi-K2-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 18.2%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Together AI.

50.4%48.5% - 52.3%

#74 · Magistral Medium 1.2

VALS-AI · Jun 17, 2026

Source label: mistralai/magistral-medium-2509

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 17%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

47.4%45.5% - 49.3%

#75 · llama-4-scout-17b-16e-instruct

VALS-AI · Jun 17, 2026

Source label: together/meta-llama/Llama-4-Scout-17B-16E-Instruct

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 15.9%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Together AI.

46.8%44.9% - 48.7%

#76 · glm-4.7

VALS-AI · Jun 17, 2026

Source label: zai/glm-4.7

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 14.8%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Zhipu AI.

46.4%44.6% - 48.1%

#77 · command-a-03-2025

VALS-AI · Jun 17, 2026

Source label: cohere/command-a-03-2025

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 13.6%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Cohere.

46%44.1% - 47.9%

#78 · GPT-4o

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4o-2024-11-20

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 12.5%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.9%44% - 47.8%

#79 · GPT-4o mini

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4o-mini-2024-07-18

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 11.4%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.5%43.5% - 47.4%

#80 · o3 mini

VALS-AI · Jun 17, 2026

Source label: openai/o3-mini-2025-01-31

verified runtimeexact directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 10.2%
Last updated: recent
Eligibility: historical_model
Identity: exact (1.00)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

45.3%43.4% - 47.2%

#81 · Mistral Small (Sep '24)

VALS-AI · Jun 17, 2026

Source label: mistralai/mistral-small-2503

verified runtimevariant directBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 9.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: dated variant (0.80)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

44.2%42.3% - 46.1%

#82 · Magistral Small 1.2

VALS-AI · Jun 17, 2026

Source label: mistralai/magistral-small-2509

verified runtimeexact alias

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 8%
Last updated: recent
Eligibility: headline eligible
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Mistral AI.

44%42.1% - 45.9%

#83 · Gemini 2.0 Pro Experimental

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.0-pro-exp-02-05

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 6.8%
Last updated: recent
Eligibility: preview_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

43.4%41.5% - 45.3%

#84 · GPT-4.1 nano

VALS-AI · Jun 17, 2026

Source label: openai/gpt-4.1-nano-2025-04-14

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 5.7%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: OpenAI.

42.1%40.2% - 44%

#85 · Gemini 1.5 Pro

VALS-AI · Jun 17, 2026

Source label: google/gemini-1.5-pro-002

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 4.5%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

40.5%38.6% - 42.4%

#86 · jamba-1.5-large

VALS-AI · Jun 17, 2026

Source label: ai21labs/jamba-1.5-large

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 3.4%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: AI21 Labs.

39.4%37.6% - 41.3%

#87 · Gemini 1.5 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-1.5-flash-002

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 2.3%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

38.2%36.3% - 40.1%

#88 · jamba-1.5-mini

VALS-AI · Jun 17, 2026

Source label: ai21labs/jamba-1.5-mini

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 1.1%
Last updated: recent
Eligibility: benchmark_derived_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: AI21 Labs.

33.9%32.1% - 35.7%

#89 · Gemini 2.0 Flash

VALS-AI · Jun 17, 2026

Source label: google/gemini-2.0-flash-001

verified runtimeexact aliasBackground only

Raw row drilldownsource, percentile, eligibility

Source URL: https://www.vals.ai/benchmarks/corp_fin_v2
Percentile: 0%
Last updated: recent
Eligibility: historical_model
Identity: provider alias (0.92)

Parsed from Vals AI BenchmarkView overall scores. Vals slug: corp_fin_v2; provider: Google.

33.7%31.9% - 35.5%

CorpFin v2

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version

Loading benchmark evidence.

CorpFin v2

Test details

What it measures vs what it misses

✓ Measures

✗ Misses

Leaderboard · this benchmark version