Leaderboard - CHINI-bench

← Back to bench

Built by alex · @chinillaboard

👥

Total submissions

3,634

All time

☑

Problems solved

57 / 450

At least one passing run

⏱

Last 24h submissions

Keep it up!

How rankings work

One row per user × model. Same person on different models = multiple rows.
Sorted by average composite score across every problem the row has run. Tie-breakers: pass rate, then run count. Both numbers shown side-by-side so a high average on a thin sample cannot quietly outrank a higher pass rate.
Submitting the same problem twice keeps only the most recent run. Re-running the same problem cannot inflate your average.
Need 3+ scored runs to enter the ranked table. Newer rows show in the Recent submissions list below until they hit the threshold.
Composite numbers are point estimates; with a 30-problem benchmark and one shot per problem, treat differences inside roughly ±3 points as noise rather than a real ordering.
Results are scored under the methodology version active at submit time (v0.3 / v0.6 / v0.7). Stamped in meta.methodologyVersion on each result. Older runs are not retro-graded under the v0.7 placement-aware design subscore.
Click any row to see the per-problem breakdown that produced the average.
Use the By model tab to see the same single-shot data aggregated across submitters: how does each model do overall?

Hardest: chini-025-job-search-pipeline 48 avg Easiest: chini-train-train-0200-dp1-infra 96 avg Never solved: 393 / 450

Community ranking

Average composite score across every problem the (user × model) has run. Min 3 runs to rank. Click a row for the per-problem breakdown.

Rank

User

Model

Classes

Avg

Best

Runs

Pass rate

Last run

1 🥇

▸ chini-train-08

rl_v07_full

80 PC1

84 PC2

85 PC3

82 PC4

83 PC5

83 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	83	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	81	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	86	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	86	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	86	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	72	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	88	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	84	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

2 🥈

▸ chini-train-08

rl_v06_run2

79 PC1

84 PC2

83 PC3

79 PC4

79 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	83	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	72	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	73	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	76	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

3 🥉

▸ chini-train-08

rl_v07_pilot_a10b_k8_s0

80 PC1

84 PC2

84 PC3

78 PC4

79 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	81	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	72	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	81	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	76	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	76	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	93	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s1

81 PC1

83 PC2

81 PC3

80 PC4

79 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	77	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	82	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	83	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	73	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	80	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	71	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	79	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s2

80 PC1

83 PC2

84 PC3

79 PC4

78 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	75	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	74	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	86	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	75	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	78	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s5

80 PC1

83 PC2

82 PC3

81 PC4

79 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	82	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	74	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	74	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	82	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	76	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	72	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	78	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	94	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s6

80 PC1

84 PC2

81 PC3

78 PC4

81 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	77	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	82	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	73	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	72	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	86	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	80	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	73	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	83	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	76	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	76	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s7

80 PC1

84 PC2

83 PC3

80 PC4

79 PC5

81 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	83	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	86	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	83	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	76	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	80	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	91	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

fmt_a_7b

80 PC1

83 PC2

81 PC3

78 PC4

79 PC5

80 /100

10%

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	78	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	73	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	77	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	79	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	75	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	78	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-08

fmt_a_v5_mixed_7b

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	77	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	75	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	74	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	79	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	74	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-08

fmt_a_v5

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	77	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	75	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	74	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	79	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	74	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s3

78 PC1

81 PC2

84 PC3

78 PC4

79 PC5

80 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	80	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	72	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	81	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	86	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	69	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	76	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	78	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

rl_v07_pilot_a10b_k8_s4

81 PC1

84 PC2

81 PC3

76 PC4

79 PC5

80 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	80	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	73	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	87	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	72	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	83	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	81	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	72	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	79	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	68	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	81	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	76	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	94	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ chini-train-08

fmtA

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	77	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	75	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	74	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	79	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	76	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	82	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	74	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ rl_v07_full_a10

rl_policy custom

80 PC1

82 PC2

80 PC3

81 PC4

79 PC5

80 /100

200

2mo ago

Per-problem breakdown (200 runs)

Problem	Class	Score	Result	When
chini-train-train-0269-dp3-adversarial	PC5	81	fail	2mo ago
chini-train-train-0343-dp4-civic	PC4	89	fail	2mo ago
chini-train-train-0324-dp4-adversarial	PC5	86	fail	2mo ago
chini-train-train-0350-dp4-infra	PC1	88	fail	2mo ago
chini-train-train-0328-dp4-civic	PC4	84	fail	2mo ago
chini-train-train-0182-dp5-personal	PC3	80	fail	2mo ago
chini-train-train-0358-dp5-civic	PC4	81	fail	2mo ago
chini-train-train-0102-dp4-personal	PC3	77	fail	2mo ago
chini-train-train-0171-dp5-workflow	PC2	56	fail	2mo ago
chini-train-train-0307-dp4-personal	PC3	90	fail	2mo ago
chini-train-train-0242-dp2-personal	PC3	91	fail	2mo ago
chini-train-train-0341-dp4-workflow	PC2	86	fail	2mo ago
chini-train-train-0132-dp4-personal	PC3	78	fail	2mo ago
chini-train-train-0115-dp4-infra	PC1	73	fail	2mo ago
chini-train-train-0030-dp2-infra	PC1	82	fail	2mo ago
chini-train-train-0344-dp4-adversarial	PC5	81	fail	2mo ago
chini-train-train-0263-dp3-civic	PC4	89	fail	2mo ago
chini-train-train-0304-dp4-adversarial	PC5	82	fail	2mo ago
chini-train-train-0086-dp3-workflow	PC2	80	fail	2mo ago
chini-train-train-0267-dp3-personal	PC3	81	fail	2mo ago
chini-train-train-0262-dp3-personal	PC3	82	fail	2mo ago
chini-train-train-0141-dp4-workflow	PC2	73	fail	2mo ago
chini-train-train-0266-dp3-workflow	PC2	85	fail	2mo ago
chini-train-train-0179-dp5-adversarial	PC5	73	fail	2mo ago
chini-train-train-0276-dp3-workflow	PC2	80	fail	2mo ago
chini-train-train-0378-dp5-civic	PC4	81	fail	2mo ago
chini-train-train-0018-dp2-civic	PC4	82	fail	2mo ago
chini-train-train-0297-dp3-personal	PC3	76	fail	2mo ago
chini-train-train-0382-dp5-personal	PC3	82	fail	2mo ago
chini-train-train-0177-dp5-personal	PC3	73	fail	2mo ago
chini-train-train-0369-dp5-adversarial	PC5	81	fail	2mo ago
chini-train-train-0008-dp1-civic	PC4	95	PASS	2mo ago
chini-train-train-0084-dp3-adversarial	PC5	81	fail	2mo ago
chini-train-train-0173-dp5-civic	PC4	81	fail	2mo ago
chini-train-train-0131-dp4-workflow	PC2	75	fail	2mo ago
chini-train-train-0060-dp3-infra	PC1	79	fail	2mo ago
chini-train-train-0298-dp3-civic	PC4	86	fail	2mo ago
chini-train-train-0315-dp4-infra	PC1	78	fail	2mo ago
chini-train-train-0200-dp1-infra	PC1	96	PASS	2mo ago
chini-train-train-0238-dp2-civic	PC4	82	fail	2mo ago
chini-train-train-0300-dp4-infra	PC1	79	fail	2mo ago
chini-train-train-0146-dp4-workflow	PC2	71	fail	2mo ago
chini-train-train-0147-dp4-personal	PC3	80	fail	2mo ago
chini-train-train-0207-dp1-personal	PC3	96	PASS	2mo ago
chini-train-train-0062-dp3-personal	PC3	81	fail	2mo ago
chini-train-train-0156-dp4-workflow	PC2	77	fail	2mo ago
chini-train-train-0104-dp4-adversarial	PC5	66	fail	2mo ago
chini-train-train-0048-dp3-civic	PC4	81	fail	2mo ago
chini-train-train-0277-dp3-personal	PC3	85	fail	2mo ago
chini-train-train-0151-dp4-workflow	PC2	74	fail	2mo ago
chini-train-train-0362-dp5-personal	PC3	81	fail	2mo ago
chini-train-train-0090-dp3-infra	PC1	80	fail	2mo ago
chini-train-train-0201-dp1-workflow	PC2	96	PASS	2mo ago
chini-train-train-0105-dp4-infra	PC1	73	fail	2mo ago
chini-train-train-0329-dp4-adversarial	PC5	84	fail	2mo ago
chini-train-train-0376-dp5-workflow	PC2	85	fail	2mo ago
chini-train-train-0025-dp2-infra	PC1	85	fail	2mo ago
chini-train-train-0191-dp6-workflow	PC2	76	fail	2mo ago
chini-train-train-0103-dp4-civic	PC4	66	fail	2mo ago
chini-train-train-0339-dp4-adversarial	PC5	81	fail	2mo ago
chini-train-train-0370-dp5-infra	PC1	83	fail	2mo ago
chini-train-train-0184-dp5-adversarial	PC5	79	fail	2mo ago
chini-train-train-0352-dp4-personal	PC3	87	fail	2mo ago
chini-train-train-0152-dp4-personal	PC3	70	fail	2mo ago
chini-train-train-0393-dp6-civic	PC4	83	fail	2mo ago
chini-train-train-0334-dp4-adversarial	PC5	84	fail	2mo ago
chini-train-train-0157-dp5-personal	PC3	70	fail	2mo ago
chini-train-train-0278-dp3-civic	PC4	86	fail	2mo ago
chini-train-train-0247-dp3-personal	PC3	72	fail	2mo ago
chini-train-train-0118-dp4-civic	PC4	67	fail	2mo ago
chini-train-train-0250-dp3-infra	PC1	87	fail	2mo ago
chini-train-train-0019-dp2-adversarial	PC5	80	fail	2mo ago
chini-train-train-0113-dp4-civic	PC4	79	fail	2mo ago
chini-train-train-0178-dp5-civic	PC4	80	fail	2mo ago
chini-train-train-0149-dp4-adversarial	PC5	74	fail	2mo ago
chini-train-train-0109-dp4-adversarial	PC5	72	fail	2mo ago
chini-train-train-0281-dp3-workflow	PC2	90	fail	2mo ago
chini-train-train-0397-dp6-personal	PC3	78	fail	2mo ago
chini-train-train-0006-dp1-workflow	PC2	95	PASS	2mo ago
chini-train-train-0313-dp4-civic	PC4	83	fail	2mo ago
chini-train-train-0069-dp3-adversarial	PC5	79	fail	2mo ago
chini-train-train-0320-dp4-infra	PC1	83	fail	2mo ago
chini-train-train-0264-dp3-adversarial	PC5	77	fail	2mo ago
chini-train-train-0011-dp1-workflow	PC2	95	PASS	2mo ago
chini-train-train-0096-dp3-workflow	PC2	65	fail	2mo ago
chini-train-train-0133-dp4-civic	PC4	80	fail	2mo ago
chini-train-train-0283-dp3-civic	PC4	86	fail	2mo ago
chini-train-train-0218-dp2-civic	PC4	89	fail	2mo ago
chini-train-train-0355-dp4-infra	PC1	85	fail	2mo ago
chini-train-train-0294-dp3-adversarial	PC5	86	fail	2mo ago
chini-train-train-0221-dp2-workflow	PC2	89	fail	2mo ago
chini-train-train-0139-dp4-adversarial	PC5	73	fail	2mo ago
chini-train-train-0241-dp2-workflow	PC2	82	fail	2mo ago
chini-train-train-0007-dp1-personal	PC3	95	PASS	2mo ago
chini-train-train-0188-dp6-civic	PC4	72	fail	2mo ago
chini-train-train-0226-dp2-workflow	PC2	90	PASS	2mo ago
chini-train-train-0293-dp3-civic	PC4	77	fail	2mo ago
chini-train-train-0373-dp5-civic	PC4	81	fail	2mo ago
chini-train-train-0159-dp5-adversarial	PC5	66	fail	2mo ago
chini-train-train-0100-dp4-infra	PC1	74	fail	2mo ago
chini-train-train-0170-dp5-infra	PC1	87	fail	2mo ago
chini-train-train-0318-dp4-civic	PC4	81	fail	2mo ago
chini-train-train-0356-dp4-workflow	PC2	79	fail	2mo ago
chini-train-train-0089-dp3-adversarial	PC5	70	fail	2mo ago
chini-train-train-0093-dp3-civic	PC4	81	fail	2mo ago
chini-train-train-0165-dp5-infra	PC1	73	fail	2mo ago
chini-train-train-0167-dp5-personal	PC3	73	fail	2mo ago
chini-train-train-0336-dp4-workflow	PC2	86	fail	2mo ago
chini-train-train-0231-dp2-workflow	PC2	91	fail	2mo ago
chini-train-train-0268-dp3-civic	PC4	86	fail	2mo ago
chini-train-train-0211-dp1-workflow	PC2	96	PASS	2mo ago
chini-train-train-0037-dp2-personal	PC3	88	PASS	2mo ago
chini-train-train-0203-dp1-civic	PC4	96	PASS	2mo ago
chini-train-train-0106-dp4-workflow	PC2	73	fail	2mo ago
chini-train-train-0074-dp3-adversarial	PC5	81	fail	2mo ago
chini-train-train-0220-dp2-infra	PC1	84	fail	2mo ago
chini-train-train-0225-dp2-infra	PC1	77	fail	2mo ago
chini-train-train-0330-dp4-infra	PC1	79	fail	2mo ago
chini-train-train-0120-dp4-infra	PC1	80	fail	2mo ago
chini-train-train-0154-dp4-adversarial	PC5	74	fail	2mo ago
chini-train-train-0085-dp3-infra	PC1	89	fail	2mo ago
chini-train-train-0162-dp5-personal	PC3	78	fail	2mo ago
chini-train-train-0064-dp3-adversarial	PC5	73	fail	2mo ago
chini-train-train-0284-dp3-adversarial	PC5	90	fail	2mo ago
chini-train-train-0349-dp4-adversarial	PC5	73	fail	2mo ago
chini-train-train-0345-dp4-infra	PC1	81	fail	2mo ago
chini-train-train-0065-dp3-infra	PC1	87	fail	2mo ago
chini-train-train-0010-dp1-infra	PC1	95	PASS	2mo ago
chini-train-train-0333-dp4-civic	PC4	82	fail	2mo ago
chini-train-train-0248-dp3-civic	PC4	83	fail	2mo ago
chini-train-train-0123-dp4-civic	PC4	78	fail	2mo ago
chini-train-train-0127-dp4-personal	PC3	66	fail	2mo ago
chini-train-train-0130-dp4-infra	PC1	66	fail	2mo ago
chini-train-train-0326-dp4-workflow	PC2	71	fail	2mo ago
chini-train-train-0031-dp2-workflow	PC2	80	fail	2mo ago
chini-train-train-0180-dp5-infra	PC1	65	fail	2mo ago
chini-train-train-0072-dp3-personal	PC3	81	fail	2mo ago
chini-train-train-0026-dp2-workflow	PC2	81	fail	2mo ago
chini-train-train-0385-dp5-infra	PC1	81	fail	2mo ago
chini-train-train-0088-dp3-civic	PC4	75	fail	2mo ago
chini-train-train-0335-dp4-infra	PC1	84	fail	2mo ago
chini-train-train-0374-dp5-adversarial	PC5	82	fail	2mo ago
chini-train-train-0075-dp3-infra	PC1	79	fail	2mo ago
chini-train-train-0213-dp1-civic	PC4	96	PASS	2mo ago
chini-train-train-0144-dp4-adversarial	PC5	88	fail	2mo ago
chini-train-train-0227-dp2-personal	PC3	83	fail	2mo ago
chini-train-train-0045-dp3-infra	PC1	78	fail	2mo ago
chini-train-train-0351-dp4-workflow	PC2	89	fail	2mo ago
chini-train-train-0066-dp3-workflow	PC2	83	fail	2mo ago
chini-train-train-0175-dp5-infra	PC1	69	fail	2mo ago
chini-train-train-0143-dp4-civic	PC4	78	fail	2mo ago
chini-train-train-0322-dp4-personal	PC3	82	fail	2mo ago
chini-train-train-0097-dp3-personal	PC3	64	fail	2mo ago
chini-train-train-0240-dp2-infra	PC1	79	fail	2mo ago
chini-train-train-0331-dp4-workflow	PC2	86	fail	2mo ago
chini-train-train-0029-dp2-adversarial	PC5	82	fail	2mo ago
chini-train-train-0380-dp5-infra	PC1	84	fail	2mo ago
chini-train-train-0230-dp2-infra	PC1	80	fail	2mo ago
chini-train-train-0289-dp3-adversarial	PC5	84	fail	2mo ago
chini-train-train-0386-dp6-workflow	PC2	82	fail	2mo ago
chini-train-train-0243-dp3-civic	PC4	73	fail	2mo ago
chini-train-train-0059-dp3-adversarial	PC5	76	fail	2mo ago
chini-train-train-0280-dp3-infra	PC1	73	fail	2mo ago
chini-train-train-0354-dp4-adversarial	PC5	83	fail	2mo ago
chini-train-train-0034-dp2-adversarial	PC5	80	fail	2mo ago
chini-train-train-0055-dp3-infra	PC1	64	fail	2mo ago
chini-train-train-0209-dp1-adversarial	PC5	96	PASS	2mo ago
chini-train-train-0244-dp3-adversarial	PC5	85	fail	2mo ago
chini-train-train-0253-dp3-civic	PC4	75	fail	2mo ago
chini-train-train-0259-dp3-adversarial	PC5	74	fail	2mo ago
chini-train-train-0372-dp5-personal	PC3	83	fail	2mo ago
chini-train-train-0367-dp5-personal	PC3	80	fail	2mo ago
chini-train-train-0002-dp1-personal	PC3	95	PASS	2mo ago
chini-train-train-0198-dp6-civic	PC4	74	fail	2mo ago
chini-train-train-0068-dp3-civic	PC4	87	fail	2mo ago
chini-train-train-0009-dp1-adversarial	PC5	95	PASS	2mo ago
chini-train-train-0077-dp3-personal	PC3	75	fail	2mo ago
chini-train-train-0251-dp3-workflow	PC2	83	fail	2mo ago
chini-train-train-0169-dp5-adversarial	PC5	66	fail	2mo ago
chini-train-train-0271-dp3-workflow	PC2	80	fail	2mo ago
chini-train-train-0053-dp3-civic	PC4	80	fail	2mo ago
chini-train-train-0099-dp3-adversarial	PC5	85	fail	2mo ago
chini-train-train-0217-dp2-personal	PC3	94	PASS	2mo ago
chini-train-train-0043-dp3-civic	PC4	72	fail	2mo ago
chini-train-train-0364-dp5-adversarial	PC5	80	fail	2mo ago
chini-train-train-0347-dp4-personal	PC3	75	fail	2mo ago
chini-train-train-0338-dp4-civic	PC4	79	fail	2mo ago
chini-train-train-0038-dp2-civic	PC4	78	fail	2mo ago
chini-train-train-0305-dp4-infra	PC1	71	fail	2mo ago
chini-train-train-0192-dp6-personal	PC3	80	fail	2mo ago
chini-train-train-0292-dp3-personal	PC3	77	fail	2mo ago
chini-train-train-0257-dp3-personal	PC3	85	fail	2mo ago
chini-train-train-0122-dp4-personal	PC3	59	fail	2mo ago
chini-train-train-0190-dp6-infra	PC1	74	fail	2mo ago
chini-train-train-0228-dp2-civic	PC4	80	fail	2mo ago
chini-train-train-0246-dp3-workflow	PC2	87	fail	2mo ago
chini-train-train-0164-dp5-adversarial	PC5	79	fail	2mo ago
chini-train-train-0158-dp5-civic	PC4	70	fail	2mo ago
chini-train-train-0094-dp3-adversarial	PC5	71	fail	2mo ago
chini-train-train-0249-dp3-adversarial	PC5	73	fail	2mo ago

▸ rl_v07_pilot_a10b

rl_policy custom

75 PC1

82 PC2

81 PC3

74 PC4

79 PC5

78 /100

2mo ago

Per-problem breakdown (50 runs)

Problem	Class	Score	Result	When
chini-train-train-0143-dp4-civic	PC4	65	fail	2mo ago
chini-train-train-0322-dp4-personal	PC3	80	fail	2mo ago
chini-train-train-0097-dp3-personal	PC3	72	fail	2mo ago
chini-train-train-0240-dp2-infra	PC1	76	fail	2mo ago
chini-train-train-0331-dp4-workflow	PC2	86	fail	2mo ago
chini-train-train-0029-dp2-adversarial	PC5	81	fail	2mo ago
chini-train-train-0380-dp5-infra	PC1	85	fail	2mo ago
chini-train-train-0230-dp2-infra	PC1	76	fail	2mo ago
chini-train-train-0289-dp3-adversarial	PC5	79	fail	2mo ago
chini-train-train-0386-dp6-workflow	PC2	77	fail	2mo ago
chini-train-train-0243-dp3-civic	PC4	73	fail	2mo ago
chini-train-train-0059-dp3-adversarial	PC5	81	fail	2mo ago
chini-train-train-0280-dp3-infra	PC1	68	fail	2mo ago
chini-train-train-0354-dp4-adversarial	PC5	72	fail	2mo ago
chini-train-train-0034-dp2-adversarial	PC5	79	fail	2mo ago
chini-train-train-0055-dp3-infra	PC1	86	fail	2mo ago
chini-train-train-0209-dp1-adversarial	PC5	96	PASS	2mo ago
chini-train-train-0244-dp3-adversarial	PC5	85	fail	2mo ago
chini-train-train-0253-dp3-civic	PC4	73	fail	2mo ago
chini-train-train-0259-dp3-adversarial	PC5	71	fail	2mo ago
chini-train-train-0372-dp5-personal	PC3	82	fail	2mo ago
chini-train-train-0367-dp5-personal	PC3	81	fail	2mo ago
chini-train-train-0002-dp1-personal	PC3	95	PASS	2mo ago
chini-train-train-0198-dp6-civic	PC4	50	fail	2mo ago
chini-train-train-0068-dp3-civic	PC4	87	fail	2mo ago
chini-train-train-0009-dp1-adversarial	PC5	95	PASS	2mo ago
chini-train-train-0077-dp3-personal	PC3	82	fail	2mo ago
chini-train-train-0251-dp3-workflow	PC2	77	fail	2mo ago
chini-train-train-0169-dp5-adversarial	PC5	65	fail	2mo ago
chini-train-train-0271-dp3-workflow	PC2	81	fail	2mo ago
chini-train-train-0053-dp3-civic	PC4	82	fail	2mo ago
chini-train-train-0099-dp3-adversarial	PC5	71	fail	2mo ago
chini-train-train-0217-dp2-personal	PC3	92	PASS	2mo ago
chini-train-train-0043-dp3-civic	PC4	72	fail	2mo ago
chini-train-train-0364-dp5-adversarial	PC5	80	fail	2mo ago
chini-train-train-0347-dp4-personal	PC3	75	fail	2mo ago
chini-train-train-0338-dp4-civic	PC4	77	fail	2mo ago
chini-train-train-0038-dp2-civic	PC4	82	fail	2mo ago
chini-train-train-0305-dp4-infra	PC1	72	fail	2mo ago
chini-train-train-0192-dp6-personal	PC3	66	fail	2mo ago
chini-train-train-0292-dp3-personal	PC3	85	fail	2mo ago
chini-train-train-0257-dp3-personal	PC3	81	fail	2mo ago
chini-train-train-0122-dp4-personal	PC3	76	fail	2mo ago
chini-train-train-0190-dp6-infra	PC1	63	fail	2mo ago
chini-train-train-0228-dp2-civic	PC4	80	fail	2mo ago
chini-train-train-0246-dp3-workflow	PC2	89	fail	2mo ago
chini-train-train-0164-dp5-adversarial	PC5	82	fail	2mo ago
chini-train-train-0158-dp5-civic	PC4	70	fail	2mo ago
chini-train-train-0094-dp3-adversarial	PC5	70	fail	2mo ago
chini-train-train-0249-dp3-adversarial	PC5	73	fail	2mo ago

▸ chini-train-08

fmt_a

75 PC1

77 PC2

79 PC3

79 PC4

78 PC5

78 /100

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	73	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	74	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	82	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	73	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	82	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	82	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	64	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	80	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	78	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	76	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	84	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	72	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	70	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	79	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	80	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	92	PASS	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	75	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	81	fail	3mo ago

▸ chini-train-08

fmt_a_v2

77 PC1

77 PC2

83 PC3

78 PC4

76 PC5

78 /100

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	71	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	78	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	81	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	66	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	81	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	81	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	77	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	75	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	71	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	72	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	80	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	83	fail	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	79	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-08

fmt_a_3b

77 PC1

77 PC2

83 PC3

78 PC4

76 PC5

78 /100

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	71	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	78	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	81	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	81	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	66	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	81	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	81	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	82	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	77	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	75	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	75	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	73	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	85	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	71	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	72	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	76	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	80	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	83	fail	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	79	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-03

opus-4.7

78 PC1

78 PC2

76 PC3

77 PC4

77 PC5

77 /100

100

14%

3mo ago

Per-problem breakdown (100 runs)

Problem	Class	Score	Result	When
chini-train-train-0149-dp4-adversarial	PC5	65	fail	3mo ago
chini-train-train-0148-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0147-dp4-personal	PC3	72	fail	3mo ago
chini-train-train-0146-dp4-workflow	PC2	71	fail	3mo ago
chini-train-train-0145-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0144-dp4-adversarial	PC5	81	fail	3mo ago
chini-train-train-0143-dp4-civic	PC4	70	fail	3mo ago
chini-train-train-0142-dp4-personal	PC3	73	fail	3mo ago
chini-train-train-0141-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0140-dp4-infra	PC1	69	fail	3mo ago
chini-train-train-0139-dp4-adversarial	PC5	71	fail	3mo ago
chini-train-train-0138-dp4-civic	PC4	64	fail	3mo ago
chini-train-train-0137-dp4-personal	PC3	69	fail	3mo ago
chini-train-train-0136-dp4-workflow	PC2	73	fail	3mo ago
chini-train-train-0135-dp4-infra	PC1	73	fail	3mo ago
chini-train-train-0134-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0133-dp4-civic	PC4	72	fail	3mo ago
chini-train-train-0132-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0131-dp4-workflow	PC2	68	fail	3mo ago
chini-train-train-0130-dp4-infra	PC1	71	fail	3mo ago
chini-train-train-0129-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0128-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0127-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0126-dp4-workflow	PC2	78	fail	3mo ago
chini-train-train-0125-dp4-infra	PC1	83	fail	3mo ago
chini-train-train-0124-dp4-adversarial	PC5	78	fail	3mo ago
chini-train-train-0123-dp4-civic	PC4	80	fail	3mo ago
chini-train-train-0122-dp4-personal	PC3	62	fail	3mo ago
chini-train-train-0121-dp4-workflow	PC2	68	fail	3mo ago
chini-train-train-0120-dp4-infra	PC1	76	fail	3mo ago
chini-train-train-0119-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0118-dp4-civic	PC4	75	fail	3mo ago
chini-train-train-0117-dp4-personal	PC3	69	fail	3mo ago
chini-train-train-0116-dp4-workflow	PC2	70	fail	3mo ago
chini-train-train-0115-dp4-infra	PC1	78	fail	3mo ago
chini-train-train-0114-dp4-adversarial	PC5	78	fail	3mo ago
chini-train-train-0113-dp4-civic	PC4	71	fail	3mo ago
chini-train-train-0112-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0111-dp4-workflow	PC2	68	fail	3mo ago
chini-train-train-0110-dp4-infra	PC1	74	fail	3mo ago
chini-train-train-0109-dp4-adversarial	PC5	80	fail	3mo ago
chini-train-train-0108-dp4-civic	PC4	64	fail	3mo ago
chini-train-train-0107-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0106-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0105-dp4-infra	PC1	62	fail	3mo ago
chini-train-train-0104-dp4-adversarial	PC5	69	fail	3mo ago
chini-train-train-0103-dp4-civic	PC4	79	fail	3mo ago
chini-train-train-0102-dp4-personal	PC3	73	fail	3mo ago
chini-train-train-0101-dp4-workflow	PC2	69	fail	3mo ago
chini-train-train-0100-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0049-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0048-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0047-dp3-personal	PC3	72	fail	3mo ago
chini-train-train-0046-dp3-workflow	PC2	80	fail	3mo ago
chini-train-train-0045-dp3-infra	PC1	77	fail	3mo ago
chini-train-train-0044-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0043-dp3-civic	PC4	78	fail	3mo ago
chini-train-train-0042-dp2-personal	PC3	81	fail	3mo ago
chini-train-train-0041-dp2-workflow	PC2	85	fail	3mo ago
chini-train-train-0040-dp2-infra	PC1	78	fail	3mo ago
chini-train-train-0039-dp2-adversarial	PC5	80	fail	3mo ago
chini-train-train-0038-dp2-civic	PC4	75	fail	3mo ago
chini-train-train-0037-dp2-personal	PC3	77	fail	3mo ago
chini-train-train-0036-dp2-workflow	PC2	78	fail	3mo ago
chini-train-train-0035-dp2-infra	PC1	81	fail	3mo ago
chini-train-train-0034-dp2-adversarial	PC5	78	fail	3mo ago
chini-train-train-0033-dp2-civic	PC4	82	fail	3mo ago
chini-train-train-0032-dp2-personal	PC3	71	fail	3mo ago
chini-train-train-0031-dp2-workflow	PC2	79	fail	3mo ago
chini-train-train-0030-dp2-infra	PC1	80	fail	3mo ago
chini-train-train-0029-dp2-adversarial	PC5	85	fail	3mo ago
chini-train-train-0028-dp2-civic	PC4	75	fail	3mo ago
chini-train-train-0027-dp2-personal	PC3	73	fail	3mo ago
chini-train-train-0026-dp2-workflow	PC2	74	fail	3mo ago
chini-train-train-0025-dp2-infra	PC1	82	fail	3mo ago
chini-train-train-0024-dp2-adversarial	PC5	81	fail	3mo ago
chini-train-train-0023-dp2-civic	PC4	79	fail	3mo ago
chini-train-train-0022-dp2-personal	PC3	79	fail	3mo ago
chini-train-train-0021-dp2-workflow	PC2	81	fail	3mo ago
chini-train-train-0020-dp2-infra	PC1	73	fail	3mo ago
chini-train-train-0019-dp2-adversarial	PC5	78	fail	3mo ago
chini-train-train-0018-dp2-civic	PC4	81	fail	3mo ago
chini-train-train-0017-dp2-personal	PC3	81	fail	3mo ago
chini-train-train-0016-dp2-workflow	PC2	76	fail	3mo ago
chini-train-train-0015-dp2-infra	PC1	81	fail	3mo ago
chini-train-train-0014-dp2-adversarial	PC5	80	fail	3mo ago
chini-train-train-0013-dp1-civic	PC4	95	PASS	3mo ago
chini-train-train-0012-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0011-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0010-dp1-infra	PC1	95	PASS	3mo ago
chini-train-train-0009-dp1-adversarial	PC5	95	PASS	3mo ago
chini-train-train-0008-dp1-civic	PC4	95	PASS	3mo ago
chini-train-train-0007-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0006-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0005-dp1-infra	PC1	95	PASS	3mo ago
chini-train-train-0004-dp1-adversarial	PC5	95	PASS	3mo ago
chini-train-train-0003-dp1-civic	PC4	95	PASS	3mo ago
chini-train-train-0002-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0001-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0000-dp1-infra	PC1	95	PASS	3mo ago

▸ chini-train-08

fmt_a_v4_opus_7b

78 PC1

72 PC2

79 PC3

72 PC4

83 PC5

77 /100

10%

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	84	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	79	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	67	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	71	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	71	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	87	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	62	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	74	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	66	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	73	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	79	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	69	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	83	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	68	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	72	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	82	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	78	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	91	PASS	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	81	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-08

base_7b

83 PC1

80 PC2

76 PC3

74 PC4

72 PC5

77 /100

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	57	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	71	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	73	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	85	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	83	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	83	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	68	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	78	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	80	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	82	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	71	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	66	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	72	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	71	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	79	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	84	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	86	fail	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	84	fail	3mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	3mo ago

▸ chini-train-03

grok-4.1-fast

76 PC1

77 PC2

77 PC3

75 PC4

75 PC5

76 /100

400

3mo ago

Per-problem breakdown (400 runs)

Problem	Class	Score	Result	When
chini-train-train-0399-dp6-adversarial	PC5	76	fail	3mo ago
chini-train-train-0398-dp6-civic	PC4	76	fail	3mo ago
chini-train-train-0397-dp6-personal	PC3	79	fail	3mo ago
chini-train-train-0396-dp6-workflow	PC2	80	fail	3mo ago
chini-train-train-0395-dp6-infra	PC1	77	fail	3mo ago
chini-train-train-0394-dp6-adversarial	PC5	72	fail	3mo ago
chini-train-train-0393-dp6-civic	PC4	80	fail	3mo ago
chini-train-train-0392-dp6-personal	PC3	79	fail	3mo ago
chini-train-train-0391-dp6-workflow	PC2	79	fail	3mo ago
chini-train-train-0390-dp6-infra	PC1	76	fail	3mo ago
chini-train-train-0389-dp6-adversarial	PC5	76	fail	3mo ago
chini-train-train-0388-dp6-civic	PC4	71	fail	3mo ago
chini-train-train-0387-dp6-personal	PC3	78	fail	3mo ago
chini-train-train-0386-dp6-workflow	PC2	82	fail	3mo ago
chini-train-train-0385-dp5-infra	PC1	79	fail	3mo ago
chini-train-train-0384-dp5-adversarial	PC5	77	fail	3mo ago
chini-train-train-0383-dp5-civic	PC4	70	fail	3mo ago
chini-train-train-0382-dp5-personal	PC3	78	fail	3mo ago
chini-train-train-0381-dp5-workflow	PC2	78	fail	3mo ago
chini-train-train-0380-dp5-infra	PC1	71	fail	3mo ago
chini-train-train-0379-dp5-adversarial	PC5	76	fail	3mo ago
chini-train-train-0378-dp5-civic	PC4	73	fail	3mo ago
chini-train-train-0377-dp5-personal	PC3	73	fail	3mo ago
chini-train-train-0376-dp5-workflow	PC2	84	fail	3mo ago
chini-train-train-0375-dp5-infra	PC1	80	fail	3mo ago
chini-train-train-0374-dp5-adversarial	PC5	77	fail	3mo ago
chini-train-train-0373-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0372-dp5-personal	PC3	80	fail	3mo ago
chini-train-train-0371-dp5-workflow	PC2	82	fail	3mo ago
chini-train-train-0370-dp5-infra	PC1	81	fail	3mo ago
chini-train-train-0369-dp5-adversarial	PC5	78	fail	3mo ago
chini-train-train-0368-dp5-civic	PC4	76	fail	3mo ago
chini-train-train-0367-dp5-personal	PC3	78	fail	3mo ago
chini-train-train-0366-dp5-workflow	PC2	69	fail	3mo ago
chini-train-train-0365-dp5-infra	PC1	77	fail	3mo ago
chini-train-train-0364-dp5-adversarial	PC5	81	fail	3mo ago
chini-train-train-0363-dp5-civic	PC4	75	fail	3mo ago
chini-train-train-0362-dp5-personal	PC3	70	fail	3mo ago
chini-train-train-0361-dp5-workflow	PC2	83	fail	3mo ago
chini-train-train-0360-dp5-infra	PC1	79	fail	3mo ago
chini-train-train-0359-dp5-adversarial	PC5	74	fail	3mo ago
chini-train-train-0358-dp5-civic	PC4	73	fail	3mo ago
chini-train-train-0357-dp5-personal	PC3	74	fail	3mo ago
chini-train-train-0356-dp4-workflow	PC2	73	fail	3mo ago
chini-train-train-0355-dp4-infra	PC1	81	fail	3mo ago
chini-train-train-0354-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0353-dp4-civic	PC4	82	fail	3mo ago
chini-train-train-0352-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0351-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0350-dp4-infra	PC1	80	fail	3mo ago
chini-train-train-0349-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0348-dp4-civic	PC4	78	fail	3mo ago
chini-train-train-0347-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0346-dp4-workflow	PC2	75	fail	3mo ago
chini-train-train-0345-dp4-infra	PC1	83	fail	3mo ago
chini-train-train-0344-dp4-adversarial	PC5	74	fail	3mo ago
chini-train-train-0343-dp4-civic	PC4	82	fail	3mo ago
chini-train-train-0342-dp4-personal	PC3	79	fail	3mo ago
chini-train-train-0341-dp4-workflow	PC2	82	fail	3mo ago
chini-train-train-0340-dp4-infra	PC1	73	fail	3mo ago
chini-train-train-0339-dp4-adversarial	PC5	78	fail	3mo ago
chini-train-train-0338-dp4-civic	PC4	67	fail	3mo ago
chini-train-train-0337-dp4-personal	PC3	77	fail	3mo ago
chini-train-train-0336-dp4-workflow	PC2	76	fail	3mo ago
chini-train-train-0335-dp4-infra	PC1	84	fail	3mo ago
chini-train-train-0334-dp4-adversarial	PC5	78	fail	3mo ago
chini-train-train-0333-dp4-civic	PC4	82	fail	3mo ago
chini-train-train-0332-dp4-personal	PC3	70	fail	3mo ago
chini-train-train-0331-dp4-workflow	PC2	78	fail	3mo ago
chini-train-train-0330-dp4-infra	PC1	81	fail	3mo ago
chini-train-train-0329-dp4-adversarial	PC5	78	fail	3mo ago
chini-train-train-0328-dp4-civic	PC4	71	fail	3mo ago
chini-train-train-0327-dp4-personal	PC3	75	fail	3mo ago
chini-train-train-0326-dp4-workflow	PC2	77	fail	3mo ago
chini-train-train-0325-dp4-infra	PC1	67	fail	3mo ago
chini-train-train-0324-dp4-adversarial	PC5	79	fail	3mo ago
chini-train-train-0323-dp4-civic	PC4	80	fail	3mo ago
chini-train-train-0322-dp4-personal	PC3	75	fail	3mo ago
chini-train-train-0321-dp4-workflow	PC2	78	fail	3mo ago
chini-train-train-0320-dp4-infra	PC1	72	fail	3mo ago
chini-train-train-0319-dp4-adversarial	PC5	83	fail	3mo ago
chini-train-train-0318-dp4-civic	PC4	81	fail	3mo ago
chini-train-train-0317-dp4-personal	PC3	80	fail	3mo ago
chini-train-train-0316-dp4-workflow	PC2	84	fail	3mo ago
chini-train-train-0315-dp4-infra	PC1	74	fail	3mo ago
chini-train-train-0314-dp4-adversarial	PC5	71	fail	3mo ago
chini-train-train-0313-dp4-civic	PC4	76	fail	3mo ago
chini-train-train-0312-dp4-personal	PC3	78	fail	3mo ago
chini-train-train-0311-dp4-workflow	PC2	80	fail	3mo ago
chini-train-train-0310-dp4-infra	PC1	80	fail	3mo ago
chini-train-train-0309-dp4-adversarial	PC5	80	fail	3mo ago
chini-train-train-0308-dp4-civic	PC4	81	fail	3mo ago
chini-train-train-0307-dp4-personal	PC3	89	fail	3mo ago
chini-train-train-0306-dp4-workflow	PC2	80	fail	3mo ago
chini-train-train-0305-dp4-infra	PC1	75	fail	3mo ago
chini-train-train-0304-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0303-dp4-civic	PC4	79	fail	3mo ago
chini-train-train-0302-dp4-personal	PC3	81	fail	3mo ago
chini-train-train-0301-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0300-dp4-infra	PC1	73	fail	3mo ago
chini-train-train-0299-dp3-adversarial	PC5	84	fail	3mo ago
chini-train-train-0298-dp3-civic	PC4	74	fail	3mo ago
chini-train-train-0297-dp3-personal	PC3	80	fail	3mo ago
chini-train-train-0296-dp3-workflow	PC2	82	fail	3mo ago
chini-train-train-0295-dp3-infra	PC1	75	fail	3mo ago
chini-train-train-0294-dp3-adversarial	PC5	85	fail	3mo ago
chini-train-train-0293-dp3-civic	PC4	70	fail	3mo ago
chini-train-train-0292-dp3-personal	PC3	84	fail	3mo ago
chini-train-train-0291-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0290-dp3-infra	PC1	82	fail	3mo ago
chini-train-train-0289-dp3-adversarial	PC5	82	fail	3mo ago
chini-train-train-0288-dp3-civic	PC4	84	fail	3mo ago
chini-train-train-0287-dp3-personal	PC3	78	fail	3mo ago
chini-train-train-0286-dp3-workflow	PC2	80	fail	3mo ago
chini-train-train-0285-dp3-infra	PC1	81	fail	3mo ago
chini-train-train-0284-dp3-adversarial	PC5	84	fail	3mo ago
chini-train-train-0283-dp3-civic	PC4	77	fail	3mo ago
chini-train-train-0282-dp3-personal	PC3	70	fail	3mo ago
chini-train-train-0281-dp3-workflow	PC2	90	fail	3mo ago
chini-train-train-0280-dp3-infra	PC1	75	fail	3mo ago
chini-train-train-0279-dp3-adversarial	PC5	77	fail	3mo ago
chini-train-train-0278-dp3-civic	PC4	85	fail	3mo ago
chini-train-train-0277-dp3-personal	PC3	81	fail	3mo ago
chini-train-train-0276-dp3-workflow	PC2	74	fail	3mo ago
chini-train-train-0275-dp3-infra	PC1	76	fail	3mo ago
chini-train-train-0274-dp3-adversarial	PC5	76	fail	3mo ago
chini-train-train-0273-dp3-civic	PC4	84	fail	3mo ago
chini-train-train-0272-dp3-personal	PC3	85	fail	3mo ago
chini-train-train-0271-dp3-workflow	PC2	81	fail	3mo ago
chini-train-train-0270-dp3-infra	PC1	84	fail	3mo ago
chini-train-train-0269-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0268-dp3-civic	PC4	84	fail	3mo ago
chini-train-train-0267-dp3-personal	PC3	73	fail	3mo ago
chini-train-train-0266-dp3-workflow	PC2	81	fail	3mo ago
chini-train-train-0265-dp3-infra	PC1	82	fail	3mo ago
chini-train-train-0264-dp3-adversarial	PC5	73	fail	3mo ago
chini-train-train-0263-dp3-civic	PC4	78	fail	3mo ago
chini-train-train-0262-dp3-personal	PC3	76	fail	3mo ago
chini-train-train-0261-dp3-workflow	PC2	85	fail	3mo ago
chini-train-train-0260-dp3-infra	PC1	77	fail	3mo ago
chini-train-train-0259-dp3-adversarial	PC5	72	fail	3mo ago
chini-train-train-0258-dp3-civic	PC4	84	fail	3mo ago
chini-train-train-0257-dp3-personal	PC3	81	fail	3mo ago
chini-train-train-0256-dp3-workflow	PC2	81	fail	3mo ago
chini-train-train-0255-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0254-dp3-adversarial	PC5	84	fail	3mo ago
chini-train-train-0253-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0252-dp3-personal	PC3	82	fail	3mo ago
chini-train-train-0251-dp3-workflow	PC2	74	fail	3mo ago
chini-train-train-0250-dp3-infra	PC1	77	fail	3mo ago
chini-train-train-0249-dp3-adversarial	PC5	72	fail	3mo ago
chini-train-train-0248-dp3-civic	PC4	75	fail	3mo ago
chini-train-train-0247-dp3-personal	PC3	79	fail	3mo ago
chini-train-train-0246-dp3-workflow	PC2	90	fail	3mo ago
chini-train-train-0245-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0244-dp3-adversarial	PC5	85	fail	3mo ago
chini-train-train-0243-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0242-dp2-personal	PC3	91	fail	3mo ago
chini-train-train-0241-dp2-workflow	PC2	82	fail	3mo ago
chini-train-train-0240-dp2-infra	PC1	83	fail	3mo ago
chini-train-train-0239-dp2-adversarial	PC5	81	fail	3mo ago
chini-train-train-0238-dp2-civic	PC4	81	fail	3mo ago
chini-train-train-0237-dp2-personal	PC3	81	fail	3mo ago
chini-train-train-0236-dp2-workflow	PC2	81	fail	3mo ago
chini-train-train-0235-dp2-infra	PC1	79	fail	3mo ago
chini-train-train-0234-dp2-adversarial	PC5	85	fail	3mo ago
chini-train-train-0233-dp2-civic	PC4	94	PASS	3mo ago
chini-train-train-0232-dp2-personal	PC3	86	fail	3mo ago
chini-train-train-0231-dp2-workflow	PC2	91	fail	3mo ago
chini-train-train-0230-dp2-infra	PC1	76	fail	3mo ago
chini-train-train-0229-dp2-adversarial	PC5	81	fail	3mo ago
chini-train-train-0228-dp2-civic	PC4	81	fail	3mo ago
chini-train-train-0227-dp2-personal	PC3	83	fail	3mo ago
chini-train-train-0226-dp2-workflow	PC2	89	fail	3mo ago
chini-train-train-0225-dp2-infra	PC1	78	fail	3mo ago
chini-train-train-0224-dp2-adversarial	PC5	85	fail	3mo ago
chini-train-train-0223-dp2-civic	PC4	80	fail	3mo ago
chini-train-train-0222-dp2-personal	PC3	78	fail	3mo ago
chini-train-train-0221-dp2-workflow	PC2	83	fail	3mo ago
chini-train-train-0220-dp2-infra	PC1	78	fail	3mo ago
chini-train-train-0219-dp2-adversarial	PC5	82	fail	3mo ago
chini-train-train-0218-dp2-civic	PC4	80	fail	3mo ago
chini-train-train-0217-dp2-personal	PC3	91	PASS	3mo ago
chini-train-train-0216-dp2-workflow	PC2	92	PASS	3mo ago
chini-train-train-0215-dp2-infra	PC1	92	PASS	3mo ago
chini-train-train-0214-dp2-adversarial	PC5	92	PASS	3mo ago
chini-train-train-0213-dp1-civic	PC4	96	PASS	3mo ago
chini-train-train-0212-dp1-personal	PC3	96	PASS	3mo ago
chini-train-train-0211-dp1-workflow	PC2	96	PASS	3mo ago
chini-train-train-0210-dp1-infra	PC1	96	PASS	3mo ago
chini-train-train-0209-dp1-adversarial	PC5	96	PASS	3mo ago
chini-train-train-0208-dp1-civic	PC4	96	PASS	3mo ago
chini-train-train-0207-dp1-personal	PC3	96	PASS	3mo ago
chini-train-train-0206-dp1-workflow	PC2	96	PASS	3mo ago
chini-train-train-0205-dp1-infra	PC1	96	PASS	3mo ago
chini-train-train-0204-dp1-adversarial	PC5	96	PASS	3mo ago
chini-train-train-0203-dp1-civic	PC4	96	PASS	3mo ago
chini-train-train-0202-dp1-personal	PC3	96	PASS	3mo ago
chini-train-train-0201-dp1-workflow	PC2	94	PASS	3mo ago
chini-train-train-0200-dp1-infra	PC1	96	PASS	3mo ago
chini-train-train-0199-dp6-adversarial	PC5	62	fail	3mo ago
chini-train-train-0198-dp6-civic	PC4	66	fail	3mo ago
chini-train-train-0197-dp6-personal	PC3	61	fail	3mo ago
chini-train-train-0196-dp6-workflow	PC2	66	fail	3mo ago
chini-train-train-0195-dp6-infra	PC1	76	fail	3mo ago
chini-train-train-0194-dp6-adversarial	PC5	61	fail	3mo ago
chini-train-train-0193-dp6-civic	PC4	73	fail	3mo ago
chini-train-train-0192-dp6-personal	PC3	69	fail	3mo ago
chini-train-train-0191-dp6-workflow	PC2	61	fail	3mo ago
chini-train-train-0190-dp6-infra	PC1	68	fail	3mo ago
chini-train-train-0189-dp6-adversarial	PC5	75	fail	3mo ago
chini-train-train-0188-dp6-civic	PC4	62	fail	3mo ago
chini-train-train-0187-dp6-personal	PC3	71	fail	3mo ago
chini-train-train-0186-dp6-workflow	PC2	62	fail	3mo ago
chini-train-train-0185-dp5-infra	PC1	57	fail	3mo ago
chini-train-train-0184-dp5-adversarial	PC5	70	fail	3mo ago
chini-train-train-0183-dp5-civic	PC4	56	fail	3mo ago
chini-train-train-0182-dp5-personal	PC3	76	fail	3mo ago
chini-train-train-0181-dp5-workflow	PC2	61	fail	3mo ago
chini-train-train-0180-dp5-infra	PC1	66	fail	3mo ago
chini-train-train-0179-dp5-adversarial	PC5	65	fail	3mo ago
chini-train-train-0178-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0177-dp5-personal	PC3	59	fail	3mo ago
chini-train-train-0176-dp5-workflow	PC2	74	fail	3mo ago
chini-train-train-0175-dp5-infra	PC1	83	fail	3mo ago
chini-train-train-0174-dp5-adversarial	PC5	68	fail	3mo ago
chini-train-train-0173-dp5-civic	PC4	71	fail	3mo ago
chini-train-train-0172-dp5-personal	PC3	80	fail	3mo ago
chini-train-train-0171-dp5-workflow	PC2	63	fail	3mo ago
chini-train-train-0170-dp5-infra	PC1	77	fail	3mo ago
chini-train-train-0169-dp5-adversarial	PC5	65	fail	3mo ago
chini-train-train-0168-dp5-civic	PC4	60	fail	3mo ago
chini-train-train-0167-dp5-personal	PC3	62	fail	3mo ago
chini-train-train-0166-dp5-workflow	PC2	70	fail	3mo ago
chini-train-train-0165-dp5-infra	PC1	64	fail	3mo ago
chini-train-train-0164-dp5-adversarial	PC5	53	fail	3mo ago
chini-train-train-0163-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0162-dp5-personal	PC3	63	fail	3mo ago
chini-train-train-0161-dp5-workflow	PC2	77	fail	3mo ago
chini-train-train-0160-dp5-infra	PC1	67	fail	3mo ago
chini-train-train-0159-dp5-adversarial	PC5	66	fail	3mo ago
chini-train-train-0158-dp5-civic	PC4	67	fail	3mo ago
chini-train-train-0157-dp5-personal	PC3	73	fail	3mo ago
chini-train-train-0156-dp4-workflow	PC2	64	fail	3mo ago
chini-train-train-0155-dp4-infra	PC1	67	fail	3mo ago
chini-train-train-0154-dp4-adversarial	PC5	66	fail	3mo ago
chini-train-train-0153-dp4-civic	PC4	78	fail	3mo ago
chini-train-train-0152-dp4-personal	PC3	61	fail	3mo ago
chini-train-train-0151-dp4-workflow	PC2	67	fail	3mo ago
chini-train-train-0150-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0149-dp4-adversarial	PC5	65	fail	3mo ago
chini-train-train-0148-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0147-dp4-personal	PC3	69	fail	3mo ago
chini-train-train-0146-dp4-workflow	PC2	76	fail	3mo ago
chini-train-train-0145-dp4-infra	PC1	69	fail	3mo ago
chini-train-train-0144-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0143-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0142-dp4-personal	PC3	67	fail	3mo ago
chini-train-train-0141-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0140-dp4-infra	PC1	64	fail	3mo ago
chini-train-train-0139-dp4-adversarial	PC5	67	fail	3mo ago
chini-train-train-0138-dp4-civic	PC4	65	fail	3mo ago
chini-train-train-0137-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0136-dp4-workflow	PC2	78	fail	3mo ago
chini-train-train-0135-dp4-infra	PC1	70	fail	3mo ago
chini-train-train-0134-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0133-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0132-dp4-personal	PC3	67	fail	3mo ago
chini-train-train-0131-dp4-workflow	PC2	63	fail	3mo ago
chini-train-train-0130-dp4-infra	PC1	75	fail	3mo ago
chini-train-train-0129-dp4-adversarial	PC5	69	fail	3mo ago
chini-train-train-0128-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0127-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0126-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0125-dp4-infra	PC1	70	fail	3mo ago
chini-train-train-0124-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0123-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0122-dp4-personal	PC3	71	fail	3mo ago
chini-train-train-0121-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0120-dp4-infra	PC1	57	fail	3mo ago
chini-train-train-0119-dp4-adversarial	PC5	71	fail	3mo ago
chini-train-train-0118-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0117-dp4-personal	PC3	72	fail	3mo ago
chini-train-train-0116-dp4-workflow	PC2	73	fail	3mo ago
chini-train-train-0115-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0114-dp4-adversarial	PC5	67	fail	3mo ago
chini-train-train-0113-dp4-civic	PC4	62	fail	3mo ago
chini-train-train-0112-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0111-dp4-workflow	PC2	71	fail	3mo ago
chini-train-train-0110-dp4-infra	PC1	69	fail	3mo ago
chini-train-train-0109-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0108-dp4-civic	PC4	65	fail	3mo ago
chini-train-train-0107-dp4-personal	PC3	64	fail	3mo ago
chini-train-train-0106-dp4-workflow	PC2	67	fail	3mo ago
chini-train-train-0105-dp4-infra	PC1	59	fail	3mo ago
chini-train-train-0104-dp4-adversarial	PC5	65	fail	3mo ago
chini-train-train-0103-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0102-dp4-personal	PC3	78	fail	3mo ago
chini-train-train-0101-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0100-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0099-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0098-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0097-dp3-personal	PC3	63	fail	3mo ago
chini-train-train-0096-dp3-workflow	PC2	69	fail	3mo ago
chini-train-train-0095-dp3-infra	PC1	81	fail	3mo ago
chini-train-train-0094-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0093-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0092-dp3-personal	PC3	72	fail	3mo ago
chini-train-train-0091-dp3-workflow	PC2	79	fail	3mo ago
chini-train-train-0090-dp3-infra	PC1	74	fail	3mo ago
chini-train-train-0089-dp3-adversarial	PC5	69	fail	3mo ago
chini-train-train-0088-dp3-civic	PC4	75	fail	3mo ago
chini-train-train-0087-dp3-personal	PC3	78	fail	3mo ago
chini-train-train-0086-dp3-workflow	PC2	74	fail	3mo ago
chini-train-train-0085-dp3-infra	PC1	75	fail	3mo ago
chini-train-train-0084-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0083-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0082-dp3-personal	PC3	84	fail	3mo ago
chini-train-train-0081-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0080-dp3-infra	PC1	74	fail	3mo ago
chini-train-train-0079-dp3-adversarial	PC5	69	fail	3mo ago
chini-train-train-0078-dp3-civic	PC4	74	fail	3mo ago
chini-train-train-0077-dp3-personal	PC3	70	fail	3mo ago
chini-train-train-0076-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0075-dp3-infra	PC1	75	fail	3mo ago
chini-train-train-0074-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0073-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0072-dp3-personal	PC3	78	fail	3mo ago
chini-train-train-0071-dp3-workflow	PC2	63	fail	3mo ago
chini-train-train-0070-dp3-infra	PC1	74	fail	3mo ago
chini-train-train-0069-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0068-dp3-civic	PC4	72	fail	3mo ago
chini-train-train-0067-dp3-personal	PC3	68	fail	3mo ago
chini-train-train-0066-dp3-workflow	PC2	72	fail	3mo ago
chini-train-train-0065-dp3-infra	PC1	78	fail	3mo ago
chini-train-train-0064-dp3-adversarial	PC5	73	fail	3mo ago
chini-train-train-0063-dp3-civic	PC4	84	fail	3mo ago
chini-train-train-0062-dp3-personal	PC3	78	fail	3mo ago
chini-train-train-0061-dp3-workflow	PC2	71	fail	3mo ago
chini-train-train-0060-dp3-infra	PC1	68	fail	3mo ago
chini-train-train-0059-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0058-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0057-dp3-personal	PC3	64	fail	3mo ago
chini-train-train-0056-dp3-workflow	PC2	68	fail	3mo ago
chini-train-train-0055-dp3-infra	PC1	75	fail	3mo ago
chini-train-train-0054-dp3-adversarial	PC5	67	fail	3mo ago
chini-train-train-0053-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0052-dp3-personal	PC3	74	fail	3mo ago
chini-train-train-0051-dp3-workflow	PC2	69	fail	3mo ago
chini-train-train-0050-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0049-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0048-dp3-civic	PC4	72	fail	3mo ago
chini-train-train-0047-dp3-personal	PC3	69	fail	3mo ago
chini-train-train-0046-dp3-workflow	PC2	72	fail	3mo ago
chini-train-train-0045-dp3-infra	PC1	68	fail	3mo ago
chini-train-train-0044-dp3-adversarial	PC5	67	fail	3mo ago
chini-train-train-0043-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0042-dp2-personal	PC3	78	fail	3mo ago
chini-train-train-0041-dp2-workflow	PC2	90	fail	3mo ago
chini-train-train-0040-dp2-infra	PC1	82	fail	3mo ago
chini-train-train-0039-dp2-adversarial	PC5	78	fail	3mo ago
chini-train-train-0038-dp2-civic	PC4	78	fail	3mo ago
chini-train-train-0037-dp2-personal	PC3	77	fail	3mo ago
chini-train-train-0036-dp2-workflow	PC2	79	fail	3mo ago
chini-train-train-0035-dp2-infra	PC1	78	fail	3mo ago
chini-train-train-0034-dp2-adversarial	PC5	78	fail	3mo ago
chini-train-train-0033-dp2-civic	PC4	78	fail	3mo ago
chini-train-train-0032-dp2-personal	PC3	88	PASS	3mo ago
chini-train-train-0031-dp2-workflow	PC2	78	fail	3mo ago
chini-train-train-0030-dp2-infra	PC1	73	fail	3mo ago
chini-train-train-0029-dp2-adversarial	PC5	80	fail	3mo ago
chini-train-train-0028-dp2-civic	PC4	76	fail	3mo ago
chini-train-train-0027-dp2-personal	PC3	89	fail	3mo ago
chini-train-train-0026-dp2-workflow	PC2	87	fail	3mo ago
chini-train-train-0025-dp2-infra	PC1	82	fail	3mo ago
chini-train-train-0024-dp2-adversarial	PC5	83	fail	3mo ago
chini-train-train-0023-dp2-civic	PC4	78	fail	3mo ago
chini-train-train-0022-dp2-personal	PC3	79	fail	3mo ago
chini-train-train-0021-dp2-workflow	PC2	78	fail	3mo ago
chini-train-train-0020-dp2-infra	PC1	73	fail	3mo ago
chini-train-train-0019-dp2-adversarial	PC5	78	fail	3mo ago
chini-train-train-0018-dp2-civic	PC4	71	fail	3mo ago
chini-train-train-0017-dp2-personal	PC3	77	fail	3mo ago
chini-train-train-0016-dp2-workflow	PC2	82	fail	3mo ago
chini-train-train-0015-dp2-infra	PC1	86	fail	3mo ago
chini-train-train-0014-dp2-adversarial	PC5	80	fail	3mo ago
chini-train-train-0013-dp1-civic	PC4	96	PASS	3mo ago
chini-train-train-0012-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0011-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0010-dp1-infra	PC1	95	PASS	3mo ago
chini-train-train-0009-dp1-adversarial	PC5	95	PASS	3mo ago
chini-train-train-0008-dp1-civic	PC4	95	PASS	3mo ago
chini-train-train-0007-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0006-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0005-dp1-infra	PC1	95	PASS	3mo ago
chini-train-train-0004-dp1-adversarial	PC5	95	PASS	3mo ago
chini-train-train-0003-dp1-civic	PC4	96	PASS	3mo ago
chini-train-train-0002-dp1-personal	PC3	95	PASS	3mo ago
chini-train-train-0001-dp1-workflow	PC2	95	PASS	3mo ago
chini-train-train-0000-dp1-infra	PC1	93	PASS	3mo ago

▸ chini-train-08

base

75 PC1

69 PC2

75 PC3

76 PC4

81 PC5

75 /100

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	73	fail	2mo ago
chini-train-heldout-0018-dp5-civic	PC4	69	fail	2mo ago
chini-train-heldout-0017-dp5-personal	PC3	77	fail	2mo ago
chini-train-heldout-0016-dp5-workflow	PC2	66	fail	2mo ago
chini-train-heldout-0015-dp4-infra	PC1	77	fail	2mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	83	fail	2mo ago
chini-train-heldout-0013-dp4-civic	PC4	88	fail	2mo ago
chini-train-heldout-0012-dp4-personal	PC3	75	fail	2mo ago
chini-train-heldout-0011-dp4-workflow	PC2	58	fail	2mo ago
chini-train-heldout-0010-dp4-infra	PC1	62	fail	2mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	78	fail	2mo ago
chini-train-heldout-0008-dp3-civic	PC4	65	fail	2mo ago
chini-train-heldout-0007-dp3-personal	PC3	73	fail	2mo ago
chini-train-heldout-0006-dp3-workflow	PC2	71	fail	2mo ago
chini-train-heldout-0005-dp3-infra	PC1	66	fail	2mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	88	fail	2mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	2mo ago
chini-train-heldout-0002-dp2-personal	PC3	76	fail	2mo ago
chini-train-heldout-0001-dp2-workflow	PC2	79	fail	2mo ago
chini-train-heldout-0000-dp1-infra	PC1	96	PASS	2mo ago

▸ rl_v06_run2

rl_policy custom

79 PC1

69 PC2

73 PC3

75 PC4

75 /100

2mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-013-pottery-studio	PC2	80	fail	2mo ago
chini-016-inbox-zero	PC3	79	fail	2mo ago
chini-006-rate-limiter	PC1	55	fail	2mo ago
chini-009-video-upload	PC1	81	fail	2mo ago
chini-017-couch-to-5k	PC3	66	fail	2mo ago
chini-007-payment-webhook	PC1	79	fail	2mo ago
chini-003-twitter-timeline	PC1	84	fail	2mo ago
chini-010-notification-fanout	PC1	89	fail	2mo ago
chini-011-cafe-morning-rush	PC2	74	fail	2mo ago
chini-014-restaurant-friday-night	PC2	49	fail	2mo ago
chini-019-vaccine-rollout	PC4	65	fail	2mo ago
chini-004-uber-dispatch	PC1	74	fail	2mo ago
chini-015-er-triage	PC2	71	fail	2mo ago
chini-020-disaster-shelter	PC4	77	fail	2mo ago
chini-008-search-autocomplete	PC1	82	fail	2mo ago
chini-002-checkout	PC1	74	fail	2mo ago
chini-005-chat-fanout	PC1	91	fail	2mo ago
chini-018-polling-station	PC4	82	fail	2mo ago
chini-001-url-shortener	PC1	77	fail	2mo ago
chini-012-energy-drink-habit	PC3	75	fail	2mo ago

▸ rl_v06_run1

rl_policy custom

79 PC1

75 PC2

65 PC3

64 PC4

74 /100

15%

3mo ago

Per-problem breakdown (20 runs)

Problem	Class	Score	Result	When
chini-006-rate-limiter	PC1	63	fail	3mo ago
chini-001-url-shortener	PC1	92	PASS	3mo ago
chini-002-checkout	PC1	72	fail	3mo ago
chini-004-uber-dispatch	PC1	76	fail	3mo ago
chini-016-inbox-zero	PC3	69	fail	3mo ago
chini-005-chat-fanout	PC1	89	fail	3mo ago
chini-015-er-triage	PC2	63	fail	3mo ago
chini-020-disaster-shelter	PC4	69	fail	3mo ago
chini-009-video-upload	PC1	79	fail	3mo ago
chini-003-twitter-timeline	PC1	77	fail	3mo ago
chini-018-polling-station	PC4	72	fail	3mo ago
chini-017-couch-to-5k	PC3	74	fail	3mo ago
chini-011-cafe-morning-rush	PC2	84	fail	3mo ago
chini-013-pottery-studio	PC2	85	fail	3mo ago
chini-008-search-autocomplete	PC1	55	fail	3mo ago
chini-007-payment-webhook	PC1	94	PASS	3mo ago
chini-014-restaurant-friday-night	PC2	69	fail	3mo ago
chini-019-vaccine-rollout	PC4	50	fail	3mo ago
chini-012-energy-drink-habit	PC3	53	fail	3mo ago
chini-010-notification-fanout	PC1	91	PASS	3mo ago

▸ chini-train-08

base_3b

68 PC1

69 PC2

75 PC3

76 PC4

81 PC5

74 /100

3mo ago

Per-problem breakdown (19 runs)

Problem	Class	Score	Result	When
chini-train-heldout-0019-dp6-adversarial	PC5	73	fail	3mo ago
chini-train-heldout-0018-dp5-civic	PC4	69	fail	3mo ago
chini-train-heldout-0017-dp5-personal	PC3	77	fail	3mo ago
chini-train-heldout-0016-dp5-workflow	PC2	66	fail	3mo ago
chini-train-heldout-0015-dp4-infra	PC1	77	fail	3mo ago
chini-train-heldout-0014-dp4-adversarial	PC5	83	fail	3mo ago
chini-train-heldout-0013-dp4-civic	PC4	88	fail	3mo ago
chini-train-heldout-0012-dp4-personal	PC3	75	fail	3mo ago
chini-train-heldout-0011-dp4-workflow	PC2	58	fail	3mo ago
chini-train-heldout-0010-dp4-infra	PC1	62	fail	3mo ago
chini-train-heldout-0009-dp3-adversarial	PC5	78	fail	3mo ago
chini-train-heldout-0008-dp3-civic	PC4	65	fail	3mo ago
chini-train-heldout-0007-dp3-personal	PC3	73	fail	3mo ago
chini-train-heldout-0006-dp3-workflow	PC2	71	fail	3mo ago
chini-train-heldout-0005-dp3-infra	PC1	66	fail	3mo ago
chini-train-heldout-0004-dp3-adversarial	PC5	88	fail	3mo ago
chini-train-heldout-0003-dp2-civic	PC4	83	fail	3mo ago
chini-train-heldout-0002-dp2-personal	PC3	76	fail	3mo ago
chini-train-heldout-0001-dp2-workflow	PC2	79	fail	3mo ago

▸ alex

anthropic/claude-sonnet-4.6 default

77 PC1

60 PC2

57 PC3

75 PC4

75 PC5

70 /100

17%

3mo ago

Per-problem breakdown (30 runs)

Problem	Class	Score	Result	When
chini-030-api-scraper	PC5	70	fail	3mo ago
chini-029-comment-spam-flood	PC5	80	fail	3mo ago
chini-028-credential-stuffing	PC5	65	fail	3mo ago
chini-027-911-dispatch	PC4	61	fail	3mo ago
chini-026-food-bank-distribution	PC4	88	fail	3mo ago
chini-025-job-search-pipeline	PC3	48	fail	3mo ago
chini-024-meal-prep-sunday	PC3	65	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	81	fail	3mo ago
chini-022-phishing-funnel	PC5	92	fail	3mo ago
chini-021-ddos-shield	PC5	70	fail	3mo ago
chini-020-disaster-shelter	PC4	81	fail	3mo ago
chini-019-vaccine-rollout	PC4	64	fail	3mo ago
chini-018-polling-station	PC4	83	fail	3mo ago
chini-017-couch-to-5k	PC3	49	fail	3mo ago
chini-016-inbox-zero	PC3	95	PASS	3mo ago
chini-015-er-triage	PC2	84	fail	3mo ago
chini-014-restaurant-friday-night	PC2	20	fail	3mo ago
chini-013-pottery-studio	PC2	24	fail	3mo ago
chini-012-energy-drink-habit	PC3	29	fail	3mo ago
chini-011-cafe-morning-rush	PC2	90	PASS	3mo ago
chini-010-notification-fanout	PC1	88	PASS	3mo ago
chini-009-video-upload	PC1	83	fail	3mo ago
chini-008-search-autocomplete	PC1	84	PASS	3mo ago
chini-007-payment-webhook	PC1	80	fail	3mo ago
chini-006-rate-limiter	PC1	50	fail	3mo ago
chini-005-chat-fanout	PC1	71	fail	3mo ago
chini-004-uber-dispatch	PC1	82	fail	3mo ago
chini-003-twitter-timeline	PC1	76	fail	3mo ago
chini-002-checkout	PC1	94	PASS	3mo ago
chini-001-url-shortener	PC1	63	fail	3mo ago

▸ alex

openai/gpt-5.4 default

68 PC1

60 PC2

73 PC3

77 PC4

75 PC5

70 /100

13%

3mo ago

Per-problem breakdown (30 runs)

Problem	Class	Score	Result	When
chini-030-api-scraper	PC5	80	fail	3mo ago
chini-029-comment-spam-flood	PC5	76	fail	3mo ago
chini-028-credential-stuffing	PC5	74	fail	3mo ago
chini-027-911-dispatch	PC4	85	fail	3mo ago
chini-026-food-bank-distribution	PC4	88	fail	3mo ago
chini-025-job-search-pipeline	PC3	45	fail	3mo ago
chini-024-meal-prep-sunday	PC3	89	PASS	3mo ago
chini-023-airline-gate-turnaround	PC2	59	fail	3mo ago
chini-022-phishing-funnel	PC5	70	fail	3mo ago
chini-021-ddos-shield	PC5	75	fail	3mo ago
chini-020-disaster-shelter	PC4	83	fail	3mo ago
chini-019-vaccine-rollout	PC4	50	fail	3mo ago
chini-018-polling-station	PC4	78	fail	3mo ago
chini-017-couch-to-5k	PC3	50	fail	3mo ago
chini-016-inbox-zero	PC3	89	fail	3mo ago
chini-015-er-triage	PC2	80	fail	3mo ago
chini-014-restaurant-friday-night	PC2	27	fail	3mo ago
chini-013-pottery-studio	PC2	47	fail	3mo ago
chini-012-energy-drink-habit	PC3	92	PASS	3mo ago
chini-011-cafe-morning-rush	PC2	89	fail	3mo ago
chini-010-notification-fanout	PC1	71	fail	3mo ago
chini-009-video-upload	PC1	81	fail	3mo ago
chini-008-search-autocomplete	PC1	53	fail	3mo ago
chini-007-payment-webhook	PC1	88	PASS	3mo ago
chini-006-rate-limiter	PC1	79	fail	3mo ago
chini-005-chat-fanout	PC1	45	fail	3mo ago
chini-004-uber-dispatch	PC1	53	fail	3mo ago
chini-003-twitter-timeline	PC1	78	fail	3mo ago
chini-002-checkout	PC1	89	PASS	3mo ago
chini-001-url-shortener	PC1	47	fail	3mo ago

▸ alex

google/gemini-3.1-pro-preview default

77 PC1

48 PC2

75 PC3

73 PC4

70 PC5

70 /100

13%

3mo ago

Per-problem breakdown (30 runs)

Problem	Class	Score	Result	When
chini-030-api-scraper	PC5	40	fail	3mo ago
chini-029-comment-spam-flood	PC5	82	fail	3mo ago
chini-028-credential-stuffing	PC5	72	fail	3mo ago
chini-027-911-dispatch	PC4	74	fail	3mo ago
chini-026-food-bank-distribution	PC4	82	fail	3mo ago
chini-025-job-search-pipeline	PC3	47	fail	3mo ago
chini-024-meal-prep-sunday	PC3	88	PASS	3mo ago
chini-023-airline-gate-turnaround	PC2	48	fail	3mo ago
chini-022-phishing-funnel	PC5	82	fail	3mo ago
chini-021-ddos-shield	PC5	73	fail	3mo ago
chini-020-disaster-shelter	PC4	83	fail	3mo ago
chini-019-vaccine-rollout	PC4	82	fail	3mo ago
chini-018-polling-station	PC4	45	fail	3mo ago
chini-017-couch-to-5k	PC3	70	fail	3mo ago
chini-016-inbox-zero	PC3	89	PASS	3mo ago
chini-015-er-triage	PC2	61	fail	3mo ago
chini-014-restaurant-friday-night	PC2	20	fail	3mo ago
chini-013-pottery-studio	PC2	45	fail	3mo ago
chini-012-energy-drink-habit	PC3	83	PASS	3mo ago
chini-011-cafe-morning-rush	PC2	68	fail	3mo ago
chini-010-notification-fanout	PC1	85	fail	3mo ago
chini-009-video-upload	PC1	83	fail	3mo ago
chini-008-search-autocomplete	PC1	88	fail	3mo ago
chini-007-payment-webhook	PC1	80	fail	3mo ago
chini-006-rate-limiter	PC1	84	fail	3mo ago
chini-005-chat-fanout	PC1	76	fail	3mo ago
chini-004-uber-dispatch	PC1	30	fail	3mo ago
chini-003-twitter-timeline	PC1	79	fail	3mo ago
chini-002-checkout	PC1	80	fail	3mo ago
chini-001-url-shortener	PC1	89	PASS	3mo ago

▸ alex

x-ai/grok-4.20 default

64 PC1

71 PC2

69 PC3

67 PC4

77 PC5

69 /100

3mo ago

Per-problem breakdown (30 runs)

Problem	Class	Score	Result	When
chini-030-api-scraper	PC5	70	fail	3mo ago
chini-029-comment-spam-flood	PC5	81	fail	3mo ago
chini-028-credential-stuffing	PC5	77	fail	3mo ago
chini-027-911-dispatch	PC4	87	fail	3mo ago
chini-026-food-bank-distribution	PC4	88	fail	3mo ago
chini-025-job-search-pipeline	PC3	48	fail	3mo ago
chini-024-meal-prep-sunday	PC3	68	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	66	fail	3mo ago
chini-022-phishing-funnel	PC5	88	fail	3mo ago
chini-021-ddos-shield	PC5	69	fail	3mo ago
chini-020-disaster-shelter	PC4	55	fail	3mo ago
chini-019-vaccine-rollout	PC4	29	fail	3mo ago
chini-018-polling-station	PC4	74	fail	3mo ago
chini-017-couch-to-5k	PC3	76	fail	3mo ago
chini-016-inbox-zero	PC3	93	fail	3mo ago
chini-015-er-triage	PC2	79	fail	3mo ago
chini-014-restaurant-friday-night	PC2	92	PASS	3mo ago
chini-013-pottery-studio	PC2	29	fail	3mo ago
chini-012-energy-drink-habit	PC3	58	fail	3mo ago
chini-011-cafe-morning-rush	PC2	89	PASS	3mo ago
chini-010-notification-fanout	PC1	82	fail	3mo ago
chini-009-video-upload	PC1	82	fail	3mo ago
chini-008-search-autocomplete	PC1	54	fail	3mo ago
chini-007-payment-webhook	PC1	73	fail	3mo ago
chini-006-rate-limiter	PC1	61	fail	3mo ago
chini-005-chat-fanout	PC1	73	fail	3mo ago
chini-004-uber-dispatch	PC1	33	fail	3mo ago
chini-003-twitter-timeline	PC1	42	fail	3mo ago
chini-002-checkout	PC1	86	fail	3mo ago
chini-001-url-shortener	PC1	54	fail	3mo ago

▸ chini-train-04

grok-4.1-fast

69 PC1

69 PC2

69 PC3

68 PC4

68 PC5

69 /100

180

3mo ago

Per-problem breakdown (180 runs)

Problem	Class	Score	Result	When
chini-train-train-0394-dp6-adversarial	PC5	72	fail	3mo ago
chini-train-train-0388-dp6-civic	PC4	71	fail	3mo ago
chini-train-train-0383-dp5-civic	PC4	70	fail	3mo ago
chini-train-train-0380-dp5-infra	PC1	71	fail	3mo ago
chini-train-train-0378-dp5-civic	PC4	73	fail	3mo ago
chini-train-train-0377-dp5-personal	PC3	73	fail	3mo ago
chini-train-train-0373-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0366-dp5-workflow	PC2	69	fail	3mo ago
chini-train-train-0362-dp5-personal	PC3	70	fail	3mo ago
chini-train-train-0359-dp5-adversarial	PC5	74	fail	3mo ago
chini-train-train-0358-dp5-civic	PC4	73	fail	3mo ago
chini-train-train-0357-dp5-personal	PC3	74	fail	3mo ago
chini-train-train-0356-dp4-workflow	PC2	73	fail	3mo ago
chini-train-train-0354-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0352-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0351-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0349-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0347-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0344-dp4-adversarial	PC5	74	fail	3mo ago
chini-train-train-0340-dp4-infra	PC1	73	fail	3mo ago
chini-train-train-0338-dp4-civic	PC4	67	fail	3mo ago
chini-train-train-0332-dp4-personal	PC3	70	fail	3mo ago
chini-train-train-0328-dp4-civic	PC4	71	fail	3mo ago
chini-train-train-0325-dp4-infra	PC1	67	fail	3mo ago
chini-train-train-0320-dp4-infra	PC1	72	fail	3mo ago
chini-train-train-0315-dp4-infra	PC1	74	fail	3mo ago
chini-train-train-0314-dp4-adversarial	PC5	71	fail	3mo ago
chini-train-train-0304-dp4-adversarial	PC5	72	fail	3mo ago
chini-train-train-0301-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0300-dp4-infra	PC1	73	fail	3mo ago
chini-train-train-0298-dp3-civic	PC4	74	fail	3mo ago
chini-train-train-0293-dp3-civic	PC4	70	fail	3mo ago
chini-train-train-0291-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0282-dp3-personal	PC3	70	fail	3mo ago
chini-train-train-0276-dp3-workflow	PC2	74	fail	3mo ago
chini-train-train-0269-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0267-dp3-personal	PC3	73	fail	3mo ago
chini-train-train-0264-dp3-adversarial	PC5	73	fail	3mo ago
chini-train-train-0259-dp3-adversarial	PC5	72	fail	3mo ago
chini-train-train-0255-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0253-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0251-dp3-workflow	PC2	74	fail	3mo ago
chini-train-train-0249-dp3-adversarial	PC5	72	fail	3mo ago
chini-train-train-0245-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0243-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0199-dp6-adversarial	PC5	62	fail	3mo ago
chini-train-train-0198-dp6-civic	PC4	66	fail	3mo ago
chini-train-train-0197-dp6-personal	PC3	61	fail	3mo ago
chini-train-train-0196-dp6-workflow	PC2	66	fail	3mo ago
chini-train-train-0194-dp6-adversarial	PC5	61	fail	3mo ago
chini-train-train-0193-dp6-civic	PC4	73	fail	3mo ago
chini-train-train-0192-dp6-personal	PC3	69	fail	3mo ago
chini-train-train-0191-dp6-workflow	PC2	61	fail	3mo ago
chini-train-train-0190-dp6-infra	PC1	68	fail	3mo ago
chini-train-train-0188-dp6-civic	PC4	62	fail	3mo ago
chini-train-train-0187-dp6-personal	PC3	71	fail	3mo ago
chini-train-train-0186-dp6-workflow	PC2	62	fail	3mo ago
chini-train-train-0185-dp5-infra	PC1	57	fail	3mo ago
chini-train-train-0184-dp5-adversarial	PC5	70	fail	3mo ago
chini-train-train-0183-dp5-civic	PC4	56	fail	3mo ago
chini-train-train-0181-dp5-workflow	PC2	61	fail	3mo ago
chini-train-train-0180-dp5-infra	PC1	66	fail	3mo ago
chini-train-train-0179-dp5-adversarial	PC5	65	fail	3mo ago
chini-train-train-0178-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0177-dp5-personal	PC3	59	fail	3mo ago
chini-train-train-0176-dp5-workflow	PC2	74	fail	3mo ago
chini-train-train-0174-dp5-adversarial	PC5	68	fail	3mo ago
chini-train-train-0173-dp5-civic	PC4	71	fail	3mo ago
chini-train-train-0171-dp5-workflow	PC2	63	fail	3mo ago
chini-train-train-0169-dp5-adversarial	PC5	65	fail	3mo ago
chini-train-train-0168-dp5-civic	PC4	60	fail	3mo ago
chini-train-train-0167-dp5-personal	PC3	62	fail	3mo ago
chini-train-train-0166-dp5-workflow	PC2	70	fail	3mo ago
chini-train-train-0165-dp5-infra	PC1	64	fail	3mo ago
chini-train-train-0164-dp5-adversarial	PC5	53	fail	3mo ago
chini-train-train-0163-dp5-civic	PC4	66	fail	3mo ago
chini-train-train-0162-dp5-personal	PC3	63	fail	3mo ago
chini-train-train-0160-dp5-infra	PC1	67	fail	3mo ago
chini-train-train-0159-dp5-adversarial	PC5	66	fail	3mo ago
chini-train-train-0158-dp5-civic	PC4	67	fail	3mo ago
chini-train-train-0157-dp5-personal	PC3	73	fail	3mo ago
chini-train-train-0156-dp4-workflow	PC2	64	fail	3mo ago
chini-train-train-0155-dp4-infra	PC1	67	fail	3mo ago
chini-train-train-0154-dp4-adversarial	PC5	66	fail	3mo ago
chini-train-train-0152-dp4-personal	PC3	61	fail	3mo ago
chini-train-train-0151-dp4-workflow	PC2	67	fail	3mo ago
chini-train-train-0150-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0149-dp4-adversarial	PC5	65	fail	3mo ago
chini-train-train-0148-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0147-dp4-personal	PC3	69	fail	3mo ago
chini-train-train-0145-dp4-infra	PC1	69	fail	3mo ago
chini-train-train-0144-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0143-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0142-dp4-personal	PC3	67	fail	3mo ago
chini-train-train-0141-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0140-dp4-infra	PC1	64	fail	3mo ago
chini-train-train-0139-dp4-adversarial	PC5	67	fail	3mo ago
chini-train-train-0138-dp4-civic	PC4	65	fail	3mo ago
chini-train-train-0137-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0135-dp4-infra	PC1	70	fail	3mo ago
chini-train-train-0134-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0133-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0132-dp4-personal	PC3	67	fail	3mo ago
chini-train-train-0131-dp4-workflow	PC2	63	fail	3mo ago
chini-train-train-0129-dp4-adversarial	PC5	69	fail	3mo ago
chini-train-train-0128-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0127-dp4-personal	PC3	74	fail	3mo ago
chini-train-train-0126-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0125-dp4-infra	PC1	70	fail	3mo ago
chini-train-train-0124-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0123-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0122-dp4-personal	PC3	71	fail	3mo ago
chini-train-train-0121-dp4-workflow	PC2	74	fail	3mo ago
chini-train-train-0120-dp4-infra	PC1	57	fail	3mo ago
chini-train-train-0119-dp4-adversarial	PC5	71	fail	3mo ago
chini-train-train-0118-dp4-civic	PC4	68	fail	3mo ago
chini-train-train-0117-dp4-personal	PC3	72	fail	3mo ago
chini-train-train-0116-dp4-workflow	PC2	73	fail	3mo ago
chini-train-train-0115-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0114-dp4-adversarial	PC5	67	fail	3mo ago
chini-train-train-0113-dp4-civic	PC4	62	fail	3mo ago
chini-train-train-0112-dp4-personal	PC3	68	fail	3mo ago
chini-train-train-0111-dp4-workflow	PC2	71	fail	3mo ago
chini-train-train-0110-dp4-infra	PC1	69	fail	3mo ago
chini-train-train-0109-dp4-adversarial	PC5	68	fail	3mo ago
chini-train-train-0108-dp4-civic	PC4	65	fail	3mo ago
chini-train-train-0107-dp4-personal	PC3	64	fail	3mo ago
chini-train-train-0106-dp4-workflow	PC2	67	fail	3mo ago
chini-train-train-0105-dp4-infra	PC1	59	fail	3mo ago
chini-train-train-0104-dp4-adversarial	PC5	65	fail	3mo ago
chini-train-train-0103-dp4-civic	PC4	66	fail	3mo ago
chini-train-train-0101-dp4-workflow	PC2	66	fail	3mo ago
chini-train-train-0100-dp4-infra	PC1	66	fail	3mo ago
chini-train-train-0099-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0098-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0097-dp3-personal	PC3	69	fail	3mo ago
chini-train-train-0096-dp3-workflow	PC2	69	fail	3mo ago
chini-train-train-0094-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0093-dp3-civic	PC4	72	fail	3mo ago
chini-train-train-0092-dp3-personal	PC3	72	fail	3mo ago
chini-train-train-0090-dp3-infra	PC1	74	fail	3mo ago
chini-train-train-0089-dp3-adversarial	PC5	69	fail	3mo ago
chini-train-train-0084-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0083-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0081-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0080-dp3-infra	PC1	71	fail	3mo ago
chini-train-train-0079-dp3-adversarial	PC5	69	fail	3mo ago
chini-train-train-0078-dp3-civic	PC4	70	fail	3mo ago
chini-train-train-0077-dp3-personal	PC3	70	fail	3mo ago
chini-train-train-0076-dp3-workflow	PC2	73	fail	3mo ago
chini-train-train-0074-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0073-dp3-civic	PC4	70	fail	3mo ago
chini-train-train-0071-dp3-workflow	PC2	63	fail	3mo ago
chini-train-train-0070-dp3-infra	PC1	74	fail	3mo ago
chini-train-train-0069-dp3-adversarial	PC5	70	fail	3mo ago
chini-train-train-0068-dp3-civic	PC4	72	fail	3mo ago
chini-train-train-0067-dp3-personal	PC3	68	fail	3mo ago
chini-train-train-0066-dp3-workflow	PC2	72	fail	3mo ago
chini-train-train-0064-dp3-adversarial	PC5	73	fail	3mo ago
chini-train-train-0061-dp3-workflow	PC2	71	fail	3mo ago
chini-train-train-0060-dp3-infra	PC1	68	fail	3mo ago
chini-train-train-0059-dp3-adversarial	PC5	68	fail	3mo ago
chini-train-train-0058-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0057-dp3-personal	PC3	71	fail	3mo ago
chini-train-train-0056-dp3-workflow	PC2	61	fail	3mo ago
chini-train-train-0054-dp3-adversarial	PC5	67	fail	3mo ago
chini-train-train-0053-dp3-civic	PC4	73	fail	3mo ago
chini-train-train-0052-dp3-personal	PC3	74	fail	3mo ago
chini-train-train-0051-dp3-workflow	PC2	69	fail	3mo ago
chini-train-train-0050-dp3-infra	PC1	73	fail	3mo ago
chini-train-train-0049-dp3-adversarial	PC5	71	fail	3mo ago
chini-train-train-0048-dp3-civic	PC4	72	fail	3mo ago
chini-train-train-0047-dp3-personal	PC3	69	fail	3mo ago
chini-train-train-0046-dp3-workflow	PC2	72	fail	3mo ago
chini-train-train-0045-dp3-infra	PC1	68	fail	3mo ago
chini-train-train-0044-dp3-adversarial	PC5	67	fail	3mo ago
chini-train-train-0043-dp3-civic	PC4	68	fail	3mo ago
chini-train-train-0030-dp2-infra	PC1	73	fail	3mo ago
chini-train-train-0020-dp2-infra	PC1	73	fail	3mo ago
chini-train-train-0018-dp2-civic	PC4	71	fail	3mo ago

No account. No queue. Bring your own API key. Pick any handle (1-40 chars: letters, digits, dot, dash, underscore). Submissions are namespaced internally to prevent impersonation of official model identifiers.

Submit a run →

Recent submissions (unranked, < 3 runs)

These rows enter the ranked table after 3 scored runs.

User	Model	Avg	Best	Runs	Last
rl_v07_smoke_b	rl_policy	94	95	2 / 3	2mo ago
rl_smoke_v2_persist	rl_policy	92	92	1 / 3	3mo ago
rl_smoke8	rl_policy	63	71	2 / 3	3mo ago

Reflexion (multi-turn agentic) ranking

Agentic track: v1 generate → simulator feedback → v2 generate, one revision. One row per user × model. Min 3 runs to rank. Headline: pass after revision. Tie-breakers: structural fix rate, then v1→v2 delta, then fewer tokens. Click a row for the per-problem v1→v2 breakdown.

v2 passes: 3 / 120 Avg revision lift: -2.4 / 100 across 120 runs

Rank

User

Model

Classes (v1→v2)

Avg v1

Avg v2

Best v2

Pass after rev

Struct. fix rate

Tokens

Runs

Last

1 🥇

▸ alex

google/gemini-3.1-pro-preview default

83 → 83 PC1

54 → 70 PC2

70 → 57 PC3

71 → 68 PC4

79 → 79 PC5

97%

1,224

3mo ago

Per-problem v1 → v2 (30 runs)

Problem	Class	v1	v2	Δ	Result	When
chini-030-api-scraper	PC5	82	81	-1	fail	3mo ago
chini-029-comment-spam-flood	PC5	83	82	-1	fail	3mo ago
chini-028-credential-stuffing	PC5	78	79	+1	fail	3mo ago
chini-027-911-dispatch	PC4	79	44	-35	fail	3mo ago
chini-026-food-bank-distribution	PC4	80	91	+11	PASS	3mo ago
chini-025-job-search-pipeline	PC3	53	55	+2	fail	3mo ago
chini-024-meal-prep-sunday	PC3	74	71	-3	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	47	92	+45	fail	3mo ago
chini-022-phishing-funnel	PC5	85	78	-7	fail	3mo ago
chini-021-ddos-shield	PC5	69	75	+6	fail	3mo ago
chini-020-disaster-shelter	PC4	44	66	+22	fail	3mo ago
chini-019-vaccine-rollout	PC4	84	80	-4	fail	3mo ago
chini-018-polling-station	PC4	68	57	-11	fail	3mo ago
chini-017-couch-to-5k	PC3	72	33	-39	fail	3mo ago
chini-016-inbox-zero	PC3	86	60	-26	fail	3mo ago
chini-015-er-triage	PC2	54	63	+9	fail	3mo ago
chini-014-restaurant-friday-night	PC2	41	63	+22	fail	3mo ago
chini-013-pottery-studio	PC2	44	47	+3	fail	3mo ago
chini-012-energy-drink-habit	PC3	64	67	+3	fail	3mo ago
chini-011-cafe-morning-rush	PC2	84	86	+2	PASS	3mo ago
chini-010-notification-fanout	PC1	86	89	+3	fail	3mo ago
chini-009-video-upload	PC1	87	80	-7	fail	3mo ago
chini-008-search-autocomplete	PC1	82	89	+7	fail	3mo ago
chini-007-payment-webhook	PC1	76	79	+3	fail	3mo ago
chini-006-rate-limiter	PC1	82	82	0	fail	3mo ago
chini-005-chat-fanout	PC1	87	89	+2	fail	3mo ago
chini-004-uber-dispatch	PC1	86	79	-7	fail	3mo ago
chini-003-twitter-timeline	PC1	68	76	+8	fail	3mo ago
chini-002-checkout	PC1	94	84	-10	fail	3mo ago
chini-001-url-shortener	PC1	83	84	+1	fail	3mo ago

2 🥈

▸ alex

x-ai/grok-4.20 default

65 → 70 PC1

61 → 66 PC2

49 → 55 PC3

72 → 71 PC4

77 → 74 PC5

90%

3,221

3mo ago

Per-problem v1 → v2 (30 runs)

Problem	Class	v1	v2	Δ	Result	When
chini-030-api-scraper	PC5	73	86	+13	fail	3mo ago
chini-029-comment-spam-flood	PC5	82	75	-7	fail	3mo ago
chini-028-credential-stuffing	PC5	70	83	+13	fail	3mo ago
chini-027-911-dispatch	PC4	45	55	+10	fail	3mo ago
chini-026-food-bank-distribution	PC4	90	70	-20	fail	3mo ago
chini-025-job-search-pipeline	PC3	53	54	+1	fail	3mo ago
chini-024-meal-prep-sunday	PC3	48	82	+34	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	65	72	+7	fail	3mo ago
chini-022-phishing-funnel	PC5	83	77	-6	fail	3mo ago
chini-021-ddos-shield	PC5	79	48	-31	fail	3mo ago
chini-020-disaster-shelter	PC4	87	63	-24	fail	3mo ago
chini-019-vaccine-rollout	PC4	64	85	+21	PASS	3mo ago
chini-018-polling-station	PC4	73	81	+8	fail	3mo ago
chini-017-couch-to-5k	PC3	30	22	-8	fail	3mo ago
chini-016-inbox-zero	PC3	89	50	-39	fail	3mo ago
chini-015-er-triage	PC2	56	56	0	fail	3mo ago
chini-014-restaurant-friday-night	PC2	83	63	-20	fail	3mo ago
chini-013-pottery-studio	PC2	20	59	+39	fail	3mo ago
chini-012-energy-drink-habit	PC3	26	65	+39	fail	3mo ago
chini-011-cafe-morning-rush	PC2	81	82	+1	fail	3mo ago
chini-010-notification-fanout	PC1	85	66	-19	fail	3mo ago
chini-009-video-upload	PC1	82	74	-8	fail	3mo ago
chini-008-search-autocomplete	PC1	30	62	+32	fail	3mo ago
chini-007-payment-webhook	PC1	58	70	+12	fail	3mo ago
chini-006-rate-limiter	PC1	27	78	+51	fail	3mo ago
chini-005-chat-fanout	PC1	83	72	-11	fail	3mo ago
chini-004-uber-dispatch	PC1	54	69	+15	fail	3mo ago
chini-003-twitter-timeline	PC1	78	80	+2	fail	3mo ago
chini-002-checkout	PC1	67	66	-1	fail	3mo ago
chini-001-url-shortener	PC1	84	60	-24	fail	3mo ago

3 🥉

▸ alex

openai/gpt-5.4 default

62 → 59 PC1

65 → 48 PC2

55 → 55 PC3

65 → 60 PC4

75 → 83 PC5

-4

80%

4,004

3mo ago

Per-problem v1 → v2 (30 runs)

Problem	Class	v1	v2	Δ	Result	When
chini-030-api-scraper	PC5	50	83	+33	fail	3mo ago
chini-029-comment-spam-flood	PC5	83	81	-2	fail	3mo ago
chini-028-credential-stuffing	PC5	77	85	+8	fail	3mo ago
chini-027-911-dispatch	PC4	73	65	-8	fail	3mo ago
chini-026-food-bank-distribution	PC4	71	66	-5	fail	3mo ago
chini-025-job-search-pipeline	PC3	47	49	+2	fail	3mo ago
chini-024-meal-prep-sunday	PC3	65	83	+18	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	88	35	-53	fail	3mo ago
chini-022-phishing-funnel	PC5	86	84	-2	fail	3mo ago
chini-021-ddos-shield	PC5	79	83	+4	fail	3mo ago
chini-020-disaster-shelter	PC4	63	57	-6	fail	3mo ago
chini-019-vaccine-rollout	PC4	59	74	+15	fail	3mo ago
chini-018-polling-station	PC4	60	36	-24	fail	3mo ago
chini-017-couch-to-5k	PC3	42	15	-27	fail	3mo ago
chini-016-inbox-zero	PC3	60	65	+5	fail	3mo ago
chini-015-er-triage	PC2	62	67	+5	fail	3mo ago
chini-014-restaurant-friday-night	PC2	54	60	+6	fail	3mo ago
chini-013-pottery-studio	PC2	34	24	-10	fail	3mo ago
chini-012-energy-drink-habit	PC3	60	63	+3	fail	3mo ago
chini-011-cafe-morning-rush	PC2	88	53	-35	fail	3mo ago
chini-010-notification-fanout	PC1	82	75	-7	fail	3mo ago
chini-009-video-upload	PC1	80	68	-12	fail	3mo ago
chini-008-search-autocomplete	PC1	55	84	+29	fail	3mo ago
chini-007-payment-webhook	PC1	76	66	-10	fail	3mo ago
chini-006-rate-limiter	PC1	56	24	-32	fail	3mo ago
chini-005-chat-fanout	PC1	47	80	+33	fail	3mo ago
chini-004-uber-dispatch	PC1	29	68	+39	fail	3mo ago
chini-003-twitter-timeline	PC1	67	24	-43	fail	3mo ago
chini-002-checkout	PC1	88	36	-52	fail	3mo ago
chini-001-url-shortener	PC1	39	61	+22	fail	3mo ago

▸ alex

anthropic/claude-sonnet-4.6 default

64 → 58 PC1

63 → 48 PC2

43 → 29 PC3

65 → 56 PC4

72 → 69 PC5

-9

73%

4,496

3mo ago

Per-problem v1 → v2 (30 runs)

Problem	Class	v1	v2	Δ	Result	When
chini-030-api-scraper	PC5	86	71	-15	fail	3mo ago
chini-029-comment-spam-flood	PC5	81	81	0	fail	3mo ago
chini-028-credential-stuffing	PC5	43	74	+31	fail	3mo ago
chini-027-911-dispatch	PC4	68	81	+13	fail	3mo ago
chini-026-food-bank-distribution	PC4	88	81	-7	fail	3mo ago
chini-025-job-search-pipeline	PC3	49	34	-15	fail	3mo ago
chini-024-meal-prep-sunday	PC3	35	31	-4	fail	3mo ago
chini-023-airline-gate-turnaround	PC2	90	77	-13	fail	3mo ago
chini-022-phishing-funnel	PC5	80	76	-4	fail	3mo ago
chini-021-ddos-shield	PC5	70	44	-26	fail	3mo ago
chini-020-disaster-shelter	PC4	68	44	-24	fail	3mo ago
chini-019-vaccine-rollout	PC4	34	14	-20	fail	3mo ago
chini-018-polling-station	PC4	68	58	-10	fail	3mo ago
chini-017-couch-to-5k	PC3	20	10	-10	fail	3mo ago
chini-016-inbox-zero	PC3	88	54	-34	fail	3mo ago
chini-015-er-triage	PC2	82	44	-38	fail	3mo ago
chini-014-restaurant-friday-night	PC2	20	14	-6	fail	3mo ago
chini-013-pottery-studio	PC2	29	51	+22	fail	3mo ago
chini-012-energy-drink-habit	PC3	24	14	-10	fail	3mo ago
chini-011-cafe-morning-rush	PC2	92	56	-36	fail	3mo ago
chini-010-notification-fanout	PC1	83	48	-35	fail	3mo ago
chini-009-video-upload	PC1	85	57	-28	fail	3mo ago
chini-008-search-autocomplete	PC1	30	27	-3	fail	3mo ago
chini-007-payment-webhook	PC1	79	75	-4	fail	3mo ago
chini-006-rate-limiter	PC1	41	47	+6	fail	3mo ago
chini-005-chat-fanout	PC1	69	58	-11	fail	3mo ago
chini-004-uber-dispatch	PC1	73	46	-27	fail	3mo ago
chini-003-twitter-timeline	PC1	57	68	+11	fail	3mo ago
chini-002-checkout	PC1	64	76	+12	fail	3mo ago
chini-001-url-shortener	PC1	57	75	+18	fail	3mo ago

Pass-after-rev is the headline metric. Models that revise well rank higher even when v1 was weaker. How is this scored? →

By model

Same single-shot data, aggregated across submitters. Answers "how does this model do overall?" Min 3 runs to rank. Click a row for the per-submitter breakdown.

Rank

Model

Classes

Avg

Best

Submitters

Runs

Pass rate

Last run

1 🥇

▸ rl_v07_full

80 PC1

84 PC2

85 PC3

82 PC4

83 PC5

83 /100

10%

2mo ago

2 🥈

▸ rl_v06_run2

79 PC1

84 PC2

83 PC3

79 PC4

79 PC5

81 /100

10%

2mo ago

3 🥉

▸ rl_v07_pilot_a10b_k8_s0

80 PC1

84 PC2

84 PC3

78 PC4

79 PC5

81 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s1

81 PC1

83 PC2

81 PC3

80 PC4

79 PC5

81 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s2

80 PC1

83 PC2

84 PC3

79 PC4

78 PC5

81 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s5

80 PC1

83 PC2

82 PC3

81 PC4

79 PC5

81 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s6

80 PC1

84 PC2

81 PC3

78 PC4

81 PC5

81 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s7

80 PC1

84 PC2

83 PC3

80 PC4

79 PC5

81 /100

10%

2mo ago

▸ fmt_a_7b

80 PC1

83 PC2

81 PC3

78 PC4

79 PC5

80 /100

10%

3mo ago

▸ fmt_a_v5_mixed_7b

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

3mo ago

▸ fmt_a_v5

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s3

78 PC1

81 PC2

84 PC3

78 PC4

79 PC5

80 /100

10%

2mo ago

▸ rl_v07_pilot_a10b_k8_s4

81 PC1

84 PC2

81 PC3

76 PC4

79 PC5

80 /100

10%

2mo ago

▸ fmtA

80 PC1

82 PC2

82 PC3

79 PC4

78 PC5

80 /100

10%

2mo ago

▸ rl_policy top run: custom

79 PC1

81 PC2

79 PC3

79 PC4

79 PC5

79 /100

295

2mo ago

By submitter (7 people)

User	Avg	Best	Runs	Pass rate	Last
rl_v07_smoke_b	94	95	2	50%	2mo ago
rl_smoke_v2_persist	92	92	1	100%	3mo ago
rl_v07_full_a10	80	96	200	9%	2mo ago
rl_v07_pilot_a10b	78	96	50	8%	2mo ago
rl_v06_run2	75	91	20	0%	2mo ago
rl_v06_run1	74	94	20	15%	3mo ago
rl_smoke8	63	71	2	0%	3mo ago

▸ fmt_a

75 PC1

77 PC2

79 PC3

79 PC4

78 PC5

78 /100

3mo ago

▸ fmt_a_v2

77 PC1

77 PC2

83 PC3

78 PC4

76 PC5

78 /100

3mo ago

▸ fmt_a_3b

77 PC1

77 PC2

83 PC3

78 PC4

76 PC5

78 /100

3mo ago

▸ opus-4.7

78 PC1

78 PC2

76 PC3

77 PC4

77 PC5

77 /100

100

14%

3mo ago

▸ fmt_a_v4_opus_7b

78 PC1

72 PC2

79 PC3

72 PC4

83 PC5

77 /100

10%

3mo ago

▸ base_7b

83 PC1

80 PC2

76 PC3

74 PC4

72 PC5

77 /100

3mo ago

▸ base

75 PC1

69 PC2

75 PC3

76 PC4

81 PC5

75 /100

2mo ago

▸ grok-4.1-fast

74 PC1

75 PC2

75 PC3

73 PC4

73 PC5

74 /100

580

3mo ago

▸ base_3b

68 PC1

69 PC2

75 PC3

76 PC4

81 PC5

74 /100

3mo ago

▸ anthropic/claude-sonnet-4.6 top run: default

77 PC1

60 PC2

57 PC3

75 PC4

75 PC5

70 /100

17%

3mo ago

▸ openai/gpt-5.4 top run: default

68 PC1

60 PC2

73 PC3

77 PC4

75 PC5

70 /100

13%

3mo ago

▸ google/gemini-3.1-pro-preview top run: default

77 PC1

48 PC2

75 PC3

73 PC4

70 PC5

70 /100

13%

3mo ago

▸ x-ai/grok-4.20 top run: default

64 PC1

71 PC2

69 PC3

67 PC4

77 PC5

69 /100

3mo ago

Aggregates the same deduped single-shot pool. Different submitters running the same model count as independent samples.

Want to know how scores are computed? Read the methodology →