On-Policy Distillation on Cognaptus

On-Policy Distillation on Cognaptus https://cognaptus.com/tags/on-policy-distillation/ Recent content in On-Policy Distillation on Cognaptus Hugo -- 0.145.0 en-us Fri, 19 Jun 2026 00:00:00 +0000 You Can’t Reweight a Dead End: TRD and the Prefix Failure Problem https://cognaptus.com/blog/2026-06-19-you-cant-reweight-a-dead-end-trd-and-the-prefix-failure-problem/ Fri, 19 Jun 2026 00:00:00 +0000 https://cognaptus.com/blog/2026-06-19-you-cant-reweight-a-dead-end-trd-and-the-prefix-failure-problem/ Trajectory-Refined Distillation shows why repairing failed reasoning paths may matter more than tuning token-level distillation losses.