Model Post-Training on Cognaptus

Model Post-Training on Cognaptus https://cognaptus.com/tags/model-post-training/ Recent content in Model Post-Training on Cognaptus Hugo -- 0.145.0 en-us Wed, 03 Jun 2026 00:00:00 +0000 Compile Once, Train Later: Offline RL Moves Code-Model Verification Upstream https://cognaptus.com/blog/2026-06-03-compile-once-train-later-offline-rl-moves-codemodel-verification-upstream/ Wed, 03 Jun 2026 00:00:00 +0000 https://cognaptus.com/blog/2026-06-03-compile-once-train-later-offline-rl-moves-codemodel-verification-upstream/ A mechanism-first reading of how offline reinforcement learning can post-train code models by turning pre-verified code datasets into cheaper, harder-task learning signals.