LLM Post-Training on Cognaptus

LLM Post-Training on Cognaptus https://cognaptus.com/tags/llm-post-training/ Recent content in LLM Post-Training on Cognaptus Hugo -- 0.145.0 en-us Wed, 06 Aug 2025 00:00:00 +0000 Thinking in Circles: How Self-Questioning LLMs Learn Without Labels https://cognaptus.com/blog/2025-08-06-thinking-in-circles-how-selfquestioning-llms-learn-without-labels/ Wed, 06 Aug 2025 00:00:00 +0000 https://cognaptus.com/blog/2025-08-06-thinking-in-circles-how-selfquestioning-llms-learn-without-labels/ A mechanism-first reading of SQLM, a self-play post-training method where language models generate their own questions, solve them, and learn from proxy rewards without curated training data.