IRT on Cognaptus

IRT on Cognaptus https://cognaptus.com/tags/irt/ Recent content in IRT on Cognaptus Hugo -- 0.145.0 en-us Sat, 20 Sep 2025 00:00:00 +0000 Benchmarks That Fight Back: Adaptive Testing for LMs https://cognaptus.com/blog/2025-09-20-benchmarks-that-fight-back-adaptive-testing-for-lms/ Sat, 20 Sep 2025 00:00:00 +0000 https://cognaptus.com/blog/2025-09-20-benchmarks-that-fight-back-adaptive-testing-for-lms/ Fluid Benchmarking shows why model evaluation should adapt to the model being tested, not merely shrink old benchmarks into cheaper static subsets.