[1]

Aarthi Anbalagan et al. 2024. Post-Training Evaluation Pipelines for Measuring LLM Performance in Coding and Logical Reasoning. Australian Journal of Machine Learning Research & Applications. 4, 1 (Feb. 2024), 474–512.