benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 11.3k β’ 75 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 378 β’ 11 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 7.58k β’ 96 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 159k β’ 367
benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 11.3k β’ 75 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 378 β’ 11 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 7.58k β’ 96 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 159k β’ 367