ML Foundations Development

non-profit

https://github.com/mlfoundations

AI & ML interests

None defined yet.

Recent Activity

wenwenD submitted a paper about 5 hours ago

Calibrate-Then-Act: Cost-Aware Exploration in LLM Agents

liangyuch authored a paper 2 days ago

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

liangyuch submitted a paper 2 days ago

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

View all activity

wenwenD

submitted a paper to Daily Papers about 5 hours ago

Calibrate-Then-Act: Cost-Aware Exploration in LLM Agents

Paper • 2602.16699 • Published 2 days ago • 11

liangyuch

authored a paper 2 days ago

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

Paper • 2602.12279 • Published 8 days ago • 19

liangyuch

submitted a paper to Daily Papers 2 days ago

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

Paper • 2602.12279 • Published 8 days ago • 19

0xrobertzhang

authored a paper 3 days ago

Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces

Paper • 2601.11868 • Published Jan 17 • 32

marianna13

published 10 models about 1 month ago

mlfoundations-dev/Qwen3-8B_exp-swd-r2egym-standard_glm_4.7_traces_locetash_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_temp_2.0_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_trajectory_minimal_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_temp_0.25_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_summarize_threshold_4096_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_perturbed-docker-exp-taskmaster2-tasks_glm_4.7_traces_locetash_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_temp_0.5_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_top_k_32_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_tmux_large_traces_save-strategy_steps

mlfoundations-dev/Qwen3-8B_exp_tas_temp_0_5_traces_save-strategy_steps

marianna13

published a model about 2 months ago

mlfoundations-dev/staqc-ot3-100k-code-subset-traces-terminus-2_save-strategy_steps_Qwen3-8B

penfever

published 3 models about 2 months ago

mlfoundations-dev/GLM-4.6-stackexchange-overflow-sandboxes-32eps-65k-reasoning_learning-rate_1e-05_Qwen3-32B

Updated Dec 28, 2025

mlfoundations-dev/GLM-4.6-stackexchange-overflow-sandboxes-32eps-65k-reasoning_num-train-epochs_6.0_Qwen3-32B

Updated Dec 26, 2025

mlfoundations-dev/GLM-4.6-stackexchange-overflow-sandboxes-32eps-65k-reasoning_num-train-epochs_4.0_Qwen3-32B

Updated Dec 25, 2025

penfever

published a dataset about 2 months ago

mlfoundations-dev/openthoughts-4-code-qwen3-32b-annotated-32k_qwen3-1.7B_32k_eval_8179

Updated Dec 23, 2025 • 1

penfever

published a dataset 2 months ago

mlfoundations-dev/evalset_2444

Updated Dec 22, 2025 • 5