2 42 17

Haowei Zhang

freesky

freesky01

AI & ML interests

None yet

Recent Activity

liked a model 4 days ago

OpenMOSS-Team/MOSS-VL-Base-0408

liked a model 4 days ago

OpenMOSS-Team/MOSS-VL-Instruct-0408

upvoted a paper 6 days ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

View all activity

Organizations

liked 2 models 4 days ago

OpenMOSS-Team/MOSS-VL-Base-0408

Video-Text-to-Text • 11B • Updated 5 days ago • 32 • 43

OpenMOSS-Team/MOSS-VL-Instruct-0408

Video-Text-to-Text • 11B • Updated 5 days ago • 221 • 54

upvoted a paper 6 days ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 17 days ago • 347

upvoted a paper 12 days ago

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published 18 days ago • 52

liked a dataset 20 days ago

OpenMOSS-Team/OmniAction

Updated 17 days ago • 47.3k • 252

upvoted a paper 27 days ago

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published 29 days ago • 421

liked a model about 1 month ago

Lightricks/LTX-2.3

Image-to-Video • Updated 29 days ago • 1.66M • 942

upvoted a paper about 1 month ago

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Paper • 2603.04918 • Published Mar 5 • 56

upvoted a paper about 2 months ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

liked a model about 2 months ago

OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated 24 days ago • 60.7k • 371

upvoted a paper about 2 months ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published Feb 11 • 49

upvoted 6 papers 2 months ago

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published Feb 9 • 38

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars

Paper • 2602.01538 • Published Feb 2 • 15

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 118

UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing

Paper • 2602.02437 • Published Feb 2 • 80

AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts

Paper • 2601.20730 • Published Jan 28 • 21

liked 2 models 2 months ago

OpenMOSS-Team/MOVA-720p

Any-to-Any • Updated Feb 11 • 1.27k • 130

OpenMOSS-Team/MOVA-360p

Image-to-Video • Updated Feb 15 • 24.7k • 211

upvoted a paper 3 months ago

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 50

Haowei Zhang

AI & ML interests

Recent Activity

Organizations

freesky's activity