ArenaRL - a Alibaba-NLP Collection

Alibaba-NLP 's Collections

ArenaRL

updated Mar 2

Scaling RL for Open-Ended Agents via Tournamentbased Relative Ranking

Alibaba-NLP/Open-Travel

Preview • Updated Jan 16 • 98 • 1
Alibaba-NLP/Open-DeepResearch

Preview • Updated Jan 16 • 131 • 5
ArenaRL: Scaling RL for Open-Ended Agents via Tournament-based Relative Ranking

Paper • 2601.06487 • Published Jan 10 • 54