1 2 5

SeanWang0027 PRO

SeanWang0027

https://haojinw0027.github.io/

AI & ML interests

None yet

Recent Activity

updated a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

published a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

updated a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-grpo

View all activity

Organizations

updated a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

7B • Updated 2 days ago • 16

published a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-hard-grpo

7B • Updated 2 days ago • 16

updated a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-grpo

7B • Updated 2 days ago • 19

published a model 2 days ago

SeanWang0027/olmo-7b-synlogic-sudoku-easy-grpo

7B • Updated 2 days ago • 19

published a dataset 3 days ago

SeanWang0027/synlogic

Viewer • Updated 3 days ago • 24k • 173

updated a dataset 3 days ago

SeanWang0027/synlogic

Viewer • Updated 3 days ago • 24k • 173

upvoted a paper 8 days ago

Residual Context Diffusion Language Models

Paper • 2601.22954 • Published 14 days ago • 31

upvoted a paper 9 days ago

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

Paper • 2602.01058 • Published 12 days ago • 39

updated a model 17 days ago

is-sft-271828/synlogic_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_8

4B • Updated 17 days ago • 4

published a model 17 days ago

is-sft-271828/synlogic_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_8

4B • Updated 17 days ago • 4

updated a model 17 days ago

is-sft-271828/synlogic_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_4

4B • Updated 17 days ago • 3

published a model 17 days ago

is-sft-271828/synlogic_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_4

4B • Updated 17 days ago • 3

updated a model 17 days ago

is-sft-271828/math_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_8

4B • Updated 17 days ago • 4

published a model 17 days ago

is-sft-271828/math_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_8

4B • Updated 17 days ago • 4

updated a model 17 days ago

is-sft-271828/math_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_4

4B • Updated 17 days ago • 10

published a model 17 days ago

is-sft-271828/math_grpo_qwen3-4b-base-qwen3-8b-3e-5-seq-seqlen_8192_chunksize_4

4B • Updated 17 days ago • 10

updated a model 18 days ago

is-sft-271828/grpo_qwen3-8b-base-qwen3-8b-3e-5-seq-seqlen_8192

8B • Updated 18 days ago • 9

published a model 18 days ago

is-sft-271828/grpo_qwen3-8b-base-qwen3-8b-3e-5-seq-seqlen_8192

8B • Updated 18 days ago • 9

updated a model 19 days ago

is-sft-271828/is_seq_qwen3-8b-base-qwen3-8b-3e-5-seq-seqlen_8192

8B • Updated 19 days ago • 10

published a model 19 days ago

is-sft-271828/is_seq_qwen3-8b-base-qwen3-8b-3e-5-seq-seqlen_8192

8B • Updated 19 days ago • 10

SeanWang0027 PRO

AI & ML interests

Recent Activity

Organizations

SeanWang0027's activity