Sijia Cui's picture

In a Training Loop 🔄

Sijia Cui

cuisijia

·

https://github.com/SijiaCui

AI & ML interests

None yet

Recent Activity

upvoted a paper about 8 hours ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

liked a dataset about 2 months ago

phiyodr/coco2017

liked a dataset 2 months ago

jonathan-roberts1/zerobench

View all activity

Organizations

cuisijia 's papers 1

arxiv:2603.10101