In a Training Loop 🔄

Urro PRO

urroxyz

https://urro.xyz/

urroxyz

AI & ML interests

computational linguistics major 🤖🔎🔠 i am autistic. if i come off rude, i probably didn't mean to. please feel free to ask me for clarification.

Recent Activity

upvoted a paper 2 days ago

KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs

upvoted a paper 2 days ago

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

upvoted a collection 2 days ago

Ternary Bonsai

View all activity

Organizations

upvoted 2 papers 2 days ago

KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs

Paper • 2604.13226 • Published 7 days ago • 9

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

Paper • 2604.14164 • Published 29 days ago • 34

upvoted a collection 2 days ago

Ternary Bonsai

Collection

1.58-bit Bonsai models • 9 items • Updated about 14 hours ago • 54

upvoted 5 papers 5 days ago

upvoted a collection 5 days ago

Qwen3.6

Collection

2 items • Updated 5 days ago • 138

upvoted 11 papers 6 days ago

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Paper • 2601.18734 • Published Jan 26 • 5

Towards Active Synthetic Data Generation for Finetuning Language Models

Paper • 2512.00884 • Published Nov 30, 2025 • 1

Improving Influence-based Instruction Tuning Data Selection for Balanced Learning of Diverse Capabilities

Paper • 2501.12147 • Published Jan 21, 2025 • 1

Clustering and Ranking: Diversity-preserved Instruction Selection through Expert-aligned Quality Estimation

Paper • 2402.18191 • Published Feb 28, 2024 • 1

SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking

Paper • 2406.10882 • Published Jun 16, 2024 • 2

LEAD: Iterative Data Selection for Efficient LLM Instruction Tuning

Paper • 2505.07437 • Published May 12, 2025 • 1

The Best Instruction-Tuning Data are Those That Fit

Paper • 2502.04194 • Published Feb 6, 2025 • 2

BARE: Combining Base and Instruction-Tuned Language Models for Better Synthetic Data Generation

Paper • 2502.01697 • Published Feb 3, 2025 • 1

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20, 2024 • 51

Beyond Random Sampling: Efficient Language Model Pretraining via Curriculum Learning

Paper • 2506.11300 • Published Jun 12, 2025 • 2

DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining

Paper • 2305.10429 • Published May 17, 2023 • 5

Urro PRO

AI & ML interests

Recent Activity

Organizations

urroxyz's activity