era-temporary

AI & ML interests

None defined yet.

Recent Activity

FlippyDora authored a paper about 1 month ago

EscapeBench: Towards Advancing Creative Intelligence of Language Model Agents

FlippyDora authored a paper about 1 month ago

GAR: Generative Adversarial Reinforcement Learning for Formal Theorem Proving

FlippyDora authored a paper about 1 month ago

ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

View all activity

authored 5 papers about 1 month ago

EscapeBench: Towards Advancing Creative Intelligence of Language Model Agents

Paper • 2412.13549 • Published Dec 18, 2024

GAR: Generative Adversarial Reinforcement Learning for Formal Theorem Proving

Paper • 2510.11769 • Published Oct 13, 2025 • 26

ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

Paper • 2510.12693 • Published Oct 14, 2025 • 28

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published Mar 14 • 11

AgentSPEX: An Agent SPecification and EXecution Language

Paper • 2604.13346 • Published Apr 14 • 164

submitted a paper to Daily Papers 3 months ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

Paper • 2603.13985 • Published Mar 14 • 11

authored a paper 5 months ago

Future-KL Regularized GRPO: Process-Level Credit Assignment from $f$-Divergence Regularization

Paper • 2601.10201 • Published 11 days ago • 9

submitted a paper to Daily Papers 5 months ago

Future-KL Regularized GRPO: Process-Level Credit Assignment from f-Divergence Regularization

Paper • 2601.10201 • Published 11 days ago • 9

updated a model 6 months ago

era-temporary/openvla-7b-era_dataset-b16-lr-0.0005-lora-r32-dropout-0.0

8B • Updated Nov 21, 2025

published a model 6 months ago

era-temporary/openvla-7b-era_dataset-b16-lr-0.0005-lora-r32-dropout-0.0

8B • Updated Nov 21, 2025

authored a paper 8 months ago

ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

Paper • 2510.12693 • Published Oct 14, 2025 • 28

updated a model 8 months ago

era-temporary/eb_alfred_sft_best

4B • Updated Sep 24, 2025

published a model 8 months ago

era-temporary/eb_alfred_sft_best

4B • Updated Sep 24, 2025

updated a model 8 months ago

era-temporary/eb_man_sft_best

4B • Updated Sep 24, 2025

published a model 8 months ago

era-temporary/eb_man_sft_best

4B • Updated Sep 24, 2025

updated a model 9 months ago

era-temporary/eb_alfred_sft_stage1_grounding_action_full_planning_randomized

4B • Updated Sep 18, 2025 • 3

published a model 9 months ago

era-temporary/eb_alfred_sft_stage1_grounding_action_full_planning_randomized

4B • Updated Sep 18, 2025 • 3

updated a model 9 months ago

era-temporary/eb-alfred-external-know-env-anchored-lr1e-5-full-e1-bs-16

4B • Updated Sep 16, 2025

published a model 9 months ago

era-temporary/eb-alfred-external-know-env-anchored-lr1e-5-full-e1-bs-16

4B • Updated Sep 16, 2025

updated a model 9 months ago

era-temporary/eb_alfred_sft_openo1_1w

4B • Updated Sep 16, 2025