論文 arXiv 発表: 2026-05-07

Optimizer-Model Consistency: Full Finetuning with the Same Optimizer as Pretraining Forgets Less

著者: Yuxing Liu, Jianyu Wang, Tong Zhang

要約

Optimizers play an important role in both pretraining and finetuning stages when training large language models (LLMs). In this paper, we present an observation that full finetuning with the same optimizer as in pretraining achieves a better learning-forgetting tradeoff, i.e., forgetting less while …

#fine-tuning#llm

Optimizer-Model Consistency: Full Finetuning with the Same Optimizer as Pretraining Forgets Less

要約

同じカテゴリの記事

Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

World-R1: テキストから動画生成における3D制約の強化学習による整合