AstrAI/khaosz/trainer
ViperEkura 1169cfad82 fix(trainer): 修复多轮对话中的因果注意力掩码计算逻辑等 2025-09-28 15:15:19 +08:00
..
__init__.py Initial commit 2025-09-27 12:02:22 +08:00
dataset.py fix(trainer): 修复多轮对话中的因果注意力掩码计算逻辑等 2025-09-28 15:15:19 +08:00
strategy.py fix(trainer): 修复多轮对话中的因果注意力掩码计算逻辑等 2025-09-28 15:15:19 +08:00
trainer.py fix(trainer): 修复训练器恢复检查点时的学习率初始化问题 2025-09-28 14:38:02 +08:00