Commit Graph

40 Commits

Author SHA1 Message Date
ViperEkura 345fd2f091 fix: 修复参数传递问题 2026-03-30 22:22:36 +08:00
ViperEkura 60f4df95bd fix: 修复一些已知问题 2026-03-30 01:08:19 +08:00
ViperEkura 3e8f2eba81 fix: 修复路径问题 2026-03-20 21:14:02 +08:00
ViperEkura e55b57d771 fix: 修复梯度平均问题 2026-03-13 23:00:26 +08:00
ViperEkura 82d22c5742 fix: 修复callback 时机不一致的问题 2026-03-06 10:51:22 +08:00
ViperEkura 5713b55500 refactor: 修改 StepMonitorCallback, 分离职责 2026-03-04 19:45:39 +08:00
ViperEkura ff5c8a71f5 fix(trainer): 修复回调函数合并逻辑 2026-01-08 21:56:44 +08:00
ViperEkura d407962ffa fix(trainer): 更新检查点保存和加载逻辑 2026-01-08 19:04:08 +08:00
ViperEkura 3d8047fa1b feat(trainer): 重构检查点系统支持分布式训练 2026-01-08 15:01:19 +08:00
ViperEkura d21682f97a fix(trainer): 修复检查点回调参数顺序和权重保存选项 2026-01-05 17:08:09 +08:00
ViperEkura fd7ee2895a refactor(paralell): 优化并行设备指定方法 2025-12-26 20:54:33 +08:00
ViperEkura 573f041c51 feat(trainer): 支持分布式训练配置与检查点加载优化 2025-12-19 19:34:39 +08:00
ViperEkura d882f65579 refactor(parallel): 重构parallel模块 2025-12-13 22:16:17 +08:00
ViperEkura 110efd2a21 fix(trainer): 修复训练上下文构建逻辑并修正拼写错误 2025-12-10 15:02:39 +08:00
ViperEkura c98b175cd5 refactor(trainer): 优化trainer 结构 2025-12-07 21:23:05 +08:00
ViperEkura 0db046f8d9 feat(khaosz/trainer): 更新梯度裁剪回调 2025-10-20 13:30:26 +08:00
ViperEkura 622982364b fix(trainer): 修复检查点加载逻辑 2025-10-18 21:45:23 +08:00
ViperEkura b67bc9865d refactor(trainer): 重构学习率调度器实现并分离配置与工厂逻辑 2025-10-18 16:42:37 +08:00
ViperEkura c51b203fde refactor(khaosz): 重构项目结构 2025-10-18 13:56:59 +08:00
ViperEkura 12793bc2d3 feat(khaosz/trainer): 新增梯度统计工具函数并重构训练回调机制 2025-10-07 13:03:32 +08:00
ViperEkura 57cd7b921e feat(khaosz/trainer): 改进训练循环中的损失归一化处理 2025-10-06 20:17:47 +08:00
ViperEkura c1bf22b6ec refactor(khaosz/trainer): 使用 TrainContext 替代 kwargs 传递训练上下文 2025-10-06 20:12:08 +08:00
ViperEkura 2ccd7bd583 refactor(khaosz/trainer): 重构训练器模块结构以提升可维护性 2025-10-04 21:31:15 +08:00
ViperEkura 240ee00221 feat(khaosz/trainer): 引入 TrainContext 和 TrainContextBuilder 优化训练上下文管理 2025-10-03 22:42:11 +08:00
ViperEkura 83c08cfbb9 fix(trainer): 修复随机采样器迭代重置问题 2025-10-02 14:22:38 +08:00
ViperEkura 288e2c3da6 fix(khaosz/trainer): 调整训练循环中回调调用顺序并增强异常日志记录 2025-09-30 17:57:55 +08:00
ViperEkura 315ce1990a feat(khaosz/trainer): 优化训练器回调机制与数据采样逻辑 2025-09-30 16:33:18 +08:00
ViperEkura 198c1ac55c refactor(khaosz/trainer): 重构训练器模块的导入路径和文件命名 2025-09-29 19:35:17 +08:00
ViperEkura e467420475 fix(khaosz/trainer): 修正训练步数计算逻辑 2025-09-29 19:05:26 +08:00
ViperEkura 89211c16f6 fix(khaosz/trainer): 将保存检查点逻辑移至CheckpointCallback 2025-09-29 13:38:46 +08:00
ViperEkura 648e4e177b feat(khaosz/trainer): 添加SchedulerCallback功能 2025-09-29 13:18:44 +08:00
ViperEkura e52803ddc3 refactor(trainer): 将回调类移至独立文件并优化训练器结构 2025-09-29 12:00:25 +08:00
ViperEkura 816bc78894 feat(trainer): 引入训练器回调机制并重构训练流程 2025-09-29 11:31:31 +08:00
ViperEkura 92999fa9f6 fix(trainer): 修复训练器中配置引用错误的问题 2025-09-28 22:20:25 +08:00
ViperEkura 1c9063fd3d refactor(trainer): 统一参数命名以提升可读性 2025-09-28 22:14:24 +08:00
ViperEkura fa43ed2943 feat(trainer): 重构训练配置与策略工厂引入 2025-09-28 21:39:48 +08:00
ViperEkura 25ec56a1f5 fix(trainer): 修复训练器恢复检查点时的学习率初始化问题 2025-09-28 14:38:02 +08:00
ViperEkura f25a249291 feat(khaosz): 优化模型参数保存与加载逻辑 2025-09-28 14:00:21 +08:00
ViperEkura 053f4a4dad feat( StrategyFactory): 添加 SFT 策略初始化参数并完善工厂方法调用 2025-09-27 13:24:16 +08:00
ViperEkura a4443765ee Initial commit 2025-09-27 12:02:22 +08:00