ViperEkura
|
a5869d89ba
|
feat(trainer): 增加state_dict 存储设定
|
2026-02-04 19:47:21 +08:00 |
ViperEkura
|
ff5c8a71f5
|
fix(trainer): 修复回调函数合并逻辑
|
2026-01-08 21:56:44 +08:00 |
ViperEkura
|
d407962ffa
|
fix(trainer): 更新检查点保存和加载逻辑
|
2026-01-08 19:04:08 +08:00 |
ViperEkura
|
3d8047fa1b
|
feat(trainer): 重构检查点系统支持分布式训练
|
2026-01-08 15:01:19 +08:00 |
ViperEkura
|
d21682f97a
|
fix(trainer): 修复检查点回调参数顺序和权重保存选项
|
2026-01-05 17:08:09 +08:00 |
ViperEkura
|
fd7ee2895a
|
refactor(paralell): 优化并行设备指定方法
|
2025-12-26 20:54:33 +08:00 |
ViperEkura
|
cfa3cf7daa
|
feat(train): 支持分布式训练的优化器与调度器工厂配置
|
2025-12-22 20:41:03 +08:00 |
ViperEkura
|
573f041c51
|
feat(trainer): 支持分布式训练配置与检查点加载优化
|
2025-12-19 19:34:39 +08:00 |
ViperEkura
|
d882f65579
|
refactor(parallel): 重构parallel模块
|
2025-12-13 22:16:17 +08:00 |
ViperEkura
|
110efd2a21
|
fix(trainer): 修复训练上下文构建逻辑并修正拼写错误
|
2025-12-10 15:02:39 +08:00 |
ViperEkura
|
c86e573195
|
feat(trainer): 改进模型输入和损失计算中的数据类型精度
|
2025-12-08 14:10:08 +08:00 |
ViperEkura
|
c934210066
|
fix(trainer): 修复参数传递问题和检查点保存问题
|
2025-12-08 13:28:11 +08:00 |
ViperEkura
|
c98b175cd5
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |
ViperEkura
|
d52685facd
|
feat(paralell): 添加分布式训练配置与并行工具支持
|
2025-12-05 13:52:17 +08:00 |
ViperEkura
|
019bfe4e05
|
fix(data/sampler): 修正拼写错误并增强采样器功能
|
2025-11-27 19:43:36 +08:00 |
ViperEkura
|
d94fc5a87a
|
feat(data, inference): 使用chatML格式
|
2025-10-29 12:02:43 +08:00 |
ViperEkura
|
0db046f8d9
|
feat(khaosz/trainer): 更新梯度裁剪回调
|
2025-10-20 13:30:26 +08:00 |
ViperEkura
|
98efca7b9d
|
feat(trainer): 添加训练起始轮次和批次配置支持
|
2025-10-19 21:47:10 +08:00 |
ViperEkura
|
622982364b
|
fix(trainer): 修复检查点加载逻辑
|
2025-10-18 21:45:23 +08:00 |
ViperEkura
|
b67bc9865d
|
refactor(trainer): 重构学习率调度器实现并分离配置与工厂逻辑
|
2025-10-18 16:42:37 +08:00 |
ViperEkura
|
c51b203fde
|
refactor(khaosz): 重构项目结构
|
2025-10-18 13:56:59 +08:00 |
ViperEkura
|
8434c19923
|
fix(khaosz/trainer): 修复数据获取中的索引范围错误和参数传递问题
|
2025-10-09 19:53:52 +08:00 |
ViperEkura
|
efbe3de9d3
|
fix(khaosz/trainer/data_util): 修复数据集索引范围错误
|
2025-10-07 20:04:45 +08:00 |
ViperEkura
|
12793bc2d3
|
feat(khaosz/trainer): 新增梯度统计工具函数并重构训练回调机制
|
2025-10-07 13:03:32 +08:00 |
ViperEkura
|
0764cb8296
|
fix(khaosz/trainer/train_callback): 修复基类函数命名错误
|
2025-10-07 11:43:51 +08:00 |
ViperEkura
|
57cd7b921e
|
feat(khaosz/trainer): 改进训练循环中的损失归一化处理
|
2025-10-06 20:17:47 +08:00 |
ViperEkura
|
c1bf22b6ec
|
refactor(khaosz/trainer): 使用 TrainContext 替代 kwargs 传递训练上下文
|
2025-10-06 20:12:08 +08:00 |
ViperEkura
|
4ffa7454f2
|
feat(strategy): 支持模型输入可调用对象并优化损失计算
|
2025-10-06 17:08:56 +08:00 |
ViperEkura
|
fc98d9b7e6
|
refactor(khaosz/trainer): 移除未使用的导入模块
|
2025-10-04 21:45:53 +08:00 |
ViperEkura
|
2ccd7bd583
|
refactor(khaosz/trainer): 重构训练器模块结构以提升可维护性
|
2025-10-04 21:31:15 +08:00 |
ViperEkura
|
465a1a9373
|
refactor(khaosz/tainer): 修改设备参数传递发生阶段
|
2025-10-04 12:12:21 +08:00 |
ViperEkura
|
240ee00221
|
feat(khaosz/trainer): 引入 TrainContext 和 TrainContextBuilder 优化训练上下文管理
|
2025-10-03 22:42:11 +08:00 |
ViperEkura
|
9a452dd34e
|
fix(khaosz/trainer/data_util.py): 修复 RandomSampler 中迭代计数器位置错误
|
2025-10-03 22:08:28 +08:00 |
ViperEkura
|
83c08cfbb9
|
fix(trainer): 修复随机采样器迭代重置问题
|
2025-10-02 14:22:38 +08:00 |
ViperEkura
|
e43a5b9b66
|
fix(khaosz/trainer/data_util.py): 修复 build_loss_mask 函数中使用错误的输入张量
|
2025-10-02 11:55:51 +08:00 |
ViperEkura
|
753e493d6c
|
docs(khaosz/trainer): 更新回调函数的文档字符串格式
|
2025-09-30 20:55:24 +08:00 |
ViperEkura
|
5a356d66e1
|
refactor(khaosz/trainer/data_util): 重构mask函数
|
2025-09-30 20:22:12 +08:00 |
ViperEkura
|
288e2c3da6
|
fix(khaosz/trainer): 调整训练循环中回调调用顺序并增强异常日志记录
|
2025-09-30 17:57:55 +08:00 |
ViperEkura
|
315ce1990a
|
feat(khaosz/trainer): 优化训练器回调机制与数据采样逻辑
|
2025-09-30 16:33:18 +08:00 |
ViperEkura
|
198c1ac55c
|
refactor(khaosz/trainer): 重构训练器模块的导入路径和文件命名
|
2025-09-29 19:35:17 +08:00 |
ViperEkura
|
e467420475
|
fix(khaosz/trainer): 修正训练步数计算逻辑
|
2025-09-29 19:05:26 +08:00 |
ViperEkura
|
6d5176a11c
|
feat(khaosz/trainer): 改进调度器配置验证和加载逻辑
|
2025-09-29 17:17:45 +08:00 |
ViperEkura
|
89211c16f6
|
fix(khaosz/trainer): 将保存检查点逻辑移至CheckpointCallback
|
2025-09-29 13:38:46 +08:00 |
ViperEkura
|
648e4e177b
|
feat(khaosz/trainer): 添加SchedulerCallback功能
|
2025-09-29 13:18:44 +08:00 |
ViperEkura
|
5163d3a47a
|
fix(callback): 解决循环导入问题
|
2025-09-29 13:08:41 +08:00 |
ViperEkura
|
b2f3fefa1b
|
feat(callback): 为 TrainerCallback 及其子类添加文档字符串和未使用参数占位符
|
2025-09-29 12:48:01 +08:00 |
ViperEkura
|
e52803ddc3
|
refactor(trainer): 将回调类移至独立文件并优化训练器结构
|
2025-09-29 12:00:25 +08:00 |
ViperEkura
|
816bc78894
|
feat(trainer): 引入训练器回调机制并重构训练流程
|
2025-09-29 11:31:31 +08:00 |
ViperEkura
|
92999fa9f6
|
fix(trainer): 修复训练器中配置引用错误的问题
|
2025-09-28 22:20:25 +08:00 |
ViperEkura
|
1c9063fd3d
|
refactor(trainer): 统一参数命名以提升可读性
|
2025-09-28 22:14:24 +08:00 |