ViperEkura
|
183f481692
|
build(khaosz): 更新版本号至1.3.0
|
2025-10-06 17:12:12 +08:00 |
ViperEkura
|
ec0c054d26
|
test(early_stopping): 移除未使用的torch.utils.data导入
|
2025-10-06 17:10:10 +08:00 |
ViperEkura
|
4ffa7454f2
|
feat(strategy): 支持模型输入可调用对象并优化损失计算
|
2025-10-06 17:08:56 +08:00 |
ViperEkura
|
8c9e973179
|
fix(train.py): 修复数据集加载时的参数传递问题
|
2025-10-06 16:44:02 +08:00 |
ViperEkura
|
fc98d9b7e6
|
refactor(khaosz/trainer): 移除未使用的导入模块
|
2025-10-04 21:45:53 +08:00 |
ViperEkura
|
9d5aa952e0
|
feat(tests): 重构测试环境, 便于pickle 序列化
|
2025-10-04 21:31:39 +08:00 |
ViperEkura
|
2ccd7bd583
|
refactor(khaosz/trainer): 重构训练器模块结构以提升可维护性
|
2025-10-04 21:31:15 +08:00 |
ViperEkura
|
e7d29ca2d5
|
feat(tests): 改进测试环境配置与设备管理
|
2025-10-04 12:12:42 +08:00 |
ViperEkura
|
465a1a9373
|
refactor(khaosz/tainer): 修改设备参数传递发生阶段
|
2025-10-04 12:12:21 +08:00 |
ViperEkura
|
240ee00221
|
feat(khaosz/trainer): 引入 TrainContext 和 TrainContextBuilder 优化训练上下文管理
|
2025-10-03 22:42:11 +08:00 |
ViperEkura
|
6e1a497c04
|
test(sampler): 删除冗余的训练恢复测试用例
|
2025-10-03 22:18:31 +08:00 |
ViperEkura
|
85aeec9e55
|
test(conftest): 添加matplotlib后端设置以避免GUI问题
|
2025-10-03 22:11:54 +08:00 |
ViperEkura
|
9a452dd34e
|
fix(khaosz/trainer/data_util.py): 修复 RandomSampler 中迭代计数器位置错误
|
2025-10-03 22:08:28 +08:00 |
ViperEkura
|
28b01220b6
|
test(trainer): 拆分测试文件
|
2025-10-03 22:08:11 +08:00 |
ViperEkura
|
0a03a15679
|
test(trainer): 调整测试参数以提高训练和断言的稳定性
|
2025-10-02 14:34:02 +08:00 |
ViperEkura
|
83c08cfbb9
|
fix(trainer): 修复随机采样器迭代重置问题
|
2025-10-02 14:22:38 +08:00 |
ViperEkura
|
e43a5b9b66
|
fix(khaosz/trainer/data_util.py): 修复 build_loss_mask 函数中使用错误的输入张量
|
2025-10-02 11:55:51 +08:00 |
ViperEkura
|
cd4877e490
|
perf(benchmark): 添加基准性能测试
|
2025-10-01 22:35:35 +08:00 |
ViperEkura
|
64c4d2d2e3
|
refactor(scripts): 重命名聊天脚本文件
|
2025-10-01 11:57:57 +08:00 |
ViperEkura
|
753e493d6c
|
docs(khaosz/trainer): 更新回调函数的文档字符串格式
|
2025-09-30 20:55:24 +08:00 |
ViperEkura
|
5a356d66e1
|
refactor(khaosz/trainer/data_util): 重构mask函数
|
2025-09-30 20:22:12 +08:00 |
ViperEkura
|
78e5dbb3be
|
build(khaosz): 更新版本号至1.2.2
|
2025-09-30 18:04:13 +08:00 |
ViperEkura
|
288e2c3da6
|
fix(khaosz/trainer): 调整训练循环中回调调用顺序并增强异常日志记录
|
2025-09-30 17:57:55 +08:00 |
ViperEkura
|
dd6a9e4ede
|
fix(train.py): 修复参数传递错误
|
2025-09-30 17:30:00 +08:00 |
ViperEkura
|
17f1a12f27
|
test(trainer): 增强测试用例以支持随机配置和多轮对话训练
|
2025-09-30 16:33:37 +08:00 |
ViperEkura
|
315ce1990a
|
feat(khaosz/trainer): 优化训练器回调机制与数据采样逻辑
|
2025-09-30 16:33:18 +08:00 |
ViperEkura
|
e0e9942e4a
|
feat(khaosz/core/parameter): 添加采样器状态的保存与加载功能
|
2025-09-29 19:49:35 +08:00 |
ViperEkura
|
198c1ac55c
|
refactor(khaosz/trainer): 重构训练器模块的导入路径和文件命名
|
2025-09-29 19:35:17 +08:00 |
ViperEkura
|
e467420475
|
fix(khaosz/trainer): 修正训练步数计算逻辑
|
2025-09-29 19:05:26 +08:00 |
ViperEkura
|
c104a400e7
|
refactor(train.py): 重命名策略参数变量名
|
2025-09-29 17:26:01 +08:00 |
ViperEkura
|
6d5176a11c
|
feat(khaosz/trainer): 改进调度器配置验证和加载逻辑
|
2025-09-29 17:17:45 +08:00 |
ViperEkura
|
bdda1cc35a
|
feat(khaosz/core/tokenizer): 添加 user_id 和 system_id 属性
|
2025-09-29 13:47:37 +08:00 |
ViperEkura
|
89211c16f6
|
fix(khaosz/trainer): 将保存检查点逻辑移至CheckpointCallback
|
2025-09-29 13:38:46 +08:00 |
ViperEkura
|
648e4e177b
|
feat(khaosz/trainer): 添加SchedulerCallback功能
|
2025-09-29 13:18:44 +08:00 |
ViperEkura
|
5163d3a47a
|
fix(callback): 解决循环导入问题
|
2025-09-29 13:08:41 +08:00 |
ViperEkura
|
b2f3fefa1b
|
feat(callback): 为 TrainerCallback 及其子类添加文档字符串和未使用参数占位符
|
2025-09-29 12:48:01 +08:00 |
ViperEkura
|
e52803ddc3
|
refactor(trainer): 将回调类移至独立文件并优化训练器结构
|
2025-09-29 12:00:25 +08:00 |
ViperEkura
|
8206c7855e
|
fix(transformer): 调整注意力掩码处理逻辑
|
2025-09-29 11:31:42 +08:00 |
ViperEkura
|
816bc78894
|
feat(trainer): 引入训练器回调机制并重构训练流程
|
2025-09-29 11:31:31 +08:00 |
ViperEkura
|
92999fa9f6
|
fix(trainer): 修复训练器中配置引用错误的问题
|
2025-09-28 22:20:25 +08:00 |
ViperEkura
|
0ebf53008e
|
refactor(test): 更新训练配置参数名称并优化测试逻辑
|
2025-09-28 22:14:39 +08:00 |
ViperEkura
|
1c9063fd3d
|
refactor(trainer): 统一参数命名以提升可读性
|
2025-09-28 22:14:24 +08:00 |
ViperEkura
|
fa43ed2943
|
feat(trainer): 重构训练配置与策略工厂引入
|
2025-09-28 21:39:48 +08:00 |
ViperEkura
|
2dc7b5bda8
|
build(.gitignore): 更新 gitignore 文件忽略规则
|
2025-09-28 15:39:13 +08:00 |
ViperEkura
|
30ac07418c
|
feat(train): 添加多轮对话训练支持
|
2025-09-28 15:38:53 +08:00 |
ViperEkura
|
1169cfad82
|
fix(trainer): 修复多轮对话中的因果注意力掩码计算逻辑等
|
2025-09-28 15:15:19 +08:00 |
ViperEkura
|
0b96b11a6e
|
test(trainer): 增加训练中断与检查点恢复测试
|
2025-09-28 14:38:23 +08:00 |
ViperEkura
|
25ec56a1f5
|
fix(trainer): 修复训练器恢复检查点时的学习率初始化问题
|
2025-09-28 14:38:02 +08:00 |
ViperEkura
|
c8a38743a4
|
fix(tests): 更新测试代码以验证优化器状态的保存与加载
|
2025-09-28 14:00:38 +08:00 |
ViperEkura
|
f25a249291
|
feat(khaosz): 优化模型参数保存与加载逻辑
|
2025-09-28 14:00:21 +08:00 |