ViperEkura
|
573f041c51
|
feat(trainer): 支持分布式训练配置与检查点加载优化
|
2025-12-19 19:34:39 +08:00 |
ViperEkura
|
d882f65579
|
refactor(parallel): 重构parallel模块
|
2025-12-13 22:16:17 +08:00 |
ViperEkura
|
c934210066
|
fix(trainer): 修复参数传递问题和检查点保存问题
|
2025-12-08 13:28:11 +08:00 |
ViperEkura
|
c98b175cd5
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |
ViperEkura
|
d52685facd
|
feat(paralell): 添加分布式训练配置与并行工具支持
|
2025-12-05 13:52:17 +08:00 |
ViperEkura
|
d31137a2db
|
feat(config): 重构模型参数状态加载
|
2025-12-04 20:23:23 +08:00 |
ViperEkura
|
7e5ecf3b7d
|
refactor(config): 重命名 TransformerConfig 为 ModelConfig
|
2025-11-07 07:31:12 +08:00 |
ViperEkura
|
69d9374f51
|
feat(model): 添加 tie_weight 配置选项并优化模型模块实现
|
2025-11-05 23:26:57 +08:00 |
ViperEkura
|
12850d403c
|
fix(config): 修改Checkpoint类中tokenizer和config字段的默认值初始化方式
|
2025-10-29 13:24:20 +08:00 |
ViperEkura
|
bc5ef72001
|
fix(config): 修正 SGDRScheduleConfig 类名拼写错误
|
2025-10-20 18:21:46 +08:00 |
ViperEkura
|
98efca7b9d
|
feat(trainer): 添加训练起始轮次和批次配置支持
|
2025-10-19 21:47:10 +08:00 |
ViperEkura
|
622982364b
|
fix(trainer): 修复检查点加载逻辑
|
2025-10-18 21:45:23 +08:00 |
ViperEkura
|
b67bc9865d
|
refactor(trainer): 重构学习率调度器实现并分离配置与工厂逻辑
|
2025-10-18 16:42:37 +08:00 |
ViperEkura
|
c51b203fde
|
refactor(khaosz): 重构项目结构
|
2025-10-18 13:56:59 +08:00 |