ViperEkura
|
a2ae742988
|
chore: 增加并发测试
|
2026-04-09 18:10:28 +08:00 |
ViperEkura
|
ace8f6ee68
|
chore: 优化未使用的模块
|
2026-04-06 09:54:17 +08:00 |
ViperEkura
|
39766aa1dc
|
chore: 修改类名,优化导入顺序
|
2026-04-05 22:27:57 +08:00 |
ViperEkura
|
fc278d17ab
|
feat: 实现模型动态注册机制
|
2026-04-05 19:38:12 +08:00 |
ViperEkura
|
2b26f03bd3
|
refactor: 拆分engine.py 文件
|
2026-04-05 00:07:21 +08:00 |
ViperEkura
|
861d33b1a1
|
refactor: 更新inference 部分的实现
|
2026-04-04 23:49:18 +08:00 |
ViperEkura
|
c94a246c71
|
chore: 重命名目录
|
2026-04-04 17:03:22 +08:00 |
ViperEkura
|
9c31d78a22
|
chore: 将data 模块命名为dataset
|
2026-04-04 16:16:27 +08:00 |
ViperEkura
|
bd9741dc5f
|
refactor: 从data 模块分离tokenizer
|
2026-04-04 16:12:58 +08:00 |
ViperEkura
|
b531232a9b
|
style: 修改为显式导入
|
2026-04-04 16:02:49 +08:00 |
ViperEkura
|
e97536758f
|
refactor: 优化工厂模式结构
|
2026-04-04 11:33:58 +08:00 |
ViperEkura
|
0852b852f8
|
refactor: 优化参数传递,清理导入样式
|
2026-04-03 22:06:32 +08:00 |
ViperEkura
|
3a7d98a950
|
fix: 修复测试部分导入问题
|
2026-04-03 15:01:39 +08:00 |
ViperEkura
|
475de51c7d
|
feat: 增加server, 并且修改测试单元
|
2026-04-02 15:05:07 +08:00 |
ViperEkura
|
2e009cf59a
|
chore: 更新项目名称
|
2026-03-31 09:34:11 +08:00 |
ViperEkura
|
426af2d75f
|
style: 使用ruff 工具优化代码风格
|
2026-03-30 23:32:28 +08:00 |
ViperEkura
|
345fd2f091
|
fix: 修复参数传递问题
|
2026-03-30 22:22:36 +08:00 |
ViperEkura
|
c01791ff54
|
feat: 增加推理部分工厂模式
|
2026-03-30 00:55:15 +08:00 |
ViperEkura
|
3e8f2eba81
|
fix: 修复路径问题
|
2026-03-20 21:14:02 +08:00 |
ViperEkura
|
50f76cd7c7
|
refactor: 重构数据模块中的数据集类命名和文件结构
|
2026-03-19 22:37:32 +08:00 |
ViperEkura
|
5713b55500
|
refactor: 修改 StepMonitorCallback, 分离职责
|
2026-03-04 19:45:39 +08:00 |
ViperEkura
|
8a8d6369bc
|
fix: 修复 dataset 和 checkpoint 的 bug
|
2026-03-02 11:12:21 +08:00 |
ViperEkura
|
6089a12cef
|
fix: 修复参数传递问题并更新测试单元
|
2026-02-28 19:01:16 +08:00 |
ViperEkura
|
582d4ae9a7
|
refactor(data): 修改文件加载方案
|
2026-02-22 21:14:10 +08:00 |
ViperEkura
|
7dfa5cc0ac
|
refactor(data): 重构MmapFileHandler类并改进数据加载机制
|
2026-01-11 19:37:28 +08:00 |
ViperEkura
|
9dab96c31f
|
test(checkpoint): 添加多进程检查点测试功能
|
2026-01-08 22:04:39 +08:00 |
ViperEkura
|
4da70785b5
|
refactor(tests): 重构测试文件目录结构
|
2026-01-08 21:34:52 +08:00 |
ViperEkura
|
d407962ffa
|
fix(trainer): 更新检查点保存和加载逻辑
|
2026-01-08 19:04:08 +08:00 |
ViperEkura
|
eba99e1f5e
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
ViperEkura
|
573f041c51
|
feat(trainer): 支持分布式训练配置与检查点加载优化
|
2025-12-19 19:34:39 +08:00 |
ViperEkura
|
831933fb66
|
fix(mmap): 修复样本数与键值计算逻辑并增强错误处理
|
2025-12-15 09:27:29 +08:00 |
ViperEkura
|
d882f65579
|
refactor(parallel): 重构parallel模块
|
2025-12-13 22:16:17 +08:00 |
ViperEkura
|
c934210066
|
fix(trainer): 修复参数传递问题和检查点保存问题
|
2025-12-08 13:28:11 +08:00 |
ViperEkura
|
c98b175cd5
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |
ViperEkura
|
3ee84b31a0
|
feat(data): 重构数据集加载逻辑,修复计数错误
|
2025-11-28 20:59:24 +08:00 |
ViperEkura
|
019bfe4e05
|
fix(data/sampler): 修正拼写错误并增强采样器功能
|
2025-11-27 19:43:36 +08:00 |
ViperEkura
|
09963a3beb
|
refactor(data): 重构数据模块结构并优化可恢复采样器实现
|
2025-11-27 18:16:35 +08:00 |
ViperEkura
|
3c7ed84516
|
test(test_tie_weight): 添加测试以验证权重绑定后的数据修改行为
|
2025-11-19 17:47:22 +08:00 |
ViperEkura
|
f31bf5a959
|
test(transformer): 更新 tie_weight 相关测试逻辑
|
2025-11-09 17:23:33 +08:00 |
ViperEkura
|
254ec934be
|
feat(transformer): 简化权重绑定逻辑并增加测试单元
|
2025-11-07 15:14:54 +08:00 |
ViperEkura
|
7e5ecf3b7d
|
refactor(config): 重命名 TransformerConfig 为 ModelConfig
|
2025-11-07 07:31:12 +08:00 |
ViperEkura
|
cdb47a62dc
|
test: 统一重构数据集和调度器测试模块
|
2025-10-31 20:24:01 +08:00 |
ViperEkura
|
d94fc5a87a
|
feat(data, inference): 使用chatML格式
|
2025-10-29 12:02:43 +08:00 |
ViperEkura
|
bc5ef72001
|
fix(config): 修正 SGDRScheduleConfig 类名拼写错误
|
2025-10-20 18:21:46 +08:00 |
ViperEkura
|
e051005334
|
test(test_module): 更新测试用例以使用新的generate_iterator接口
|
2025-10-20 13:52:31 +08:00 |
ViperEkura
|
613edd7a14
|
test(early_stopping, train_strategy): 更新测试配置以提高稳定性
|
2025-10-18 22:07:11 +08:00 |
ViperEkura
|
c51b203fde
|
refactor(khaosz): 重构项目结构
|
2025-10-18 13:56:59 +08:00 |
ViperEkura
|
c1bf22b6ec
|
refactor(khaosz/trainer): 使用 TrainContext 替代 kwargs 传递训练上下文
|
2025-10-06 20:12:08 +08:00 |
ViperEkura
|
ec0c054d26
|
test(early_stopping): 移除未使用的torch.utils.data导入
|
2025-10-06 17:10:10 +08:00 |
ViperEkura
|
9d5aa952e0
|
feat(tests): 重构测试环境, 便于pickle 序列化
|
2025-10-04 21:31:39 +08:00 |