Commit Graph

50 Commits

Author SHA1 Message Date
ViperEkura 3a7d98a950 fix: 修复测试部分导入问题 2026-04-03 15:01:39 +08:00
ViperEkura 475de51c7d feat: 增加server, 并且修改测试单元 2026-04-02 15:05:07 +08:00
ViperEkura 2e009cf59a chore: 更新项目名称 2026-03-31 09:34:11 +08:00
ViperEkura 426af2d75f style: 使用ruff 工具优化代码风格 2026-03-30 23:32:28 +08:00
ViperEkura 345fd2f091 fix: 修复参数传递问题 2026-03-30 22:22:36 +08:00
ViperEkura c01791ff54 feat: 增加推理部分工厂模式 2026-03-30 00:55:15 +08:00
ViperEkura 3e8f2eba81 fix: 修复路径问题 2026-03-20 21:14:02 +08:00
ViperEkura 50f76cd7c7 refactor: 重构数据模块中的数据集类命名和文件结构 2026-03-19 22:37:32 +08:00
ViperEkura 5713b55500 refactor: 修改 StepMonitorCallback, 分离职责 2026-03-04 19:45:39 +08:00
ViperEkura 8a8d6369bc fix: 修复 dataset 和 checkpoint 的 bug 2026-03-02 11:12:21 +08:00
ViperEkura 6089a12cef fix: 修复参数传递问题并更新测试单元 2026-02-28 19:01:16 +08:00
ViperEkura 582d4ae9a7 refactor(data): 修改文件加载方案 2026-02-22 21:14:10 +08:00
ViperEkura 7dfa5cc0ac refactor(data): 重构MmapFileHandler类并改进数据加载机制 2026-01-11 19:37:28 +08:00
ViperEkura 9dab96c31f test(checkpoint): 添加多进程检查点测试功能 2026-01-08 22:04:39 +08:00
ViperEkura 4da70785b5 refactor(tests): 重构测试文件目录结构 2026-01-08 21:34:52 +08:00
ViperEkura d407962ffa fix(trainer): 更新检查点保存和加载逻辑 2026-01-08 19:04:08 +08:00
ViperEkura eba99e1f5e feat(model): 添加QK归一化和门控注意力支持 2026-01-05 16:14:44 +08:00
ViperEkura 573f041c51 feat(trainer): 支持分布式训练配置与检查点加载优化 2025-12-19 19:34:39 +08:00
ViperEkura 831933fb66 fix(mmap): 修复样本数与键值计算逻辑并增强错误处理 2025-12-15 09:27:29 +08:00
ViperEkura d882f65579 refactor(parallel): 重构parallel模块 2025-12-13 22:16:17 +08:00
ViperEkura c934210066 fix(trainer): 修复参数传递问题和检查点保存问题 2025-12-08 13:28:11 +08:00
ViperEkura c98b175cd5 refactor(trainer): 优化trainer 结构 2025-12-07 21:23:05 +08:00
ViperEkura 3ee84b31a0 feat(data): 重构数据集加载逻辑,修复计数错误 2025-11-28 20:59:24 +08:00
ViperEkura 019bfe4e05 fix(data/sampler): 修正拼写错误并增强采样器功能 2025-11-27 19:43:36 +08:00
ViperEkura 09963a3beb refactor(data): 重构数据模块结构并优化可恢复采样器实现 2025-11-27 18:16:35 +08:00
ViperEkura 3c7ed84516 test(test_tie_weight): 添加测试以验证权重绑定后的数据修改行为 2025-11-19 17:47:22 +08:00
ViperEkura f31bf5a959 test(transformer): 更新 tie_weight 相关测试逻辑 2025-11-09 17:23:33 +08:00
ViperEkura 254ec934be feat(transformer): 简化权重绑定逻辑并增加测试单元 2025-11-07 15:14:54 +08:00
ViperEkura 7e5ecf3b7d refactor(config): 重命名 TransformerConfig 为 ModelConfig 2025-11-07 07:31:12 +08:00
ViperEkura cdb47a62dc test: 统一重构数据集和调度器测试模块 2025-10-31 20:24:01 +08:00
ViperEkura d94fc5a87a feat(data, inference): 使用chatML格式 2025-10-29 12:02:43 +08:00
ViperEkura bc5ef72001 fix(config): 修正 SGDRScheduleConfig 类名拼写错误 2025-10-20 18:21:46 +08:00
ViperEkura e051005334 test(test_module): 更新测试用例以使用新的generate_iterator接口 2025-10-20 13:52:31 +08:00
ViperEkura 613edd7a14 test(early_stopping, train_strategy): 更新测试配置以提高稳定性 2025-10-18 22:07:11 +08:00
ViperEkura c51b203fde refactor(khaosz): 重构项目结构 2025-10-18 13:56:59 +08:00
ViperEkura c1bf22b6ec refactor(khaosz/trainer): 使用 TrainContext 替代 kwargs 传递训练上下文 2025-10-06 20:12:08 +08:00
ViperEkura ec0c054d26 test(early_stopping): 移除未使用的torch.utils.data导入 2025-10-06 17:10:10 +08:00
ViperEkura 9d5aa952e0 feat(tests): 重构测试环境, 便于pickle 序列化 2025-10-04 21:31:39 +08:00
ViperEkura e7d29ca2d5 feat(tests): 改进测试环境配置与设备管理 2025-10-04 12:12:42 +08:00
ViperEkura 6e1a497c04 test(sampler): 删除冗余的训练恢复测试用例 2025-10-03 22:18:31 +08:00
ViperEkura 85aeec9e55 test(conftest): 添加matplotlib后端设置以避免GUI问题 2025-10-03 22:11:54 +08:00
ViperEkura 28b01220b6 test(trainer): 拆分测试文件 2025-10-03 22:08:11 +08:00
ViperEkura 0a03a15679 test(trainer): 调整测试参数以提高训练和断言的稳定性 2025-10-02 14:34:02 +08:00
ViperEkura 17f1a12f27 test(trainer): 增强测试用例以支持随机配置和多轮对话训练 2025-09-30 16:33:37 +08:00
ViperEkura e467420475 fix(khaosz/trainer): 修正训练步数计算逻辑 2025-09-29 19:05:26 +08:00
ViperEkura 0ebf53008e refactor(test): 更新训练配置参数名称并优化测试逻辑 2025-09-28 22:14:39 +08:00
ViperEkura 0b96b11a6e test(trainer): 增加训练中断与检查点恢复测试 2025-09-28 14:38:23 +08:00
ViperEkura c8a38743a4 fix(tests): 更新测试代码以验证优化器状态的保存与加载 2025-09-28 14:00:38 +08:00
ViperEkura 4fcdc87c95 feat(trainer): 重构数据集与策略模块以支持字典形式的数据返回 2025-09-27 14:11:27 +08:00
ViperEkura a4443765ee Initial commit 2025-09-27 12:02:22 +08:00