ViperEkura
|
7a9b9d0659
|
docs(architecture): 添加系统架构文档并修复KV缓存数学公式
|
2026-01-18 14:10:31 +08:00 |
ViperEkura
|
75758ead46
|
docs(data): 修改内存映射文件扩展名为.pt
|
2026-01-16 21:02:26 +08:00 |
ViperEkura
|
7dfa5cc0ac
|
refactor(data): 重构MmapFileHandler类并改进数据加载机制
|
2026-01-11 19:37:28 +08:00 |
ViperEkura
|
9dab96c31f
|
test(checkpoint): 添加多进程检查点测试功能
|
2026-01-08 22:04:39 +08:00 |
ViperEkura
|
ff5c8a71f5
|
fix(trainer): 修复回调函数合并逻辑
|
2026-01-08 21:56:44 +08:00 |
ViperEkura
|
4da70785b5
|
refactor(tests): 重构测试文件目录结构
|
2026-01-08 21:34:52 +08:00 |
ViperEkura
|
d407962ffa
|
fix(trainer): 更新检查点保存和加载逻辑
|
2026-01-08 19:04:08 +08:00 |
ViperEkura
|
3d8047fa1b
|
feat(trainer): 重构检查点系统支持分布式训练
|
2026-01-08 15:01:19 +08:00 |
ViperEkura
|
d21682f97a
|
fix(trainer): 修复检查点回调参数顺序和权重保存选项
|
2026-01-05 17:08:09 +08:00 |
ViperEkura
|
eba99e1f5e
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
ViperEkura
|
fd7ee2895a
|
refactor(paralell): 优化并行设备指定方法
|
2025-12-26 20:54:33 +08:00 |
ViperEkura
|
cfa3cf7daa
|
feat(train): 支持分布式训练的优化器与调度器工厂配置
|
2025-12-22 20:41:03 +08:00 |
ViperEkura
|
7623b1e5fd
|
feat(khaosz/data/tokenizer): 优化BPE分词器的预处理和训练配置
|
2025-12-22 20:02:10 +08:00 |
ViperEkura
|
573f041c51
|
feat(trainer): 支持分布式训练配置与检查点加载优化
|
2025-12-19 19:34:39 +08:00 |
ViperEkura
|
eab7a51bb6
|
feat(parallel): 改进设备策略注册表与并行设置功能
|
2025-12-19 15:25:31 +08:00 |
ViperEkura
|
3ac38a7ebc
|
feat(parallel/device): 引入设备策略注册机制以支持多种后端
|
2025-12-15 13:58:59 +08:00 |
ViperEkura
|
831933fb66
|
fix(mmap): 修复样本数与键值计算逻辑并增强错误处理
|
2025-12-15 09:27:29 +08:00 |
ViperEkura
|
701fb9bf78
|
refactor(data): 将内存映射文件加载逻辑移至独立的 MmapFileHander 类
|
2025-12-15 09:12:42 +08:00 |
ViperEkura
|
d882f65579
|
refactor(parallel): 重构parallel模块
|
2025-12-13 22:16:17 +08:00 |
ViperEkura
|
a30ddca517
|
fix(data): 修改 Sampler 的长度计算方式, 避免提前初始化
|
2025-12-10 18:57:53 +08:00 |
ViperEkura
|
8e975017d3
|
fix(demo): 修复拼写错误
|
2025-12-10 15:22:26 +08:00 |
ViperEkura
|
fed4d64cea
|
ci(spell-check): 添加拼写检查工作流
|
2025-12-10 15:17:59 +08:00 |
ViperEkura
|
110efd2a21
|
fix(trainer): 修复训练上下文构建逻辑并修正拼写错误
|
2025-12-10 15:02:39 +08:00 |
ViperEkura
|
530fb50352
|
feat(parallel): 重构并重命名并行工具函数以提升灵活性
|
2025-12-10 14:43:35 +08:00 |
ViperEkura
|
c86e573195
|
feat(trainer): 改进模型输入和损失计算中的数据类型精度
|
2025-12-08 14:10:08 +08:00 |
ViperEkura
|
0093ba7bb8
|
build(requirements): 升级 urllib3 版本从 2.5.0 到 2.6.0
|
2025-12-08 13:48:50 +08:00 |
ViperEkura
|
c934210066
|
fix(trainer): 修复参数传递问题和检查点保存问题
|
2025-12-08 13:28:11 +08:00 |
ViperEkura
|
c98b175cd5
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |
ViperEkura
|
82e65ccc21
|
fix(tools/train): 修复参数传递错误
|
2025-12-05 13:53:50 +08:00 |
ViperEkura
|
d52685facd
|
feat(paralell): 添加分布式训练配置与并行工具支持
|
2025-12-05 13:52:17 +08:00 |
ViperEkura
|
d31137a2db
|
feat(config): 重构模型参数状态加载
|
2025-12-04 20:23:23 +08:00 |
ViperEkura
|
6270415590
|
feat(khaosz/parallel): 添加对多种设备后端的支持并优化并行初始化逻辑
|
2025-12-03 17:24:32 +08:00 |
ViperEkura
|
08c5a52dc8
|
Merge pull request #15 from ViperEkura/dependabot/pip/fonttools-4.61.0
build(deps): bump fonttools from 4.59.0 to 4.61.0
|
2025-12-03 16:59:35 +08:00 |
dependabot[bot]
|
ac1fefb363
|
build(deps): bump fonttools from 4.59.0 to 4.61.0
Bumps [fonttools](https://github.com/fonttools/fonttools) from 4.59.0 to 4.61.0.
- [Release notes](https://github.com/fonttools/fonttools/releases)
- [Changelog](https://github.com/fonttools/fonttools/blob/main/NEWS.rst)
- [Commits](https://github.com/fonttools/fonttools/compare/4.59.0...4.61.0)
---
updated-dependencies:
- dependency-name: fonttools
dependency-version: 4.61.0
dependency-type: direct:production
...
Signed-off-by: dependabot[bot] <support@github.com>
|
2025-12-01 22:28:11 +00:00 |
ViperEkura
|
8b20982933
|
refactor(parallel): 重命名并重新组织并行模块文件结构
|
2025-11-30 17:56:47 +08:00 |
ViperEkura
|
d5cc9f065d
|
feat(khaosz/parallel): 添加并行训练设置功能
|
2025-11-30 16:44:04 +08:00 |
ViperEkura
|
db53cc5001
|
feat(tools/train): 优化训练参数传递
|
2025-11-30 13:49:24 +08:00 |
ViperEkura
|
3ee84b31a0
|
feat(data): 重构数据集加载逻辑,修复计数错误
|
2025-11-28 20:59:24 +08:00 |
ViperEkura
|
567c55685e
|
docs(data/dataset): 更新 load_mmap_files 函数的文档
|
2025-11-28 20:27:57 +08:00 |
ViperEkura
|
1f5cba889b
|
fix(data): 修复数据加载模块中的拼写错误并优化内存映射加载逻辑
|
2025-11-28 20:21:53 +08:00 |
ViperEkura
|
019bfe4e05
|
fix(data/sampler): 修正拼写错误并增强采样器功能
|
2025-11-27 19:43:36 +08:00 |
ViperEkura
|
36b410384b
|
fix(data/sampler): 增加sampler边界情况处理
|
2025-11-27 19:32:40 +08:00 |
ViperEkura
|
09963a3beb
|
refactor(data): 重构数据模块结构并优化可恢复采样器实现
|
2025-11-27 18:16:35 +08:00 |
ViperEkura
|
5daf63a7a4
|
fix(model): 修复加载状态字典时的键存在性检查
|
2025-11-25 21:03:10 +08:00 |
ViperEkura
|
fb85aaf6a6
|
fix(parallel): 修改列并行线性层结果聚合方式
|
2025-11-21 13:37:08 +08:00 |
ViperEkura
|
6fb6a15e81
|
feat(model): 添加并行线性层模型支持
|
2025-11-21 12:54:59 +08:00 |
ViperEkura
|
d9ff662e3a
|
fix(model): 调整 KV Cache 的维度顺序以匹配新的索引逻辑
|
2025-11-19 18:26:15 +08:00 |
ViperEkura
|
e12ed0a72b
|
fix(khaosz): 为其他模组添加init文件
|
2025-11-19 18:25:51 +08:00 |
ViperEkura
|
3bf2468905
|
fix(tools): 修正训练脚本中的嵌入层参数分组判断条件
|
2025-11-19 17:47:33 +08:00 |
ViperEkura
|
3c7ed84516
|
test(test_tie_weight): 添加测试以验证权重绑定后的数据修改行为
|
2025-11-19 17:47:22 +08:00 |