|
config
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
|
data
|
feat(khaosz/data/tokenizer): 优化BPE分词器的预处理和训练配置
|
2025-12-22 20:02:10 +08:00 |
|
inference
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
|
model
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
|
parallel
|
refactor(paralell): 优化并行设备指定方法
|
2025-12-26 20:54:33 +08:00 |
|
trainer
|
refactor(paralell): 优化并行设备指定方法
|
2025-12-26 20:54:33 +08:00 |
|
utils
|
fix(khaosz): 为其他模组添加init文件
|
2025-11-19 18:25:51 +08:00 |
|
__init__.py
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |
|
api.py
|
refactor(trainer): 优化trainer 结构
|
2025-12-07 21:23:05 +08:00 |