AstrAI/khaosz/model
ViperEkura fb85aaf6a6 fix(parallel): 修改列并行线性层结果聚合方式 2025-11-21 13:37:08 +08:00
..
__init__.py refactor(khaosz): 重构项目结构 2025-10-18 13:56:59 +08:00
module.py fix(model): 调整 KV Cache 的维度顺序以匹配新的索引逻辑 2025-11-19 18:26:15 +08:00
parallel.py fix(parallel): 修改列并行线性层结果聚合方式 2025-11-21 13:37:08 +08:00
transformer.py fix(transformer): 优化state_dict 处理逻辑, 优化attention_mask的处理方式 2025-11-09 16:25:17 +08:00