AstrAI/khaosz/model
ViperEkura 6f3386f02c fix(transformer): 优化state_dict 处理逻辑, 优化attention_mask的处理方式 2025-11-09 16:25:17 +08:00
..
__init__.py refactor(khaosz): 重构项目结构 2025-10-18 13:56:59 +08:00
module.py feat(model): 实现旋转位置编码缓存动态扩展 2025-11-09 14:35:29 +08:00
transformer.py fix(transformer): 优化state_dict 处理逻辑, 优化attention_mask的处理方式 2025-11-09 16:25:17 +08:00