AstrAI/tools
ViperEkura abc3a06266 chore: 增加ppl计算工具并优化代码格式 2026-03-18 16:16:02 +08:00
..
benchmark.py feat(model): 添加QK归一化和门控注意力支持 2026-01-05 16:14:44 +08:00
generate.py chore: 增加ppl计算工具并优化代码格式 2026-03-18 16:16:02 +08:00
perplexity.py chore: 增加ppl计算工具并优化代码格式 2026-03-18 16:16:02 +08:00
train.py feat: 增加 label smoothing 设置 2026-03-13 22:37:27 +08:00