|
benchmark.py
|
feat(model): 添加QK归一化和门控注意力支持
|
2026-01-05 16:14:44 +08:00 |
|
generate.py
|
chore: 增加ppl计算工具并优化代码格式
|
2026-03-18 16:16:02 +08:00 |
|
perplexity.py
|
chore: 增加ppl计算工具并优化代码格式
|
2026-03-18 16:16:02 +08:00 |
|
train.py
|
feat: 增加 label smoothing 设置
|
2026-03-13 22:37:27 +08:00 |