|
__init__.py
|
feat(data): 重构数据集加载逻辑,修复计数错误
|
2025-11-28 20:59:24 +08:00 |
|
mmap.py
|
fix(mmap): 修复样本数与键值计算逻辑并增强错误处理
|
2025-12-15 09:27:29 +08:00 |
|
sampler.py
|
fix(data): 修改 Sampler 的长度计算方式, 避免提前初始化
|
2025-12-10 18:57:53 +08:00 |
|
tokenizer.py
|
fix(tokenizer): 修复stop_ids属性返回错误的token ID列表
|
2025-10-31 19:19:38 +08:00 |