Commit Graph

  • 582d4ae9a7 refactor(data): 修改文件加载方案 ViperEkura 2026-02-22 21:14:10 +0800
  • 0ca4871e80 ci(spell-check): 修改检查流程 ViperEkura 2026-02-11 16:01:53 +0800
  • 99ef8fda71 feat(inference): 增加cuda_graph 装饰器 ViperEkura 2026-02-07 21:14:39 +0800
  • dbd57e30e5 feat(inference): 增加cuda graph 设置 ViperEkura 2026-02-07 15:42:41 +0800
  • a5869d89ba feat(trainer): 增加state_dict 存储设定 ViperEkura 2026-02-04 19:47:21 +0800
  • 7a9b9d0659 docs(architecture): 添加系统架构文档并修复KV缓存数学公式 ViperEkura 2026-01-18 14:10:31 +0800
  • 75758ead46 docs(data): 修改内存映射文件扩展名为.pt ViperEkura 2026-01-16 21:02:26 +0800
  • 7dfa5cc0ac refactor(data): 重构MmapFileHandler类并改进数据加载机制 ViperEkura 2026-01-11 19:37:28 +0800
  • 9dab96c31f test(checkpoint): 添加多进程检查点测试功能 ViperEkura 2026-01-08 22:04:39 +0800
  • ff5c8a71f5 fix(trainer): 修复回调函数合并逻辑 ViperEkura 2026-01-08 21:56:44 +0800
  • 4da70785b5 refactor(tests): 重构测试文件目录结构 ViperEkura 2026-01-08 21:34:52 +0800
  • d407962ffa fix(trainer): 更新检查点保存和加载逻辑 ViperEkura 2026-01-08 19:04:08 +0800
  • 3d8047fa1b feat(trainer): 重构检查点系统支持分布式训练 ViperEkura 2026-01-08 15:01:19 +0800
  • d21682f97a fix(trainer): 修复检查点回调参数顺序和权重保存选项 ViperEkura 2026-01-05 17:08:09 +0800
  • eba99e1f5e feat(model): 添加QK归一化和门控注意力支持 ViperEkura 2026-01-05 16:14:44 +0800
  • fd7ee2895a refactor(paralell): 优化并行设备指定方法 ViperEkura 2025-12-26 20:54:33 +0800
  • cfa3cf7daa feat(train): 支持分布式训练的优化器与调度器工厂配置 ViperEkura 2025-12-22 20:41:03 +0800
  • 7623b1e5fd feat(khaosz/data/tokenizer): 优化BPE分词器的预处理和训练配置 ViperEkura 2025-12-22 20:02:10 +0800
  • 573f041c51 feat(trainer): 支持分布式训练配置与检查点加载优化 ViperEkura 2025-12-19 19:34:39 +0800
  • eab7a51bb6 feat(parallel): 改进设备策略注册表与并行设置功能 ViperEkura 2025-12-19 15:25:31 +0800
  • 3ac38a7ebc feat(parallel/device): 引入设备策略注册机制以支持多种后端 ViperEkura 2025-12-15 13:58:59 +0800
  • 831933fb66 fix(mmap): 修复样本数与键值计算逻辑并增强错误处理 ViperEkura 2025-12-15 09:27:29 +0800
  • 701fb9bf78 refactor(data): 将内存映射文件加载逻辑移至独立的 MmapFileHander 类 ViperEkura 2025-12-15 09:12:42 +0800
  • d882f65579 refactor(parallel): 重构parallel模块 ViperEkura 2025-12-13 22:16:17 +0800
  • a30ddca517 fix(data): 修改 Sampler 的长度计算方式, 避免提前初始化 ViperEkura 2025-12-10 18:57:53 +0800
  • 8e975017d3 fix(demo): 修复拼写错误 ViperEkura 2025-12-10 15:22:26 +0800
  • fed4d64cea ci(spell-check): 添加拼写检查工作流 ViperEkura 2025-12-10 15:17:59 +0800
  • 110efd2a21 fix(trainer): 修复训练上下文构建逻辑并修正拼写错误 ViperEkura 2025-12-10 15:02:39 +0800
  • 530fb50352 feat(parallel): 重构并重命名并行工具函数以提升灵活性 ViperEkura 2025-12-10 14:43:35 +0800
  • c86e573195 feat(trainer): 改进模型输入和损失计算中的数据类型精度 ViperEkura 2025-12-08 14:10:08 +0800
  • 0093ba7bb8 build(requirements): 升级 urllib3 版本从 2.5.0 到 2.6.0 ViperEkura 2025-12-08 13:48:50 +0800
  • c934210066 fix(trainer): 修复参数传递问题和检查点保存问题 ViperEkura 2025-12-08 13:28:11 +0800
  • c98b175cd5 refactor(trainer): 优化trainer 结构 ViperEkura 2025-12-07 21:23:05 +0800
  • 82e65ccc21 fix(tools/train): 修复参数传递错误 ViperEkura 2025-12-05 13:53:50 +0800
  • d52685facd feat(paralell): 添加分布式训练配置与并行工具支持 ViperEkura 2025-12-05 13:52:17 +0800
  • d31137a2db feat(config): 重构模型参数状态加载 ViperEkura 2025-12-04 20:23:23 +0800
  • 6270415590 feat(khaosz/parallel): 添加对多种设备后端的支持并优化并行初始化逻辑 ViperEkura 2025-12-03 17:24:32 +0800
  • 08c5a52dc8
    Merge pull request #15 from ViperEkura/dependabot/pip/fonttools-4.61.0 ViperEkura 2025-12-03 16:59:35 +0800
  • ac1fefb363
    build(deps): bump fonttools from 4.59.0 to 4.61.0 dependabot[bot] 2025-12-01 22:28:11 +0000
  • 8b20982933 refactor(parallel): 重命名并重新组织并行模块文件结构 ViperEkura 2025-11-30 17:56:47 +0800
  • d5cc9f065d feat(khaosz/parallel): 添加并行训练设置功能 ViperEkura 2025-11-30 16:44:04 +0800
  • db53cc5001 feat(tools/train): 优化训练参数传递 ViperEkura 2025-11-30 13:49:24 +0800
  • 3ee84b31a0 feat(data): 重构数据集加载逻辑,修复计数错误 ViperEkura 2025-11-28 20:59:24 +0800
  • 567c55685e docs(data/dataset): 更新 load_mmap_files 函数的文档 ViperEkura 2025-11-28 20:27:57 +0800
  • 1f5cba889b fix(data): 修复数据加载模块中的拼写错误并优化内存映射加载逻辑 ViperEkura 2025-11-28 20:21:53 +0800
  • 019bfe4e05 fix(data/sampler): 修正拼写错误并增强采样器功能 ViperEkura 2025-11-27 19:43:36 +0800
  • 36b410384b fix(data/sampler): 增加sampler边界情况处理 ViperEkura 2025-11-27 19:32:40 +0800
  • 09963a3beb refactor(data): 重构数据模块结构并优化可恢复采样器实现 ViperEkura 2025-11-27 18:16:35 +0800
  • 5daf63a7a4 fix(model): 修复加载状态字典时的键存在性检查 ViperEkura 2025-11-25 21:03:10 +0800
  • fb85aaf6a6 fix(parallel): 修改列并行线性层结果聚合方式 ViperEkura 2025-11-21 13:37:08 +0800
  • 6fb6a15e81 feat(model): 添加并行线性层模型支持 ViperEkura 2025-11-21 12:54:59 +0800
  • d9ff662e3a fix(model): 调整 KV Cache 的维度顺序以匹配新的索引逻辑 ViperEkura 2025-11-19 18:26:15 +0800
  • e12ed0a72b fix(khaosz): 为其他模组添加init文件 ViperEkura 2025-11-19 18:25:51 +0800
  • 3bf2468905 fix(tools): 修正训练脚本中的嵌入层参数分组判断条件 ViperEkura 2025-11-19 17:47:33 +0800
  • 3c7ed84516 test(test_tie_weight): 添加测试以验证权重绑定后的数据修改行为 ViperEkura 2025-11-19 17:47:22 +0800
  • 1c3a693d79 feat(model): 优化RMSNorm实现方式 ViperEkura 2025-11-15 13:54:04 +0800
  • e99ef9d6d8 refactor(demo): 重构示例脚本目录结构 ViperEkura 2025-11-10 21:35:04 +0800
  • 4c289e974a refactor(tools): 将工具脚本移动到tools目录下 ViperEkura 2025-11-10 21:26:02 +0800
  • f31bf5a959 test(transformer): 更新 tie_weight 相关测试逻辑 ViperEkura 2025-11-09 17:23:33 +0800
  • 7a21f5d72e build(setup): 更新版本号并调整 Python 版本要求 ViperEkura 2025-11-09 16:40:20 +0800
  • 0b45e8666e fix(scripts): 修复stream_chat.py中的拼写错误 ViperEkura 2025-11-09 16:30:24 +0800
  • 6f3386f02c fix(transformer): 优化state_dict 处理逻辑, 优化attention_mask的处理方式 ViperEkura 2025-11-09 16:25:17 +0800
  • d25202a329 feat(model): 实现旋转位置编码缓存动态扩展 ViperEkura 2025-11-09 14:35:29 +0800
  • 254ec934be feat(transformer): 简化权重绑定逻辑并增加测试单元 ViperEkura 2025-11-07 15:14:54 +0800
  • 7e5ecf3b7d refactor(config): 重命名 TransformerConfig 为 ModelConfig ViperEkura 2025-11-07 07:31:12 +0800
  • 66a551217e refactor(generator): 优化生成逻辑 ViperEkura 2025-11-07 07:24:00 +0800
  • bdc3f4dc63 feat(module): 重构旋转位置编码实现以提升性能和可读性 ViperEkura 2025-11-06 17:52:47 +0800
  • 805773c7fe docs(transformer): 更新process_attention_mask函数文档 ViperEkura 2025-11-05 23:41:11 +0800
  • 7ccc4ab9ac fix(model): 修复加载状态字典时的权重共享问题 ViperEkura 2025-11-05 23:38:45 +0800
  • 69d9374f51 feat(model): 添加 tie_weight 配置选项并优化模型模块实现 ViperEkura 2025-11-05 23:26:57 +0800
  • b260f5581d fix(benchmark): 优化 KV 缓存初始化并更正基准测试类型标识 ViperEkura 2025-11-05 15:44:29 +0800
  • 0a754e3341 feat(scripts): 调整文本生成参数以提升多样性 ViperEkura 2025-11-05 13:56:58 +0800
  • 144b9598ad feat(model): 添加 Linear 和 Embedding 模块的自定义参数初始化支持 ViperEkura 2025-10-31 22:43:12 +0800
  • 877669b799 feat(inference): 添加generate_loop方法并优化KVCacheManager初始化 ViperEkura 2025-10-31 21:15:15 +0800
  • cdb47a62dc test: 统一重构数据集和调度器测试模块 ViperEkura 2025-10-31 20:24:01 +0800
  • e86328b753 fix(tokenizer): 修复stop_ids属性返回错误的token ID列表 ViperEkura 2025-10-31 19:19:38 +0800
  • 5d3799b715 refactor(data): 修改变量命名方式 ViperEkura 2025-10-30 16:32:25 +0800
  • 6a3135f401 fix(data_util): 修复数据集索引计算逻辑并提取通用方法 ViperEkura 2025-10-29 20:58:33 +0800
  • 12850d403c fix(config): 修改Checkpoint类中tokenizer和config字段的默认值初始化方式 ViperEkura 2025-10-29 13:24:20 +0800
  • bad6243b53 fix(train): 更新训练函数参数传递方式 ViperEkura 2025-10-29 13:23:53 +0800
  • f2448a5147 feat(benchmark): 优化KV缓存初始化逻辑 ViperEkura 2025-10-29 12:41:32 +0800
  • 46b2a0f86f feat(train): 添加 max_len 和 step_size 参数支持 ViperEkura 2025-10-29 12:32:17 +0800
  • d94fc5a87a feat(data, inference): 使用chatML格式 ViperEkura 2025-10-29 12:02:43 +0800
  • 38b2725cd1 feat(KVCacheManager): 优化KV缓存结构为元组形式以提升性能 ViperEkura 2025-10-29 12:01:28 +0800
  • bc5ef72001 fix(config): 修正 SGDRScheduleConfig 类名拼写错误 ViperEkura 2025-10-20 18:21:46 +0800
  • e051005334 test(test_module): 更新测试用例以使用新的generate_iterator接口 ViperEkura 2025-10-20 13:52:31 +0800
  • 0db046f8d9 feat(khaosz/trainer): 更新梯度裁剪回调 ViperEkura 2025-10-20 13:30:26 +0800
  • 05b012820b refactor(khaosz): 重构模块导出结构并重命名主模块文件 ViperEkura 2025-10-20 13:07:02 +0800
  • e72e244df6 feat(inference): 实现采样策略并优化生成器逻辑 ViperEkura 2025-10-20 13:00:41 +0800
  • 98efca7b9d feat(trainer): 添加训练起始轮次和批次配置支持 ViperEkura 2025-10-19 21:47:10 +0800
  • 613edd7a14 test(early_stopping, train_strategy): 更新测试配置以提高稳定性 ViperEkura 2025-10-18 22:07:11 +0800
  • 622982364b fix(trainer): 修复检查点加载逻辑 ViperEkura 2025-10-18 21:45:23 +0800
  • b67bc9865d refactor(trainer): 重构学习率调度器实现并分离配置与工厂逻辑 ViperEkura 2025-10-18 16:42:37 +0800
  • c51b203fde refactor(khaosz): 重构项目结构 ViperEkura 2025-10-18 13:56:59 +0800
  • 8434c19923 fix(khaosz/trainer): 修复数据获取中的索引范围错误和参数传递问题 ViperEkura 2025-10-09 19:53:52 +0800
  • 68a15005cb feat(train.py): 支持从检查点恢复训练并优化数据加载配置 ViperEkura 2025-10-07 22:02:50 +0800
  • efbe3de9d3 fix(khaosz/trainer/data_util): 修复数据集索引范围错误 ViperEkura 2025-10-07 20:04:45 +0800
  • 12793bc2d3 feat(khaosz/trainer): 新增梯度统计工具函数并重构训练回调机制 ViperEkura 2025-10-07 13:03:32 +0800
  • 0764cb8296 fix(khaosz/trainer/train_callback): 修复基类函数命名错误 ViperEkura 2025-10-07 11:43:51 +0800
  • 57cd7b921e feat(khaosz/trainer): 改进训练循环中的损失归一化处理 ViperEkura 2025-10-06 20:17:47 +0800