ViperEkura
|
912d7c7f54
|
chore: 更新脚本并且修改gitignore
|
2026-04-02 15:40:31 +08:00 |
ViperEkura
|
475de51c7d
|
feat: 增加server, 并且修改测试单元
|
2026-04-02 15:05:07 +08:00 |
ViperEkura
|
9f1561afe7
|
reafactor: 修改ModelParameter
|
2026-03-31 16:00:55 +08:00 |
ViperEkura
|
80c0b20877
|
Update issue templates
|
2026-03-31 15:20:21 +08:00 |
ViperEkura
|
e7721eafc6
|
docs: 更新说明内容
|
2026-03-31 15:18:49 +08:00 |
ViperEkura
|
4ead0a20cf
|
chore: 修改文件夹结构
|
2026-03-31 10:14:08 +08:00 |
ViperEkura
|
b1527d9575
|
docs: 优化文档结构并添加 GitHub 模板
|
2026-03-31 10:00:49 +08:00 |
ViperEkura
|
2e009cf59a
|
chore: 更新项目名称
|
2026-03-31 09:34:11 +08:00 |
ViperEkura
|
780b9e1855
|
fix: 修复参数传递问题
|
2026-03-31 01:23:29 +08:00 |
ViperEkura
|
aef7615abd
|
docs: 更新README
|
2026-03-31 00:50:01 +08:00 |
ViperEkura
|
50488bd659
|
chore: 简化格式并更新文档
|
2026-03-31 00:28:58 +08:00 |
ViperEkura
|
eb57e55fca
|
chore: 更新计算顺序
|
2026-03-30 23:35:22 +08:00 |
ViperEkura
|
426af2d75f
|
style: 使用ruff 工具优化代码风格
|
2026-03-30 23:32:28 +08:00 |
ViperEkura
|
345fd2f091
|
fix: 修复参数传递问题
|
2026-03-30 22:22:36 +08:00 |
ViperEkura
|
e1f9901384
|
build: 更新设置
|
2026-03-30 21:44:50 +08:00 |
ViperEkura
|
0e7fc623b4
|
fix: 修复部分已知问题
|
2026-03-30 21:42:00 +08:00 |
ViperEkura
|
3e33c14376
|
reafactor: 统一并增强项目中的工厂模式实现
|
2026-03-30 01:33:14 +08:00 |
ViperEkura
|
60f4df95bd
|
fix: 修复一些已知问题
|
2026-03-30 01:08:19 +08:00 |
ViperEkura
|
c01791ff54
|
feat: 增加推理部分工厂模式
|
2026-03-30 00:55:15 +08:00 |
ViperEkura
|
980299cd54
|
fix: 修复参数传递问题
|
2026-03-20 21:54:13 +08:00 |
ViperEkura
|
3e8f2eba81
|
fix: 修复路径问题
|
2026-03-20 21:14:02 +08:00 |
ViperEkura
|
361cdeb296
|
chore: 修改策略命名
|
2026-03-19 23:08:41 +08:00 |
ViperEkura
|
50f76cd7c7
|
refactor: 重构数据模块中的数据集类命名和文件结构
|
2026-03-19 22:37:32 +08:00 |
ViperEkura
|
0f518473af
|
fix: 修复强化学习算法问题
|
2026-03-19 22:23:51 +08:00 |
ViperEkura
|
a5574f92e2
|
feat: 初步实现grpo 算法逻辑
|
2026-03-19 20:56:53 +08:00 |
ViperEkura
|
abcedf892e
|
feat: 增加 MLA 模块
|
2026-03-18 16:41:46 +08:00 |
ViperEkura
|
abc3a06266
|
chore: 增加ppl计算工具并优化代码格式
|
2026-03-18 16:16:02 +08:00 |
ViperEkura
|
62fba9a298
|
refactor: 优化接口设置, 去除冗余代码
|
2026-03-18 15:07:35 +08:00 |
ViperEkura
|
e23a5ca426
|
fix: 修复metric 保存时机的问题
|
2026-03-16 20:07:36 +08:00 |
ViperEkura
|
e55b57d771
|
fix: 修复梯度平均问题
|
2026-03-13 23:00:26 +08:00 |
ViperEkura
|
c4feab96fe
|
fix: 统一state_dict 处理方式
|
2026-03-13 22:41:56 +08:00 |
ViperEkura
|
e35cb0d84a
|
feat: 增加 label smoothing 设置
|
2026-03-13 22:37:27 +08:00 |
ViperEkura
|
6d6ef6dbb6
|
refactor: 修改project logo
|
2026-03-06 12:15:49 +08:00 |
ViperEkura
|
493fe4e84b
|
feat: 增加 label smothing
|
2026-03-06 11:41:14 +08:00 |
ViperEkura
|
82d22c5742
|
fix: 修复callback 时机不一致的问题
|
2026-03-06 10:51:22 +08:00 |
ViperEkura
|
96744ac2d2
|
refactor: 修改metric_util.py
|
2026-03-06 10:33:44 +08:00 |
ViperEkura
|
2331713fde
|
refactor: 修改训练脚本
|
2026-03-05 14:40:26 +08:00 |
ViperEkura
|
c74fbf84b7
|
build: 增加h5py 版本号
|
2026-03-04 21:29:37 +08:00 |
ViperEkura
|
5a8c442315
|
docs: 修改 README
|
2026-03-04 20:51:09 +08:00 |
ViperEkura
|
c7d0448822
|
fix: 修复StepMonitorCallback序列化问题
|
2026-03-04 20:38:07 +08:00 |
ViperEkura
|
1d43a1785e
|
build: 修改dependencies 以及版本号
|
2026-03-04 20:13:38 +08:00 |
ViperEkura
|
5713b55500
|
refactor: 修改 StepMonitorCallback, 分离职责
|
2026-03-04 19:45:39 +08:00 |
ViperEkura
|
b53e10aac4
|
refactor: 修改metric 监测部分
|
2026-03-03 16:08:50 +08:00 |
ViperEkura
|
dff58468d6
|
fix: 修复 load_h5 丢失文件的问题
|
2026-03-02 17:37:28 +08:00 |
ViperEkura
|
8a8d6369bc
|
fix: 修复 dataset 和 checkpoint 的 bug
|
2026-03-02 11:12:21 +08:00 |
ViperEkura
|
80e17418b4
|
fix: 修复一些运行时问题
|
2026-03-01 15:47:07 +08:00 |
ViperEkura
|
6089a12cef
|
fix: 修复参数传递问题并更新测试单元
|
2026-02-28 19:01:16 +08:00 |
ViperEkura
|
b17cc6a6fb
|
refactor: 修改参数传递方案
|
2026-02-28 18:09:00 +08:00 |
ViperEkura
|
a33d086883
|
build: 修改build 方式
|
2026-02-27 17:52:28 +08:00 |
ViperEkura
|
e9f42ec8b1
|
Change license from Apache 2.0 to GPL v3.0
|
2026-02-22 21:20:34 +08:00 |