• 梯度下降算步长选择

    1. 梯度下降更新规则 梯度下降的基本更新公式: θnew = θold − η∇L(θold) 其中: - θ:模型参数 - L(θ):损失函数 - ∇L(θold):梯度(一阶导数) - η:学习率(步长) 为简化记号,令 g = ∇L(θold...
  • Gitea配置与Nginx反向代理

    概述 成功部署 Gitea 并使用国内镜像源,配置 Nginx 反向代理使 Gitea 在子路径 /gitea 下可用。 环境 操作系统:Ubuntu 22.04.5 LTS Docker 版本:29.3.1 Docker Compose 插件版本...
  • Astrbot与NapCat部署指南

    本文档提供 AstrBot(聊天机器人框架)与 NapCat(QQ 协议端)的完整部署流程,适用于通过 Docker Compose 在 Linux 服务器上部署,并通过 Nginx 反向代理将 WebUI 暴露在子路径 /bot/ 下。 1. 概述...
  • LLM工具调用与流式生成

    项目概览 属性 值 项目名称 NanoClaw 技术栈 Flask + SQLAlchemy + PyJWT Python 版本 >= 3.10 核心能力 多 LLM 提供商适配 / 工具调用 / 流式 SSE / 工...
  • 扩散模型推理优化

    1. DDPM 1.1. 前向扩散过程 给定真实数据样本 x0 ∼ q(x0),DDPM 定义一个固定的、参数化的马尔可夫链,在 T 步内将数据逐渐转化为标准高斯噪声: 其中: - βt ∈ (0, 1) 是预设的小方差(通常随 t 缓慢增大) -...
  • FlashAttention算子优化

    1. 技术背景 注意力机制是现代深度学习的核心组件之一,特别是Transformer架构的成功,使注意力机制成为自然语言处理、计算机视觉和多模态领域的基础算子。然而,标准的注意力计算存在显著的计算瓶颈和内存访问问题,限制了模型规模和训练效率。 常见的...
  • AstrAI:一个轻量级 LLM 训练与推理框架的技术解析

    引言 在 LLM (大语言模型) 蓬勃发展的今天,如何高效地训练和部署模型成为每一个 AI 工程师面临的挑战。 AstrAI 是一个完全自研的轻量级 Transformer 训练与推理框架,旨在为开发者和研究团队提供高性能、易用的训练推理解决方案。 ...