Arxiv每日速递(2026-04-05)
以文档为中心的项目开发范式:让项目“记忆”驱动AI自动化运行
TrendPulse 技术趋势追踪报告
Claude Code 的 Agent Harness 工程
通过 Frozen Lake 理解 PPO 与 GRPO
多臂老虎机问题
图解:LLM是怎么通过PPO优化偏好的?
🎨 Stable Diffusion 提示词指南书
Transformer语言模型的位置编码与长度外推
vLLM:利用分页缓存和张量并行提高大模型2~4x推理速度
公告
记录和分享一些学习和开源内容,若有问题可通过邮箱is.louishsu@foxmail.com联系,欢迎交流!!