技术文档

深入学习各类技术知识

一文读懂 LLM：从概率预测到 Agent 的底层逻辑

本文带你从零理解大语言模型（LLM）的真实本质：它是一个概率预测引擎，而非真正"理解"语言。文章系统讲解 AI 产品的网关架构、上下文窗口的核心地位，以及 Prompt Engineering、RAG、Function Calling、MCP、Agent 等热门概念的底层实现逻辑，帮助初学者建立完整的 AI 认知框架。

人工智能LLM大语言模型提示词工程

person smallyoung2026/5/22

RAG质量评估全攻略：RAGAS四维指标 + 生产级监控实战

本文手把手讲解 RAGAS 评估框架的四大核心指标（忠实度、答案相关性、上下文召回、上下文精确），并基于 Spring Boot 3.4 + LangChain4j 1.13.1 提供完整的 Java 自动化评估实现，集成 DeepSeek/通义千问 API、SSE 流式推送与 Micrometer 监控，帮助你建立生产级 RAG 质量保障体系。

人工智能RAGRAGASLangChain4j

person smallyoung2026/5/6

具有反思能力的 Agentic RAG 实战：用 LangChain4j 实现 CRAG 纠错检索

本文深入讲解 CRAG（Corrective RAG）纠错式检索增强生成的工作机制，并提供基于 Spring Boot 4 + LangChain4j 1.x 原生 API 的完整可运行 Java 实现，帮你构建具备自我反思和自我纠错能力的智能 RAG 流水线。

人工智能后端开发RAGLangChain4jSpring Boot

person smallyoung2026/4/30

RAG 重排序技术详解：Spring Boot 4 + LangChain4j 1.13.1 实战指南

本文深入讲解 RAG 重排序（Reranking）技术原理，介绍双编码器与交叉编码器的核心差异，并结合 Spring Boot 4 + LangChain4j 1.13.1 原生 API，从零实现本地 ONNX 重排序与 Cohere 云端重排序，附完整可运行测试代码。

人工智能后端开发RAGLangChain4jSpring Boot

person smallyoung2026/4/28

RAG 混合检索深度解析：BM25 + 向量检索 + RRF 算法，让 AI 真正"找到"你要的内容

本文深入解析 RAG 系统中混合检索（Hybrid Retrieval）的核心原理，详细讲解 BM25 关键词检索与向量语义检索的优劣互补，以及 RRF（倒数排名融合）算法的工作机制，并通过 Spring Boot + LangChain4j 提供完整可运行的 Java 代码示例，帮助开发者搭建高召回率的生产级 RAG 检索系统。

人工智能后端开发RAG混合检索LangChain4j

person smallyoung2026/4/25

RAG 文档分块策略完全指南：从原理到 Java 实战

本文系统讲解 RAG 文档分块（Chunking）的 5 种核心策略，涵盖滑动窗口、递归分块、语义分块等原理与对比，并提供完整 LangChain4j Java 代码示例和 2026 年最新基准测试结论，帮助开发者选对分块策略，大幅提升 RAG 检索精度。

人工智能后端开发RAGChunkingLangChain4j

person smallyoung2026/4/24

Java 灵活架构设计：SPI 机制从入门到接入 LLM 与多数据库实战

本文带你从零掌握 Java SPI（Service Provider Interface）机制的原理与实战，通过接入不同 LLM 大模型和多数据库的真实案例，彻底搞懂插件化架构设计的核心思想。

后端开发JavaSPIServiceLoader

person smallyoung2026/4/23

Claude Code 多 Agent 架构深度分析：源码揭秘 Leader-Worker 全貌

基于 Claude Code 源码泄露的 13,700 行核心代码，深度剖析其 Leader-Worker 多Agent编排架构，涵盖三大执行后端、文件邮箱通信、权限委托与 Coordinator 模式，是目前最完整的 Claude Code 内部架构分析。

人工智能Claude Code多Agent架构分析

person smallyoung2026/4/17

LLM提示词注入攻防全解析：真实事故案例与防御实践

提示词注入已连续两年蝉联OWASP LLM十大安全风险榜首。本文深入剖析直接注入、间接注入等六大攻击类型，还原Bing Sydney、Slack AI泄露、Morris-II蠕虫等真实事故全过程，并给出可落地的分层防御工程方案。

人工智能LLM安全提示词注入AI攻防

person smallyoung2026/4/14

LLM Wiki：用结构化编译替代 RAG 检索的个人知识库实践

受 Karpathy "LLM OS" 理念启发，本文记录了使用 llm-wiki Skill 将《西游记》全文编译为结构化知识库的完整实验，并与传统 RAG（Dify 默认设置）进行对比，探讨两种知识管理范式的本质差异与适用边界。

人工智能LLM WikiRAG知识管理

person smallyoung2026/4/11

Karpathy LLM Wiki：用 AI 编译知识，彻底告别 RAG 重复推导

本文带你从零理解 Karpathy LLM Wiki 的核心思想、三层架构与实现方式，看清它与 RAG 的本质差异，掌握构建个人 AI 知识库的最佳实践。

人工智能LLM WikiRAG知识管理

person smallyoung2026/4/10

Claude Code 源码解析：10 个值得借鉴的算法与设计模式

基于 2026 年 3 月泄露的 Claude Code 512,000 行 TypeScript 源码，深入解析权限级联、流式工具执行、双缓冲渲染等 10 个生产级 AI Agent 设计模式，帮助开发者构建更可靠的 Agentic 系统。

人工智能Claude CodeAgentic AI设计模式

person smallyoung2026/4/9

...

共 91 篇文档