深入学习各类技术知识
一文读懂 LLM:从概率预测到 Agent 的底层逻辑
本文带你从零理解大语言模型(LLM)的真实本质:它是一个概率预测引擎,而非真正"理解"语言。文章系统讲解 AI 产品的网关架构、上下文窗口的核心地位,以及 Prompt Engineering、RAG、Function Calling、MCP、Agent 等热门概念的底层实现逻辑,帮助初学者建立完整的 AI 认知框架。
RAG质量评估全攻略:RAGAS四维指标 + 生产级监控实战
本文手把手讲解 RAGAS 评估框架的四大核心指标(忠实度、答案相关性、上下文召回、上下文精确),并基于 Spring Boot 3.4 + LangChain4j 1.13.1 提供完整的 Java 自动化评估实现,集成 DeepSeek/通义千问 API、SSE 流式推送与 Micrometer 监控,帮助你建立生产级 RAG 质量保障体系。
具有反思能力的 Agentic RAG 实战:用 LangChain4j 实现 CRAG 纠错检索
本文深入讲解 CRAG(Corrective RAG)纠错式检索增强生成的工作机制,并提供基于 Spring Boot 4 + LangChain4j 1.x 原生 API 的完整可运行 Java 实现,帮你构建具备自我反思和自我纠错能力的智能 RAG 流水线。
RAG 重排序技术详解:Spring Boot 4 + LangChain4j 1.13.1 实战指南
本文深入讲解 RAG 重排序(Reranking)技术原理,介绍双编码器与交叉编码器的核心差异,并结合 Spring Boot 4 + LangChain4j 1.13.1 原生 API,从零实现本地 ONNX 重排序与 Cohere 云端重排序,附完整可运行测试代码。
RAG 混合检索深度解析:BM25 + 向量检索 + RRF 算法,让 AI 真正"找到"你要的内容
本文深入解析 RAG 系统中混合检索(Hybrid Retrieval)的核心原理,详细讲解 BM25 关键词检索与向量语义检索的优劣互补,以及 RRF(倒数排名融合)算法的工作机制,并通过 Spring Boot + LangChain4j 提供完整可运行的 Java 代码示例,帮助开发者搭建高召回率的生产级 RAG 检索系统。
RAG 文档分块策略完全指南:从原理到 Java 实战
本文系统讲解 RAG 文档分块(Chunking)的 5 种核心策略,涵盖滑动窗口、递归分块、语义分块等原理与对比,并提供完整 LangChain4j Java 代码示例和 2026 年最新基准测试结论,帮助开发者选对分块策略,大幅提升 RAG 检索精度。
Java 灵活架构设计:SPI 机制从入门到接入 LLM 与多数据库实战
本文带你从零掌握 Java SPI(Service Provider Interface)机制的原理与实战,通过接入不同 LLM 大模型和多数据库的真实案例,彻底搞懂插件化架构设计的核心思想。
Claude Code 多 Agent 架构深度分析:源码揭秘 Leader-Worker 全貌
基于 Claude Code 源码泄露的 13,700 行核心代码,深度剖析其 Leader-Worker 多Agent编排架构,涵盖三大执行后端、文件邮箱通信、权限委托与 Coordinator 模式,是目前最完整的 Claude Code 内部架构分析。
LLM提示词注入攻防全解析:真实事故案例与防御实践
提示词注入已连续两年蝉联OWASP LLM十大安全风险榜首。本文深入剖析直接注入、间接注入等六大攻击类型,还原Bing Sydney、Slack AI泄露、Morris-II蠕虫等真实事故全过程,并给出可落地的分层防御工程方案。
LLM Wiki:用结构化编译替代 RAG 检索的个人知识库实践
受 Karpathy "LLM OS" 理念启发,本文记录了使用 llm-wiki Skill 将《西游记》全文编译为结构化知识库的完整实验,并与传统 RAG(Dify 默认设置)进行对比,探讨两种知识管理范式的本质差异与适用边界。
Karpathy LLM Wiki:用 AI 编译知识,彻底告别 RAG 重复推导
本文带你从零理解 Karpathy LLM Wiki 的核心思想、三层架构与实现方式,看清它与 RAG 的本质差异,掌握构建个人 AI 知识库的最佳实践。
Claude Code 源码解析:10 个值得借鉴的算法与设计模式
基于 2026 年 3 月泄露的 Claude Code 512,000 行 TypeScript 源码,深入解析权限级联、流式工具执行、双缓冲渲染等 10 个生产级 AI Agent 设计模式,帮助开发者构建更可靠的 Agentic 系统。