AI · 大模型 · 软件架构
如果你对 AI、软件架构感兴趣,欢迎关注我的社交账号。内容同步更新至今日头条、微信公众号、掘金、知乎等平台。
内容同步更新,欢迎在各平台关注
微信公众号
SmallYoung
知乎
深度问答与干货分享
今日头条
AI技术深度解析
掘金
技术文章同步更新
91
技术文章
6
技术分类
216
技术标签
持续更新中,覆盖 AI 前沿技术
一文读懂 LLM:从概率预测到 Agent 的底层逻辑
本文带你从零理解大语言模型(LLM)的真实本质:它是一个概率预测引擎,而非真正"理解"语言。文章系统讲解 AI 产品的网关架构、上下文窗口的核心地位,以及 Prompt Engineering、RAG、Function Calling、MCP、Agent 等热门概念的底层实现逻辑,帮助初学者建立完整的 AI 认知框架。
RAG质量评估全攻略:RAGAS四维指标 + 生产级监控实战
本文手把手讲解 RAGAS 评估框架的四大核心指标(忠实度、答案相关性、上下文召回、上下文精确),并基于 Spring Boot 3.4 + LangChain4j 1.13.1 提供完整的 Java 自动化评估实现,集成 DeepSeek/通义千问 API、SSE 流式推送与 Micrometer 监控,帮助你建立生产级 RAG 质量保障体系。
具有反思能力的 Agentic RAG 实战:用 LangChain4j 实现 CRAG 纠错检索
本文深入讲解 CRAG(Corrective RAG)纠错式检索增强生成的工作机制,并提供基于 Spring Boot 4 + LangChain4j 1.x 原生 API 的完整可运行 Java 实现,帮你构建具备自我反思和自我纠错能力的智能 RAG 流水线。
RAG 重排序技术详解:Spring Boot 4 + LangChain4j 1.13.1 实战指南
本文深入讲解 RAG 重排序(Reranking)技术原理,介绍双编码器与交叉编码器的核心差异,并结合 Spring Boot 4 + LangChain4j 1.13.1 原生 API,从零实现本地 ONNX 重排序与 Cohere 云端重排序,附完整可运行测试代码。
RAG 混合检索深度解析:BM25 + 向量检索 + RRF 算法,让 AI 真正"找到"你要的内容
本文深入解析 RAG 系统中混合检索(Hybrid Retrieval)的核心原理,详细讲解 BM25 关键词检索与向量语义检索的优劣互补,以及 RRF(倒数排名融合)算法的工作机制,并通过 Spring Boot + LangChain4j 提供完整可运行的 Java 代码示例,帮助开发者搭建高召回率的生产级 RAG 检索系统。
RAG 文档分块策略完全指南:从原理到 Java 实战
本文系统讲解 RAG 文档分块(Chunking)的 5 种核心策略,涵盖滑动窗口、递归分块、语义分块等原理与对比,并提供完整 LangChain4j Java 代码示例和 2026 年最新基准测试结论,帮助开发者选对分块策略,大幅提升 RAG 检索精度。