Ethan 发布的文章

2025-06-04

2025年检索增强生成（RAG）最新进展与前沿技术检索增强生成（Retrieval Augmented Generation, RAG）已从一个相对简单的"检索-生成"范式，演变为一个包含众多专业技术的复杂生态系统。2025年的发展趋势表明，RAG 的重点在于通过更高级的智能、适应性和上下文感知能力，来增强其流水线中的每一个组成部分。一、RAG 的演进历程最初的 RAG 系统采用固定的流水线作业：切块 → 向量化 → TopK检索 → 生成。然而实际应用中暴露了诸多问题，促使研究者将更复杂的推理能力嵌入 RAG 的各个阶段。2025年的演进可以概括为： Naive RAG：基础检索-生成两阶段 Advanced RAG：引入查询重写、重排序、上下文压缩 Self-RAG：系统评估自身中间步骤，动态调整策略 Agentic RAG：LLM 作为主动参与组件，自主规划检索策略二、现代 RAG 的核心挑战1. 幻觉减少（Hallucination Reduction）确保 LLM 忠实地利用检索到的上下文进行生成仍是核心目标。CiteFix 和 DRAG 等技术专门针对这一问题，通过强制引用检索文档来约束生成行为。2. 知识陈旧性RAG 提供了无需完全重训练 LLM 即可注入最新知识的机制，但知识库的时效性管理成为了新的挑战。3. "Lost in the Middle" 问题LLM 倾向于关注文档的开头和结尾而忽略中间内容。先进的分块、重排序和上下文压缩技术致力于解决这一问题。三、先进的分块与嵌入策略语义分块：基于嵌入向量的语义相似性对句子进行分组，创建上下文感知的分块，取代传统的固定大小分块方法。文档结构感知分块：利用 Markdown 标题、章节、代码结构等确定分块边界，保留逻辑单元的完整性。Agentic 分块：让 LLM 自身根据语义含义和内容结构来决定最佳分块方式，最具实验性但也最有前景。四、鲁棒性 RAG：面向现实世界的设计2025年 RAG 研究的一个重要趋势是"面向鲁棒性的设计"。研究者正推动 RAG 从在干净数据集上追求准确率，转向在噪声数据、对抗性攻击、信息冲突等复杂条件下保持可靠性。代表性工作包括处理冲突信息的 Madam-RAG 和应对知识库投毒的 EcoSafeRAG。这种"防御性设计"对于企业采纳和高风险应用至关重要。五、总结与展望2025年的 RAG 正从简单的"检索-生成"管道演变为具备元学习能力的智能系统。未来的发展方向包括更强的自我适应能力、多模态检索集成以及更低的部署门槛。

2025年06月04日
28
0
1

2025-05-26

Dify Agent vs Workflow：AI 执行机制差异与选型指南在开源大语言模型应用平台 Dify 中，Agent 和 Workflow 是两种最核心的任务执行机制。虽然它们都可以"驱动应用"，但本质完全不同——Agent 更像一个带有策略和调用能力的 AI 决策系统，而 Workflow 是一个可以显式编排的可视化任务流程。核心定义Dify AgentAgent 是一种具有"策略 + 工具调用能力"的 AI 执行体，具备以下核心能力：自主决策：支持 ReAct、Function Calling 等多种推理策略工具集成：访问外部 API、数据库、插件，实现检索、查询、修改等操作多轮推理：记住上下文、调用多个函数、形成循环思考状态感知：结合用户输入、历史对话、系统变量做策略选择 Dify WorkflowWorkflow 是一个基于节点可视化的流程编排系统，相当于"无代码/低代码"编排的复杂 LLM 应用：节点（Node）：每个节点代表一个操作，如 LLM 调用、函数执行、HTTP 请求等数据流：节点间通过结构化 JSON 传递数据条件逻辑：支持 if/else、switch 分支、循环判断等 Agent 嵌入：Workflow 支持调用 Agent 节点，实现"流程 + 推理"的组合能力功能维度深度对比对比维度WorkflowAgent 控制方式显式流程图（节点+条件+顺序）策略驱动（ReAct/Function Call）是否状态机是（可视化流程状态）否（推理链路通过 LLM 维护）适合任务有清晰逻辑顺序的场景目标不清晰、需动态判断多轮支持部分支持（依赖节点）原生支持上下文与记忆能力工具调用内部节点明确调用由 LLM 推理触发易调试性强，可追踪每个节点状态较弱，需结合日志分析重复利用可模块化节点复用可创建共享 Agent 配置架构职责分工在实际应用中，两者并非互斥而是互补： Workflow 是主流程控制器：决定哪个 Agent 上场，何时调用函数，是否继续执行 Agent 是内嵌的智能决策员：在节点内部调用 LLM + Tools 实现复杂任务解决实际选型建议优先使用 Workflow：数据处理管道、CRM 自动化入库、WebHook 触发流程、有明确步骤顺序的业务场景。优先使用 Agent：需要多轮问答的客服系统、检索式 QA 系统、代码分析助手、需要自主探索的复杂任务。最佳实践：在 Workflow 中嵌入 Agent 节点，利用 Agent 处理不确定性高的子任务，Workflow 负责整体流程的调度与监控。

2025年05月26日
11
0
1

2025-05-18

TypeScript 高级类型编程：泛型、条件类型与类型体操实战 TypeScript 的类型系统是图灵完备的——这意味着你可以在类型层面进行"编程"。掌握高级类型不仅能提高代码的可维护性，更是编写高质量库和框架的必备技能。本文从泛型出发，逐步深入到条件类型和类型体操。泛型的本质：类型参数化泛型（Generics）让函数、接口、类可以接受类型参数，实现"一次定义，多处复用"：// 没有泛型：每个类型都要写一遍\nfunction firstNumber(arr: number[]): number | undefined \nfunction firstString(arr: string[]): string | undefined \n// 使用泛型：一个函数适用所有类型\nfunction first(arr: T[]): T | undefined \n\nconst num = first([1, 2, 3]); // num: number\nconst str = first(['a', 'b']); // str: string泛型约束：限制类型参数的范围// 使用 extends 约束泛型\ninterface HasLength \nfunction logLength(arg: T): T \nlogLength('hello'); // string 有 length\nlogLength([1, 2, 3]); // array 有 length\nlogLength(123); // number 没有 length，编译错误\n\n// 使用 keyof 约束为对象属性的键\nfunction getProperty(obj: T, key: K): T[K] 条件类型：类型层面的 if/else条件类型是 TypeScript 类型系统的"控制流"：// 基本语法：T extends U ? X : Y\ntype IsString = T extends string ? 'yes' : 'no';\ntype A = IsString; // 'yes'\ntype B = IsString; // 'no'\n\n// 实际应用：提取类型\ntype ExtractPromise = T extends Promise ? R : T;\ntype C = ExtractPromise; // string\ntype D = ExtractPromise; // number\n\n// 深层提取\ntype DeepExtractPromise = T extends Promise ? DeepExtractPromise : T;infer 关键字：从类型中提取信息// 提取函数返回值类型\ntype ReturnType = T extends (...args: any[]) => infer R ? R : never;\n// 提取函数参数类型\ntype FirstParam = T extends (first: infer F, ...rest: any[]) => any ? F : never;\n// 提取数组元素类型\ntype ArrayElement = T extends (infer E)[] ? E : never;模板字面量类型：类型层面的字符串操作type EventName = `on$`;\ntype ClickEvent = EventName; // 'onClick'\ntype ChangeEvent = EventName; // 'onChange'\n\n// 实战：类型安全的事件系统\ntype EventMap = ; change: };\ntype EventHandlers = `]: (data: EventMap[K]) => void;\n};\n// ) => void;\n// onChange: (data: ) => void }映射类型与工具类型实战interface User \n// Partial：所有属性变为可选\ntype PartialUser = Partial;\n// Required：所有属性变为必填\ntype RequiredUser = Required;\n// Pick：选取部分属性\ntype UserPreview = Pick;\n// Omit：排除部分属性\ntype UserWithoutId = Omit;\n// Record：构造对象类型\ntype PageRoute = Record;实战：类型安全的 API 请求封装// 定义 API 接口映射\ninterface ApiMap ;\n '/api/users': ;\n}\ninterface ApiResultMap ;\n '/api/users': ;\n}\n\n// 类型安全的请求函数\nasync function request(\n url: T, params: ApiMap[T]\n): Promise );\n return response.json();\n}\n\n// 使用时获得完整的类型提示和检查\nconst user = await request('/api/user', ); // user.name 有自动补全总结TypeScript 的类型系统是一把双刃剑。用得好的类型能成为最好的文档和最可靠的守卫；用得过度的类型会成为维护的负担。掌握高级类型的关键在于：先解决实际问题，再追求类型的优雅。

2025年05月18日
11
0
1

2025-05-17

Rust vs Go：2025 微服务性能基准测试深度对比在构建微服务架构时，Rust 和 Go 是两个最受关注的后端语言选择。本文基于 2025 年最新版本（Rust 1.75 和 Go 1.22）的实际基准测试，深入对比两者在微服务场景下的性能表现。测试环境组件规格 CPUAMD Ryzen 9 7950X (16核32线程) 内存64GB DDR5-6000 系统Ubuntu 24.04 LTS Rust1.75.0 (Axum框架) Go1.22.3 (Gin框架) HTTP 服务性能对比指标Rust (Axum)Go (Gin)差异吞吐量 (req/s)187,450142,380Rust +31.7% P50 延迟 (ms)0.520.68Rust -23.5% P99 延迟 (ms)1.271.85Rust -31.4% 内存使用 (MB)18.327.6Rust -33.7% 关键性能差异分析1. P99 延迟尖峰问题Go 在 P99 延迟上出现了明显的尖峰，主要原因是垃圾回收（GC）的 Stop-The-World 暂停。尽管 Go 1.22 显著改进了 GC 延迟，但在高并发场景下仍可观察到周期性的延迟抖动。Rust 的无 GC 所有权模型从根本上避免了这一问题。2. 内存使用效率Rust 的零成本抽象模型使其在内存使用上比 Go 节省约 33.7%。对于大规模部署而言，这意味着在相同硬件上可以运行更多实例，直接转化为云成本的节约。3. 并发处理能力Go 的 Goroutine 调度器极为高效，10,000 个并发连接的测试中两者均表现优异。但在 CPU 密集型计算场景下，Rust 的 async/await 模型展现出更好的可预测性能。Rust 常见陷阱学习曲线陡峭：所有权和生命周期概念需要时间消化编译时间较长：大型项目的增量编译仍需优化异步生态碎片化：需要在 Tokio、async-std 等运行时之间做选择 Go 常见陷阱 GC 延迟抖动：对延迟敏感的应用需特别注意零值陷阱：nil 指针和零值可能导致隐蔽的 bug 没有枚举类型：缺乏完善的代数数据类型支持选型建议选择 Rust 的场景：需要极致性能和可预测延迟的系统级组件、高频交易系统、边缘计算节点、数据密集型管道处理。选择 Go 的场景：快速迭代的 API 服务、团队开发效率优先的项目、需要简单运维的云原生微服务、初创团队的 MVP 开发。

2025年05月17日
10
0
1

2025-05-12

Bun 1.2 全栈实战：新一代 JavaScript 运行时深度评测 Bun 作为新兴的 JavaScript 运行时，在 2025 年发布的 1.2 版本中新增了大量企业级特性，正逐步从一个"快速的 Node.js 替代品"进化为"全栈开发一体化平台"。本文将从实际项目出发，全面评测 Bun 1.2 的核心能力。Bun 1.2 核心特性1. 内置 PostgreSQL 客户端：Bun 1.2 新增了原生 SQL 支持，无需安装第三方驱动，可以直接编写参数化查询。性能比 node-postgres 快 3-5 倍。import from "bun"; const users = await sql`SELECT * FROM users WHERE age > $`;2. Bun.serve() HTTP 服务器升级：支持 HTTP/2 和 WebSocket 零配置，内置压缩和 TLS。3. 改进的 Node.js 兼容性：Bun 1.2 的 Node.js 兼容率已从 90% 提升至 97%，大部分 npm 包可以直接运行。构建全栈应用使用 Bun 的全栈能力，一个简单的 API 服务只需要几十行代码：const server = Bun.serve( return new Response("Not Found", ); }, });与 Node.js/Deno 对比在相同的 HTTP 服务基准测试中，Bun 1.2 的吞吐量是 Node.js 20 的 2.8 倍，是 Deno 2.0 的 1.6 倍。启动速度方面，Bun 平均在 25ms 内完成冷启动，而 Node.js 需要约 80ms。但需要注意，Bun 在 Windows 上的支持仍然落后于 macOS/Linux。何时应该迁移到 Bun？如果你的项目是一个新启动的全栈应用，或者对服务端性能有较高要求，Bun 1.2 是一个非常值得考虑的选择。但对于依赖大量原生 C++ 模块的大型项目，建议等待生态进一步成熟。

2025年05月12日
13
0
1

Ethan 发布的文章 - CorePlayers