共 25 篇文章
深度拆解:AI Agent Harness 的构造【译】
本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将"无状态"的大语言模型(LLM)转变为全能智能体(Agent)的底层机制。
你可能已经开发过聊天机器人,甚至可能用一些工具搭建了一个 ReAct 循环(ReAct:Reason + Act,一种让模型在行动前先进行推理的模式)。跑 Demo 的时候看着挺好,但一旦投入生产环境,系统就会开始掉链子:模型会忘记三步前做了什么,工具调用悄悄报错,上下文窗口(Context Window)里塞满了毫无意义的垃圾信息。
问题其实并不在模型本身,而在模型外围的基础设施。
LangChain 证明了这一点:他们仅仅通过改变包裹大语言模型的底层架构——模型没变,参数没变——就让系统在 TerminalBench 2.0(一个衡量 AI 智能体处理命令行任务能力的权威基准测试)上的排名从 30 名开外飙升到了第 5 名。另一项研究则通过让大语言模型自己去优化这套架构,实现了 76.4% 的通过率,甚至超过了人类精心设计的系统。
现在,这套基础设施有了一个正式的名字:AI Agent Harness。
一个基于 TradingAgents 框架打造的股票分析 Skill
TradingAgents-CN-Skill 是基于 TradingAgents 框架的中文股票分析 Skill。用户输入股票截图、文字描述或股票代码,Agent 自动完成 4 位分析师 + 2 轮多空辩论 + 风控三方辩论 + 五级评级,输出完整 PDF 报告。
CUDA 并行计算原理解析:GPU 加速的本质
2006 年,NVIDIA 推出了 CUDA(Compute Unified Device Architecture)——一套针对自家 GPU 的并行计算平台和编程模型。在此之前,GPU 的职责单一,仅限于图形渲染;CUDA 的出现,使得开发者可以用熟悉的 C/C++ 语言直接调用 GPU 的算力。
大语言模型训练、深度学习推理、科学计算——这些涉及 TB 级数据处理的任务,底层几乎都运行在 CUDA 之上。本文以中立视角,剖析 CUDA 的核心设计,并透过一个实战例子展示其并行计算模型。
一图看懂 Transformer 架构原理
Transformer 是当今大语言模型(GPT、BERT、T5 等)的基础架构,由 Google 在 2017 年论文 “Attention Is All You Need” 中提出。它彻底抛弃了 RNN 的递归结构,仅依靠注意力机制实现序列建模,在效果和效率上都带来了革命性突破。
本文通过一张架构图 + 核心公式 + 基础概念解释,帮你快速建立对 Transformer 的整体理解。
OpenClaw 内置引擎 + 硅基流动免费模型开启向量搜索
上一篇《OpenClaw 的 QMD 记忆引擎:从尝鲜到放弃》里,我因为 2 核 4G 服务器跑不动 QMD 的 3 个本地 LLM 模型,切回了内置引擎。当时以为内置引擎只有关键词搜索——其实不是。
OpenClaw 的 QMD 记忆引擎:从尝鲜到放弃
OpenClaw 有一套内置的 Memory 系统,基于 SQLite 实现,开箱即用。但对于需要更高搜索质量、更广索引范围的场景,OpenClaw 提供了一个更强大的选项——QMD Memory Engine。
本文梳理 QMD 的核心概念、架构原理、配置方法,以及它在 OpenClaw 记忆体系中的实际角色,最后与 OpenViking 方案做对比。
Harness Engineering 入门:让 AI Coding Agent 稳定工作的工程实践
最近在研究 AI Coding Agent 的工程化实践,绕不开两个概念:Harness Engineering 和 OpenSpec。两者都跟 AI 写代码有关,但解决的问题完全不同。写篇文章梳理一下。
微单的进化方向:从光学记录到智能影像终端
随着半导体技术和计算科学的爆发,微单(无反相机)正站在一个历史性的拐点。它不再满足于"更好的画质"这一单一维度,而是从"纯光学/电子记录工具"向"智能影像计算终端"全面进化。
这场变革的核心驱动力是速度、算力与全场景融合。以下是我对微单未来进化方向的系统性梳理。
OpenViking × OpenClaw:给 AI Agent 装上长期记忆
最近给 OpenClaw 装上了 OpenViking,顺手配了套记忆"双写"机制。折腾了一阵,记录下过程和使用心得,也深入梳理一下 OpenViking 插件的运行原理——它到底是怎么接管 OpenClaw 的记忆系统的。
Superpowers + OpenSpec:AI 编程黄金搭档工作流
AI 编程工具层出不穷,但真正的问题不是"AI 能不能写代码",而是"如何让 AI 按照软件工程的标准流程开发"。2026 年,两个开源项目——Superpowers 和 OpenSpec——形成了一套被业内称为"黄金搭档"的开发范式。