五月 11, 2026

深度拆解：AI Agent Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理，以及那些将"无状态"的大语言模型（LLM）转变为全能智能体（Agent）的底层机制。

你可能已经开发过聊天机器人，甚至可能用一些工具搭建了一个 ReAct 循环（ReAct：Reason + Act，一种让模型在行动前先进行推理的模式）。跑 Demo 的时候看着挺好，但一旦投入生产环境，系统就会开始掉链子：模型会忘记三步前做了什么，工具调用悄悄报错，上下文窗口（Context Window）里塞满了毫无意义的垃圾信息。

问题其实并不在模型本身，而在模型外围的基础设施。

LangChain 证明了这一点：他们仅仅通过改变包裹大语言模型的底层架构——模型没变，参数没变——就让系统在 TerminalBench 2.0（一个衡量 AI 智能体处理命令行任务能力的权威基准测试）上的排名从 30 名开外飙升到了第 5 名。另一项研究则通过让大语言模型自己去优化这套架构，实现了 76.4% 的通过率，甚至超过了人类精心设计的系统。

现在，这套基础设施有了一个正式的名字：AI Agent Harness。

继续阅读

五月 9, 2026

为什么没有 f/7 这个光圈值？

这是一个非常经典的问题。其实 f/7 这种数值在数学上是存在的，但在光学设计和工业标准中，我们之所以看不到它，主要是为了简化计算和标准化生产。

继续阅读

四月 11, 2026

一个基于 TradingAgents 框架打造的股票分析 Skill

TradingAgents-CN-Skill 是基于 TradingAgents 框架的中文股票分析 Skill。用户输入股票截图、文字描述或股票代码，Agent 自动完成 4 位分析师 + 2 轮多空辩论 + 风控三方辩论 + 五级评级，输出完整 PDF 报告。

继续阅读

四月 7, 2026

CUDA 并行计算原理解析：GPU 加速的本质

2006 年，NVIDIA 推出了 CUDA（Compute Unified Device Architecture）——一套针对自家 GPU 的并行计算平台和编程模型。在此之前，GPU 的职责单一，仅限于图形渲染；CUDA 的出现，使得开发者可以用熟悉的 C/C++ 语言直接调用 GPU 的算力。

大语言模型训练、深度学习推理、科学计算——这些涉及 TB 级数据处理的任务，底层几乎都运行在 CUDA 之上。本文以中立视角，剖析 CUDA 的核心设计，并透过一个实战例子展示其并行计算模型。

继续阅读

四月 3, 2026

一图看懂 Transformer 架构原理

Transformer 是当今大语言模型（GPT、BERT、T5 等）的基础架构，由 Google 在 2017 年论文 “Attention Is All You Need” 中提出。它彻底抛弃了 RNN 的递归结构，仅依靠注意力机制实现序列建模，在效果和效率上都带来了革命性突破。

本文通过一张架构图 + 核心公式 + 基础概念解释，帮你快速建立对 Transformer 的整体理解。

继续阅读

三月 31, 2026

OpenClaw 内置引擎 + 硅基流动免费模型开启向量搜索

上一篇《OpenClaw 的 QMD 记忆引擎：从尝鲜到放弃》里，我因为 2 核 4G 服务器跑不动 QMD 的 3 个本地 LLM 模型，切回了内置引擎。当时以为内置引擎只有关键词搜索——其实不是。

继续阅读

三月 30, 2026

OpenClaw 的 QMD 记忆引擎：从尝鲜到放弃

OpenClaw 有一套内置的 Memory 系统，基于 SQLite 实现，开箱即用。但对于需要更高搜索质量、更广索引范围的场景，OpenClaw 提供了一个更强大的选项——QMD Memory Engine。

本文梳理 QMD 的核心概念、架构原理、配置方法，以及它在 OpenClaw 记忆体系中的实际角色，最后与 OpenViking 方案做对比。

继续阅读

三月 29, 2026

用腾讯云数据万象替代 Next.js 图片优化

在完成迁移到腾讯云和 SSL/协议优化之后，照片博客的整体性能已经很不错了。但有一个场景始终令人头疼：CDN 缓存失效后的首次加载极慢。深入排查后发现，问题出在 Next.js 的图片优化机制上。

继续阅读

三月 29, 2026

Next.js 照片博客性能优化：回源协议与 HTTP/3 升级

上一篇文章记录了将照片站点从 Vercel 迁移到腾讯云 Lighthouse 的过程。迁移完成后，站点功能正常、性能也有明显提升。但在对 Nginx 日志和响应时间做进一步分析后，发现回源架构和协议层面还有优化空间。

继续阅读

三月 28, 2026

Hacker News 热门话题 - 2026年3月28日

📰 Hacker News 热门 - 2026-03-28

🔥 热门话题

1. Make macOS consistently bad unironically

🔗 链接

作者深入分析 macOS 多年来的设计退化问题，从系统偏好设置的混乱、到 Siri 的失败、再到 Safari 的各种 bug，论证苹果在"细节打磨"上的傲慢正在系统性崩塌。

文章引发强烈共鸣，被批评阵营和苹果粉丝同时关注——前者找到了共鸣素材，后者则激动反驳。这是近年来 HN 上关于苹果批评最火热的帖子之一，331分 + 230条评论。

继续阅读