Tony老师的博客
  • 首页
  • 文章
  • 相册
  • 关于

文章

五月 11, 2026

深度拆解:AI Agent Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将"无状态"的大语言模型(LLM)转变为全能智能体(Agent)的底层机制。

你可能已经开发过聊天机器人,甚至可能用一些工具搭建了一个 ReAct 循环(ReAct:Reason + Act,一种让模型在行动前先进行推理的模式)。跑 Demo 的时候看着挺好,但一旦投入生产环境,系统就会开始掉链子:模型会忘记三步前做了什么,工具调用悄悄报错,上下文窗口(Context Window)里塞满了毫无意义的垃圾信息。

问题其实并不在模型本身,而在模型外围的基础设施。

LangChain 证明了这一点:他们仅仅通过改变包裹大语言模型的底层架构——模型没变,参数没变——就让系统在 TerminalBench 2.0(一个衡量 AI 智能体处理命令行任务能力的权威基准测试)上的排名从 30 名开外飙升到了第 5 名。另一项研究则通过让大语言模型自己去优化这套架构,实现了 76.4% 的通过率,甚至超过了人类精心设计的系统。

现在,这套基础设施有了一个正式的名字:AI Agent Harness。

继续阅读
五月 9, 2026

为什么没有 f/7 这个光圈值?

这是一个非常经典的问题。其实 f/7 这种数值在数学上是存在的,但在光学设计和工业标准中,我们之所以看不到它,主要是为了简化计算和标准化生产。

继续阅读
四月 11, 2026

一个基于 TradingAgents 框架打造的股票分析 Skill

TradingAgents-CN-Skill 是基于 TradingAgents 框架的中文股票分析 Skill。用户输入股票截图、文字描述或股票代码,Agent 自动完成 4 位分析师 + 2 轮多空辩论 + 风控三方辩论 + 五级评级,输出完整 PDF 报告。

继续阅读
四月 7, 2026

CUDA 并行计算原理解析:GPU 加速的本质

2006 年,NVIDIA 推出了 CUDA(Compute Unified Device Architecture)——一套针对自家 GPU 的并行计算平台和编程模型。在此之前,GPU 的职责单一,仅限于图形渲染;CUDA 的出现,使得开发者可以用熟悉的 C/C++ 语言直接调用 GPU 的算力。

大语言模型训练、深度学习推理、科学计算——这些涉及 TB 级数据处理的任务,底层几乎都运行在 CUDA 之上。本文以中立视角,剖析 CUDA 的核心设计,并透过一个实战例子展示其并行计算模型。

继续阅读
四月 3, 2026

一图看懂 Transformer 架构原理

Transformer 是当今大语言模型(GPT、BERT、T5 等)的基础架构,由 Google 在 2017 年论文 “Attention Is All You Need” 中提出。它彻底抛弃了 RNN 的递归结构,仅依靠注意力机制实现序列建模,在效果和效率上都带来了革命性突破。

本文通过一张架构图 + 核心公式 + 基础概念解释,帮你快速建立对 Transformer 的整体理解。

继续阅读
三月 31, 2026

OpenClaw 内置引擎 + 硅基流动免费模型开启向量搜索

上一篇《OpenClaw 的 QMD 记忆引擎:从尝鲜到放弃》里,我因为 2 核 4G 服务器跑不动 QMD 的 3 个本地 LLM 模型,切回了内置引擎。当时以为内置引擎只有关键词搜索——其实不是。

继续阅读
三月 30, 2026

OpenClaw 的 QMD 记忆引擎:从尝鲜到放弃

OpenClaw 有一套内置的 Memory 系统,基于 SQLite 实现,开箱即用。但对于需要更高搜索质量、更广索引范围的场景,OpenClaw 提供了一个更强大的选项——QMD Memory Engine。

本文梳理 QMD 的核心概念、架构原理、配置方法,以及它在 OpenClaw 记忆体系中的实际角色,最后与 OpenViking 方案做对比。

继续阅读
三月 29, 2026

用腾讯云数据万象替代 Next.js 图片优化

在完成迁移到腾讯云和 SSL/协议优化之后,照片博客的整体性能已经很不错了。但有一个场景始终令人头疼:CDN 缓存失效后的首次加载极慢。深入排查后发现,问题出在 Next.js 的图片优化机制上。

继续阅读
三月 29, 2026

Next.js 照片博客性能优化:回源协议与 HTTP/3 升级

上一篇文章记录了将照片站点从 Vercel 迁移到腾讯云 Lighthouse 的过程。迁移完成后,站点功能正常、性能也有明显提升。但在对 Nginx 日志和响应时间做进一步分析后,发现回源架构和协议层面还有优化空间。

继续阅读
三月 28, 2026

Hacker News 热门话题 - 2026年3月28日

📰 Hacker News 热门 - 2026-03-28

🔥 热门话题

1. Make macOS consistently bad unironically

🔗 链接

作者深入分析 macOS 多年来的设计退化问题,从系统偏好设置的混乱、到 Siri 的失败、再到 Safari 的各种 bug,论证苹果在"细节打磨"上的傲慢正在系统性崩塌。

文章引发强烈共鸣,被批评阵营和苹果粉丝同时关注——前者找到了共鸣素材,后者则激动反驳。这是近年来 HN 上关于苹果批评最火热的帖子之一,331分 + 230条评论。

继续阅读
  • «
  • 1
  • 2
  • 3
  • ...
  • 16
  • ›
  • »
© Tony老师的博客 2026