AI

共 41 篇文章

文章七月 9, 2026

腾讯混元 Hy3 深度解析：295B MoE、快慢思考融合、Agent 能力跃升

2026 年 4 月 23 日，腾讯混元发布并开源 Hy3 preview；7 月 6 日正式版（GA）上线，Agent 任务解决率跃升至 90%，ClawEval pass³ 拿到 68.5，超过 DeepSeek V4 Pro 的 62.4。本文围绕架构、创新点、性能表现和差异化四个维度，做一次系统梳理。

文章七月 5, 2026

如何在不确定的大模型上，构建可靠的系统？——读《Agent 设计模式》

大模型的本质是预测下一个 token，它是概率性的。同样的输入，可能给出不同的输出；它会一本正经地胡说，也会在关键时刻掉链子。可我们偏偏想用它来搭建可靠的系统——能被信任、能上生产、能对结果负责的系统。

这就是横亘在整个 Agent 工程面前的核心命题，也是这篇文章的主线：

如何在不确定的大模型之上，构建确定性的可靠系统？

文章七月 4, 2026

Hacker News 热门话题 2026-07-04

本周 Hacker News 热门话题涵盖商业策略、AI 本地运行、网络安全、开源工具和科学研究等多个领域，以下是本期精选内容。

文章六月 30, 2026

从 CoT 到 ToT：大模型推理的思维进化与剪枝策略

过去一年，推理大模型（OpenAI o 系列、DeepSeek R1 等）让所有人见识到了"慢思考"的威力。但这场革命的源头，要从两条看似独立的技术路线说起：一条让模型学会调用工具，另一条让模型学会多路线探索。两条路线最终在 ToT（Tree of Thoughts）架构下合流，并靠剪枝策略解决了最棘手的组合爆炸问题。

文章六月 18, 2026

HBM4E 详解： SK 海力士凭什么抢跑下一代内存

2026年6月18日，SK海力士正式宣布已向主要客户（以英伟达为主）交付12层堆叠 HBM4E 工程样品，这是目前已知业界最先进的 HBM4E 产品之一。从 JEDEC 发布 HBM4 标准规范（2025年4月）到工程样品落地，只用了一年出头，节奏远超预期。本文深入解析 HBM 家族的技术演进路径、HBM4E 的核心突破点，以及当前 SK 海力士、三星、美光三家的竞争态势。

文章六月 17, 2026

Hacker News 热门话题 2026-06-17

本周 Hacker News 热门话题涵盖了 AI 编程工具、太空科技、工程文化、消费电子以及 Web 安全等多个领域，以下是本期精选内容。

文章六月 13, 2026

Hacker News 热门话题 2026-06-13

本周 Hacker News 热门话题涵盖 AI 政策管制、生物医疗技术、开源生态以及人机协作等多个维度，以下是本期精选内容。

文章五月 17, 2026

OpenClaw 多 Agent 协作：独立 Agent 与临时子 Agent 的区别

OpenClaw 是一个强大的 AI 助手框架，其核心设计思想之一就是多 Agent 协作。很多人对 “Agent”、“Session”、“Sub-agent” 这些概念感到困惑，今天我们就用图解的方式彻底搞清楚。

文章五月 11, 2026

深度拆解：AI Agent Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理，以及那些将"无状态"的大语言模型（LLM）转变为全能智能体（Agent）的底层机制。

你可能已经开发过聊天机器人，甚至可能用一些工具搭建了一个 ReAct 循环（ReAct：Reason + Act，一种让模型在行动前先进行推理的模式）。跑 Demo 的时候看着挺好，但一旦投入生产环境，系统就会开始掉链子：模型会忘记三步前做了什么，工具调用悄悄报错，上下文窗口（Context Window）里塞满了毫无意义的垃圾信息。

问题其实并不在模型本身，而在模型外围的基础设施。

文章五月 6, 2026

Hermes Agent 如何实现自进化：一个内置学习闭环的 AI 智能体

在 AI Agent 领域，“自进化”（self-evolution）这个词已经被用滥了。大多数 Agent 框架所谓的"学习"不过是把对话历史塞进上下文窗口，或者用 RAG 检索一下相关文档。真正的自进化，是让 Agent 在不重新训练模型的前提下，从每次交互中沉淀出可复用的知识，并在未来的任务中自动调用它。

Nous Research 在 2026 年开源的 Hermes Agent 是目前少数把这个目标工程化得最系统的开源项目。它没有改模型权重，没有重新做 RLHF，而是用一套纯文本 + 外部状态的机制，把"成长"这件事拆解成四个可观测、可验证、可回滚的子系统。

文章四月 22, 2026

OpenClaw Dreaming：让AI在睡眠中整理记忆

就像人类会做梦来巩固白天的经历一样，OpenClaw也有自己的"睡眠周期"。

如果你在用 OpenClaw 作为私人AI助手，日复一日的对话会产生大量的短期记忆碎片——哪些任务完成了、用户纠正了哪些错误、下次要注意什么。这些信号如果不做任何处理，要么被遗忘，要么塞进 system prompt 里导致上下文膨胀。

Dreaming 就是来解决这个问题的。

文章四月 11, 2026

一个基于 TradingAgents 框架打造的股票分析 Skill

TradingAgents-CN-Skill 是基于 TradingAgents 框架的中文股票分析 Skill。用户输入股票截图、文字描述或股票代码，Agent 自动完成 4 位分析师 + 2 轮多空辩论 + 风控三方辩论 + 五级评级，输出完整 PDF 报告。

文章四月 7, 2026

CUDA 并行计算原理解析：GPU 加速的本质

2006 年，NVIDIA 推出了 CUDA（Compute Unified Device Architecture）——一套针对自家 GPU 的并行计算平台和编程模型。在此之前，GPU 的职责单一，仅限于图形渲染；CUDA 的出现，使得开发者可以用熟悉的 C/C++ 语言直接调用 GPU 的算力。

大语言模型训练、深度学习推理、科学计算——这些涉及 TB 级数据处理的任务，底层几乎都运行在 CUDA 之上。本文以中立视角，剖析 CUDA 的核心设计，并透过一个实战例子展示其并行计算模型。

文章四月 5, 2026

MaaS 详解：大模型时代最重要的那个 aaS

2026年，AI 应用开发已经变得像调用 API 一样简单。MaaS（Model as a Service，模型即服务） 正在成为继 IaaS、PaaS、SaaS 之后，云计算世界里最具变革性的那个"aaS"。

文章四月 3, 2026

一图看懂 Transformer 架构原理

Transformer 是当今大语言模型（GPT、BERT、T5 等）的基础架构，由 Google 在 2017 年论文 “Attention Is All You Need” 中提出。它彻底抛弃了 RNN 的递归结构，仅依靠注意力机制实现序列建模，在效果和效率上都带来了革命性突破。

本文通过一张架构图 + 核心公式 + 基础概念解释，帮你快速建立对 Transformer 的整体理解。

文章三月 31, 2026

OpenClaw 内置引擎 + 硅基流动免费模型开启向量搜索

上一篇《OpenClaw 的 QMD 记忆引擎：从尝鲜到放弃》里，我因为 2 核 4G 服务器跑不动 QMD 的 3 个本地 LLM 模型，切回了内置引擎。当时以为内置引擎只有关键词搜索——其实不是。

文章三月 30, 2026

OpenClaw 的 QMD 记忆引擎：从尝鲜到放弃

OpenClaw 有一套内置的 Memory 系统，基于 SQLite 实现，开箱即用。但对于需要更高搜索质量、更广索引范围的场景，OpenClaw 提供了一个更强大的选项——QMD Memory Engine。

本文梳理 QMD 的核心概念、架构原理、配置方法，以及它在 OpenClaw 记忆体系中的实际角色，最后与 OpenViking 方案做对比。

文章三月 27, 2026

微单的进化方向：从光学记录到智能影像终端

随着半导体技术和计算科学的爆发，微单（无反相机）正站在一个历史性的拐点。它不再满足于"更好的画质"这一单一维度，而是从"纯光学/电子记录工具"向"智能影像计算终端"全面进化。

这场变革的核心驱动力是速度、算力与全场景融合。以下是我对微单未来进化方向的系统性梳理。

文章三月 27, 2026

Harness Engineering 入门：让 AI Coding Agent 稳定工作的工程实践

最近在研究 AI Coding Agent 的工程化实践，绕不开两个概念：Harness Engineering 和 OpenSpec。两者都跟 AI 写代码有关，但解决的问题完全不同。写篇文章梳理一下。

文章三月 26, 2026

OpenViking × OpenClaw：给 AI Agent 装上长期记忆

最近给 OpenClaw 装上了 OpenViking——字节跳动火山引擎开源的 AI Agent 上下文数据库。装的过程很顺，但有一个隐藏代价直到我翻官方文档才意识到，本文把这个关键点讲清楚。

文章三月 15, 2026

Superpowers + OpenSpec：AI 编程黄金搭档工作流

AI 编程工具层出不穷，但真正的问题不是"AI 能不能写代码"，而是"如何让 AI 按照软件工程的标准流程开发"。2026 年，两个开源项目——Superpowers 和 OpenSpec——形成了一套被业内称为"黄金搭档"的开发范式。

文章三月 9, 2026

一文读懂 AG-UI 协议：AI Agent 与前端交互的新标准

在 AI Agent 应用开发中，如何让前端与后端 Agent 高效通信一直是个难题。AG-UI 协议的出现就是为了解决这个核心问题。本文将详细介绍 AG-UI 是什么、为什么这样设计，以及它与以往流式输出的区别。

什么是 AG-UI ？

AG-UI（Agent User Interaction Protocol）是一个开放、轻量级、基于事件的标准协议，用于规范 AI Agent 与前端应用之间的通信方式。

它由 CopilotKit 提出，来源于 LangGraph、CrewAI 等项目的生产实践经验，旨在解决 Agent 特有的交互模式问题。

文章三月 7, 2026

AI对劳动力市场的影响——Anthropic最新研究解读

最近Anthropic发布了一份关于AI对劳动力市场影响的研究报告，提出了一些挺有意思的发现。

核心结论

研究的核心发现很反直觉：

AI的实际应用远低于理论潜力 — 理论可行 vs 实际使用，存在巨大差距
高学历白领反而更"危险" — 受AI影响最大的是程序员、客服等
目前失业率没有明显变化 — 但对年轻工人的招聘已放缓

文章三月 5, 2026

RAG 召回率优化的主路线：Hybrid + Rerank + 强 Embedding 三件套

2023 年做 RAG，大家讨论的还是"Embedding 模型选哪个"、“要不要上 ColBERT”。2024 年话题变成了"Hybrid Search 到底怎么打分融合"。到了 2026 年，画风基本定了——

生产环境的 RAG 召回优化有三件套：强 Embedding 模型 + Hybrid Search + Rerank 精排。Query 改写、HyDE 这些"技巧"不是没用，而是从"主菜"降级成了"配菜"。

上一篇文章讲了 HyDE 这种"答案侧"技巧，今天这篇文章讲 2026 年的"主路线"。

文章三月 4, 2026

AI Coding 能力评估：三个维度看清开发者的 AI 协作水平

对 AI 说"帮我写个用户注册功能"，它给出了一套完整的注册、登录、验证码、邮箱验证、数据库迁移脚本——然后你发现，你其实只想要一个接口。

同样是使用 AI Coding，不同开发者之间的表现差异巨大。有人能让 AI 在几分钟内完成一天的工作量，有人却总是在 AI 的错误方向上浪费半天。

本质差异不在于 AI 工具，而在于使用者的能力。 本文从三个维度评估：需求分析与拆解、编程基础与工程实践、AI 协作与交互。

文章三月 3, 2026

RAG 召回率提升的另一条路：HyDE 让问题先伪装成答案

跑过 RAG 的同学大概都踩过这个坑：用户问"我的订单怎么取消？"，向量库里明明有那段"如需取消订单，请前往’我的订单’页面……"，但召回就是捞不回来。

问题出在哪？问题和答案在向量空间里隔得很远——“取消"虽然两边都有，但问句的语气、词汇结构、隐含的主语省略，都让它和那段陈述句形态的答案距离不近。BM25 兜不住（关键词只有两个字），向量检索也兜不住（语义结构差太大），怎么解？

HyDE（Hypothetical Document Embeddings） 就是专门处理这道题的。

文章三月 2, 2026

深度解析 OpenViking —— 字节跳动开源的 AI 上下文数据库

在 LLM（大语言模型）应用开发中，如何处理海量的、碎片化的上下文数据是开发者面临的最大挑战。字节跳动火山引擎团队开源了 OpenViking，这是一个专门为 AI Agent 和 RAG 场景设计的上下文数据库。它不仅继承了字节内部支撑抖音、豆包等产品的自研向量检索技术，更针对 AI 原生应用的需求进行了深度优化。

文章三月 2, 2026

企业知识库问答 RAG：腾讯云原子引擎实战

把 RAG 链路拆开看，每一步（解析、拆分、Embedding、检索、重排）都有可以替换的实现。腾讯云知识引擎原子能力做的事情，本质上是把这些环节单独抽成高质量的 API，让开发者按需组合。

这篇文章不是入门教程，而是面向已经理解 RAG 全流程的 AI 应用开发者，重点聊在企业知识库问答场景下，怎么用这套原子能力，以及几个真实的取舍。

文章三月 2, 2026

从代码到知识：Graph RAG 如何打通「知识孤岛」

你是否有过这样的困惑？

明明记得某个知识点在某篇文章里，可当你需要它的时候，搜索引擎只能给你一堆关键词匹配的碎片。传统RAG（检索增强生成）就像一个"记性不好"的助手——你问什么，它从海量文档中找最相似的段落，但它不懂知识之间的关系。

而这恰恰是Graph RAG要解决的问题。

⚠️ 特别说明：本文是对 Graph RAG 概念的解读，源自对 AST-ASG-Graph-RAG 项目 README 的研究。该项目主要在探讨概念本身，而非一个完整的产品解决方案。

文章三月 2, 2026

2026年3月AI资讯（3月2日）：DeepSeek V4将发布

2026年3月AI大模型资讯汇总。

一、主流大模型动态

1. DeepSeek V4即将发布

DeepSeek V4将于下周发布，将原生支持音视频图文生成，兼容国产算力
内部测试显示代码生成能力已超越Claude和GPT系列
重点突破：超长代码提示词解析能力，可一次性理解庞大代码库上下文
来源：金融时报/CSDN，2026年2月28日-3月1日