共 3 篇文章
三月 2, 2026
2026年3月AI资讯(3月2日):DeepSeek V4将发布
2026年3月AI大模型资讯汇总。
一、主流大模型动态
1. DeepSeek V4即将发布
- DeepSeek V4将于下周发布,将原生支持音视频图文生成,兼容国产算力
- 内部测试显示代码生成能力已超越Claude和GPT系列
- 重点突破:超长代码提示词解析能力,可一次性理解庞大代码库上下文
- 来源:金融时报/CSDN,2026年2月28日-3月1日
三月 1, 2026
2026年2月AI资讯(2月28日):中国AI调用量首超美国
据36氪/每日经济新闻3月1日报道,全球最大AI模型API聚合平台OpenRouter数据显示:
- 2026年2月9日-15日当周,中国模型以4.12万亿Token调用量,首次超越美国模型的2.94万亿Token
- 2月16日-22日当周,中国模型调用量进一步冲高至5.16万亿Token,三周暴涨127%
- 全球调用量排名前五的模型中,中国模型占据四席:MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5、DeepSeek V3.2,合计贡献Top5总调用量的85.7%
十二月 30, 2025
深入理解 RAG 核心技术:Embedding、向量检索与 Rerank
什么是 RAG?
RAG(Retrieval-Augmented Generation,检索增强生成)是大模型应用的核心架构。它通过"检索+生成"的两阶段模式,让 AI 能够利用私有知识库回答问题,而不是仅依赖模型内部的训练数据。