-
从 ArXiv 2503.07891 看 Gemini Embedding 2:RAG 的泛化革命
摘要Google 发布的论文 Gemini Embedding: Generalizable Embeddings from Gemini 揭示了 Gemini Embedding 2 为何能在 MMTEB 榜单上傲视群雄。其核心不在于模型规模,而在于“原生初始化”与“模型汤”技术的完美结合。 核心洞察:不仅仅是多模态论文显示,Gemini Embedding 2 在 Classificat... -
从关键词到上下文:RAG 时代的检索范式转移与预处理重塑
在构建生产级 AI Agent 或 RAG(检索增强生成)系统时,许多从传统数据开发转型的工程师会面临两个核心疑问:既然 Elasticsearch(BM25)已经足够快,为什么还需要向量数据库? 以及,为什么我们不再像以前在 PyTorch 中处理 NLP 任务那样,进行繁琐的“去停用词”和“词干还原”?
本文将深度拆解这两大争议点,揭示 RAG 架构背后的底层逻辑变革,并分享一套完整的评估闭环。
-
AI Agent 与 MCP 架构选型白皮书:Python、n8n 与 LangGraph 的深度博弈
在 AI 代理(Agent)与模型上下文协议(MCP)飞速发展的今天,如何选择合适的实现架构已成为决定项目上限的关键。本文基于 Watadot Studio 的最新项目 enso-climate-agent-mcp-comparison,深度拆解三种主流架构的实战经验与决策逻辑。
-
CursorBench 2026 选型真相:为什么 Claude 跌出了第一梯队?
根据最新的 CursorBench 数据图表,模型选型的逻辑发生了剧变。曾经的王者 Claude (Sonnet/Opus) 在效能边界线上已经全面落后于 GPT-5.4 家族。本文将深度解析这份图表背后的“残酷真相”。
-
GitHub CLI (gh) 深度实战:脱离浏览器的开发者生存指南
GitHub CLI (
gh) 不仅仅是一个命令行工具,它是现代 Harness Engineering 的核心挂载点。通过gh,我们可以将代码托管、协作评审和 CI/CD 监控完全集成进我们的自动化脚本和 AI Agent 流水线中。本文总结了
gh从基础到端到端复杂场景的核心技能。 -
Harness Engineering:Agent-First 时代的架构革命(OpenAI 实践总结)
OpenAI 团队在 5 个月内实现了一个百万行代码的产品,且保持了 “0 行人工代码” 的约束。这种极端实验催生了 Harness Engineering(挂载工程/马具工程)。
本文深度解析 Harness Engineering 的核心理念及我们在 Watadot Studio 中的实战应用。
-
AI 辅助下的认知鸿沟:如何对抗技能退化?(arXiv:2601.20245 研究笔记)
随着 AI 助手(如 Cursor, Claude, ChatGPT)在开发流程中的普及,一个核心矛盾浮出水面:AI 极大地提升了生产力,但同时也可能正在“偷走”人类的学习能力。
本文总结了来自 Anthropic 研究员的最新论文 "How AI Impacts Skill Formation" (arXiv:2601.20245),并探讨我们作为开发者该如何对抗这种“技能退化”。
-
OpenClaw + Google Vertex AI 配置与排查指南
OpenClaw + Google Vertex AI 配置与排查指南 适用版本:OpenClaw 2026.3.2+日期:2026-03-11作者:根据实际排查过程整理 背景本文记录了为 OpenClaw 启用 Google Vertex AI 的完整配置过程,以及排查过程中遇到的若干坑点,包括: 如何用**服务账号(Service Account)**做认证(无需安装 gcloud... -
深度解析:OpenClaw 开发者选型指南 —— Grok 4.1 时代的工程实践
深度解析:OpenClaw 开发者选型指南 —— Grok 4.1 时代的工程实践在构建 OpenClaw Agent 时,我们不仅是在寻找一个能说话的 AI,而是在寻找一个可靠的系统控制器。理想的 Agent 模型需要具备三要素:廉价的“长短期记忆”(上下文)、严密的“逻辑链条”(推理)、以及稳健的“执行接口”(工具调用)。 随着 grok-4-1-fast-reasoning 的发布,选... -
GitHub Copilot CLI vs VS Code Copilot Plugin 使用心得
用了一段时间 GitHub Copilot 的两种形态——VS Code Plugin 和 Copilot CLI——发现它们并不是同一个工具的两个入口,而是面向完全不同使用场景的两个产品。本文记录实际使用中的核心差异、各自优势,以及如何在 SDLC 各阶段合理搭配使用。