Ordiy's Blog

2026 AI 编码工具实战：从 ClaudeCode 到 OpenCode 的极致整合

2026 AI 编码工具实战：从 ClaudeCode 到 OpenCode 的极致整合在 AI 驱动开发的 2026 年，工具的选择已经不再仅仅是看模型，而是看“工具链的整合能力”和“部署灵活性”。一、生产力梯队：谁是真正的王者？根据长期的实测，我将目前主流的 AI 开发工具分为三个梯队： Top 1：ClaudeCode CLI 原因：Claude 3.5/4 系列模型的...
2026-04-16
AI Engineering
LLM

| Productivity

| Coding Agents
Read more2026 AI 编码工具实战：从 ClaudeCode 到 OpenCode 的极致整合
当 AI Agent自动化后，工程师的工作在往哪走？

当 AI Agent自动化后，工程师的工作在往哪走？我们用同一个模型（gemma-4-31b-it）驱动了两套 AI 编码工具，让它们从零构建一个完整的 Streamlit 股票分析应用。测试结束后，我得出了一个让自己意外的结论——真正决定生产力的，不是模型，是 harness。一、一次意外的实验几天前，我做了一个对比实验：用相同的模型（Google Gemma-4-31B），分别驱...
2026-04-16
AI Engineering
Harness Engineering

| AI Agents

| Coding Agents
Read more当 AI Agent自动化后，工程师的工作在往哪走？
Harness Engineering 在大数据管道的落地实践：从凌晨3点的报警说起

数据少了17万条，问题在哪个节点？本文将 Harness Engineering 的前馈/反馈控制体系映射到 S3/SQS → Kafka → Flink → ClickHouse 管道的每个节点，给出具体的工程设计要点。
2026-04-12
tech
Flink

| ClickHouse

| Kafka
Read moreHarness Engineering 在大数据管道的落地实践：从凌晨3点的报警说起
具身智能（Embodied AI）：技术路线、硬件底座与落地范式全解析

具身智能（Embodied AI）：技术路线、硬件底座与落地范式全解析一、具身智能：当 AI 拥有了“身体”具身智能（Embodied AI）是人工智能的终极形态之一。它不再仅仅是屏幕后的对话框，而是能够感知物理世界、理解复杂指令并执行精细动作的智能系统。核心基石：从“说”到“做”的跨越在这一领域，两篇里程碑式的研究定义了当下的技术边界： PaLM-SayCan (Google Rob...
2026-04-07
技术解析
AI

| 具身智能

| 机器人
Read more具身智能（Embodied AI）：技术路线、硬件底座与落地范式全解析
Auto Research Agent 架构解析与落地思路：从 Gemini Deep Research 到 GPT Researcher

Auto Research Agent 架构解析与落地思路在 AI Agent 领域，"Deep Research"（深度调研）正成为继代码编写、自动化操作之后的第三个爆发点。无论是 Google 近期推出的 Gemini Deep Research API，还是开源界的 GPT Researcher、STORM，其核心目标都是将原本需要人类耗费数小时甚至数天的调研工作，...
2026-04-03
Engineering
Architecture

| Gemini

| Agent
Read moreAuto Research Agent 架构解析与落地思路：从 Gemini Deep Research 到 GPT Researcher
Harness Engineering: 从理念到行动的调研报告

Harness Engineering: 从理念到行动的调研报告1. 核心理念：什么是 Harness Engineering？Harness Engineering（挂载/整装工程）是一种将 AI Agent（尤其是编码 Agent）从“黑盒生成器”转变为“可靠生产力工具”的工程实践。其核心公式为：Agent = Model + Harness。 Model (模...
2026-04-03
Research
AI

| Agent

| Engineering
Read moreHarness Engineering: 从理念到行动的调研报告
从 ArXiv 2503.07891 看 Gemini Embedding 2：RAG 的泛化革命

摘要Google 发布的论文 Gemini Embedding: Generalizable Embeddings from Gemini 揭示了 Gemini Embedding 2 为何能在 MMTEB 榜单上傲视群雄。其核心不在于模型规模，而在于“原生初始化”与“模型汤”技术的完美结合。核心洞察：不仅仅是多模态论文显示，Gemini Embedding 2 在 Classificat...
2026-03-23
技术前沿
AI

| RAG

| Gemini
Read more从 ArXiv 2503.07891 看 Gemini Embedding 2：RAG 的泛化革命
从关键词到上下文：RAG 时代的检索范式转移与预处理重塑

在构建生产级 AI Agent 或 RAG（检索增强生成）系统时，许多从传统数据开发转型的工程师会面临两个核心疑问：既然 Elasticsearch（BM25）已经足够快，为什么还需要向量数据库？ 以及，为什么我们不再像以前在 PyTorch 中处理 NLP 任务那样，进行繁琐的“去停用词”和“词干还原”？

本文将深度拆解这两大争议点，揭示 RAG 架构背后的底层逻辑变革，并分享一套完整的评估闭环。
2026-03-23
AI_ML
AI

| RAG

| NLP
Read more从关键词到上下文：RAG 时代的检索范式转移与预处理重塑
AI Agent 与 MCP 架构选型白皮书：Python、n8n 与 LangGraph 的深度博弈

在 AI 代理（Agent）与模型上下文协议（MCP）飞速发展的今天，如何选择合适的实现架构已成为决定项目上限的关键。本文基于 Watadot Studio 的最新项目 enso-climate-agent-mcp-comparison，深度拆解三种主流架构的实战经验与决策逻辑。
2026-03-19
AI_ML
Architecture

| AI Agent

| MCP
Read moreAI Agent 与 MCP 架构选型白皮书：Python、n8n 与 LangGraph 的深度博弈
CursorBench 2026 选型真相：为什么 Claude 跌出了第一梯队？

根据最新的 CursorBench 数据图表，模型选型的逻辑发生了剧变。曾经的王者 Claude (Sonnet/Opus) 在效能边界线上已经全面落后于 GPT-5.4 家族。本文将深度解析这份图表背后的“残酷真相”。
2026-03-19
AI_ML
Model Selection

| Cursor

| GPT-5
Read moreCursorBench 2026 选型真相：为什么 Claude 跌出了第一梯队？

12 3…14