AI Agent 技术专家 / 大模型应用架构
构建可落地的
AI Agent 系统
8年大厂研发经验 (腾讯/华为),深耕 AI Agent 工程化、研效基建与多模态模型工程。致力于连接大模型能力与真实业务场景,打造从架构到全端的高质量工程闭环。
# System Initialization
~ alvin --profile
✔ Loaded: AI Full-Stack Engineer
✔ Exp: 8+ Years
# Bootstrapping Agents
~ systemctl start multi-agent-workflow
✔ [OK] Tool Calling sandbox active
✔ [OK] RAG engine connected
~
核心优势
全栈视角下的 AI 工程化能力,覆盖模型评估、流程编排与端侧交互。
Agent 架构
主导设计 Multi-Agent Workflow,熟练掌握 RAG 检索增强、复杂工具调用与 MCP / Skills 协议落地。
评测闭环
建设 LLM as Judge 评测体系,打通 Case 回放与失败回流机制,驱动模型效果的持续迭代。
模型工程
具备多模态内容审核经验,包含数据处理、SFT/GRPO 训练参与、推理优化与端到端部署接入。
全栈交付
具备 Python/Go/Java 后端及 React/Electron/Android 前端深度经验,支撑复杂系统的敏捷落地。
代表项目
推动前沿技术在真实业务工作流中的大规模应用。
- 设计并落地面向研发问题分析场景的 Multi-Agent Workflow,覆盖问题理解、上下文检索、工具调用、代码/日志分析与结果汇总。
- 负责核心 Agent 编排、RAG 检索增强及工具权限控制,有效缓解复杂代码库场景下的大模型幻觉及工具调用不可控问题。
- 沉淀通用 Agent 流程与分析模板,支撑 1000+ 团队在线上问题排查、代码理解等场景深度使用。
- 从 0 到 1 建设模型与 Agent 评测闭环,解决模型能力难量化、Prompt 迭代重度依赖人工经验的痛点。
- 设计评测集管理、自动化打分、人工复核与结果追踪机制,大幅降低大模型和 Prompt 调优的试错成本。
- 沉淀自进化飞轮系统,为模型选型、系统上线前验证提供核心量化依据。
- 参与构建覆盖开发者工作流的全场景 AI 助手,涵盖 JetBrains IDE 插件、桌面端及自研 AI 开发平台等形态。
- 在工具链中集成 Agent 范式,围绕工具执行确认、失败重试、沙箱安全与自纠错逻辑进行工程级设计。
- 打通端云协同与本地交互链路,优化代码智能补全、自动排障体验。
工作经历
跨领域积累,从底层系统重构到 AI 原生应用创新。
- AI 原生阶段: 聚焦 AI 研效基建与 Agent 工程化。主导问题分析 Agent、评测闭环系统与全端 AI 工具链研发,推进多模态审核大模型工程化落地。
- 复杂业务阶段: 曾负责 QQ 频道 Android 端及音视频创新业务跨端 (Flutter) 架构,独立完成高性能视频发布器底层链路研发。
- 参与网络控制器系统后端研发及微服务 OSGI 架构解耦重构,提升大规模分布式系统稳定性。
- 负责华为相机 APP 核心业务及折叠屏底层适配,处理 Camera2 / MediaCodec 及 NDK 算法深度集成。
技术全景图 (Tech Landscape)
涵盖大模型应用研发、后端架构与多端前端开发能力。
Multi-Agent Workflow
RAG & Vector DB
MCP / Skills
LLM as Judge
SFT / GRPO
Python
Golang
Java
React & Frontend
Electron
Flutter
Android / NDK