AI Agent 技术专家 / 大模型应用架构

构建可落地的
AI Agent 系统

8年大厂研发经验 (腾讯/华为),深耕 AI Agent 工程化、研效基建与多模态模型工程。致力于连接大模型能力与真实业务场景,打造从架构到全端的高质量工程闭环。

# System Initialization

~ alvin --profile

Loaded: AI Full-Stack Engineer

Exp: 8+ Years

# Bootstrapping Agents

~ systemctl start multi-agent-workflow

[OK] Tool Calling sandbox active

[OK] RAG engine connected

~

核心优势

全栈视角下的 AI 工程化能力,覆盖模型评估、流程编排与端侧交互。

Agent 架构

主导设计 Multi-Agent Workflow,熟练掌握 RAG 检索增强、复杂工具调用与 MCP / Skills 协议落地。

评测闭环

建设 LLM as Judge 评测体系,打通 Case 回放与失败回流机制,驱动模型效果的持续迭代。

模型工程

具备多模态内容审核经验,包含数据处理、SFT/GRPO 训练参与、推理优化与端到端部署接入。

全栈交付

具备 Python/Go/Java 后端及 React/Electron/Android 前端深度经验,支撑复杂系统的敏捷落地。

代表项目

推动前沿技术在真实业务工作流中的大规模应用。

Agent Platform

智能研效平台

Multi-Agent Workflow编排 RAG
  • 设计并落地面向研发问题分析场景的 Multi-Agent Workflow,覆盖问题理解、上下文检索、工具调用、代码/日志分析与结果汇总。
  • 负责核心 Agent 编排、RAG 检索增强及工具权限控制,有效缓解复杂代码库场景下的大模型幻觉及工具调用不可控问题。
  • 沉淀通用 Agent 流程与分析模板,支撑 1000+ 团队在线上问题排查、代码理解等场景深度使用。
LLM Eval

通用模型评测闭环

LLM as Judge 数据飞轮
  • 从 0 到 1 建设模型与 Agent 评测闭环,解决模型能力难量化、Prompt 迭代重度依赖人工经验的痛点。
  • 设计评测集管理、自动化打分、人工复核与结果追踪机制,大幅降低大模型和 Prompt 调优的试错成本。
  • 沉淀自进化飞轮系统,为模型选型、系统上线前验证提供核心量化依据。
Toolchain

全端 AI 提效工具链

Electron IDE Plugin MCP
  • 参与构建覆盖开发者工作流的全场景 AI 助手,涵盖 JetBrains IDE 插件、桌面端及自研 AI 开发平台等形态。
  • 在工具链中集成 Agent 范式,围绕工具执行确认、失败重试、沙箱安全与自纠错逻辑进行工程级设计。
  • 打通端云协同与本地交互链路,优化代码智能补全、自动排障体验。

工作经历

跨领域积累,从底层系统重构到 AI 原生应用创新。

2022.01 - 至今

腾讯科技(深圳)

AI 全栈研发 / 客户端开发

  • AI 原生阶段: 聚焦 AI 研效基建与 Agent 工程化。主导问题分析 Agent、评测闭环系统与全端 AI 工具链研发,推进多模态审核大模型工程化落地。
  • 复杂业务阶段: 曾负责 QQ 频道 Android 端及音视频创新业务跨端 (Flutter) 架构,独立完成高性能视频发布器底层链路研发。
2017.07 - 2021.12

华为技术有限公司

软件开发工程师

  • 参与网络控制器系统后端研发及微服务 OSGI 架构解耦重构,提升大规模分布式系统稳定性。
  • 负责华为相机 APP 核心业务及折叠屏底层适配,处理 Camera2 / MediaCodec 及 NDK 算法深度集成。

技术全景图 (Tech Landscape)

涵盖大模型应用研发、后端架构与多端前端开发能力。

Multi-Agent Workflow RAG & Vector DB MCP / Skills LLM as Judge SFT / GRPO Python Golang Java React & Frontend Electron Flutter Android / NDK