龚桂兵 · 10 年 AI 产品专家 · LLM / Agent · Agent 运营评测 · B 端 AI 中后台
从语音、视觉到大模型与 Agent,我经历了 AI 技术栈的每一轮迭代。擅长把模糊的业务需求转化为可落地的算法与工程方案,多次从 0 到 1 构建 AI 平台,并在 Agent 运营评测与业务中后台场景中推动能力落地、效率提升与质量闭环。
机械设计制造及其自动化 · 学士 · 全日制统招
负责 Agent 运营评测及相关业务中后台建设,围绕 Agent 效果评估、运营分析、任务与流程管理、业务支撑工具,推动 Agent 从能力验证走向规模化运营落地。
主导构建客服大模型离线评测体系,从 0 到 1 实现模型上线前的自动化风险拦截;通过 AI Coding 搭建运营分析与熔断看板,推动数据分析产品化;主导 20+ 版模型微调与熔断 Agent 正则调优。
从 0 到 1 设计「数据-算法-工程」一体化的虚拟人训练中台;构建 19.5 万+ 2D 形象与 20.3 万+ TTS 声音数据集形成数据飞轮;设计图像融合边缘抑绿、Mask 视频质检等算法方案;担任办公问屏智能体首任产品经理。
设计覆盖数据管理、标注、算法管理、模型训练、服务部署的全链路机器学习平台,构建「数据→训练→部署→反馈」闭环,并在头部金融机构验证平台可复制能力。
统筹阅卷大师 Android / Windows 客户端、极课云印、网阅留痕与智能硬件管理后台,构建「采集-识别-批改-分析」闭环;建立算法效果反馈闭环,客户端异常数据反哺模型训练。
智能视觉收银系统:日订单纠错率 30%+ → 10% 以下,订单处理时长 15 秒 → 8 秒。
AI 安防监控平台、酒店人脸识别机。
智能语音转写系统、语音交互、机器人唤醒词定制:售前支持客户 40+ 家,落地项目 10+ 家。
洞察 2D 数字人定制「人工依赖强、自动化程度低」的行业共性痛点,从 0 到 1 独立设计业务架构、产品架构与底层数据结构(E-R 图),构建 9 个数据处理、6 个数据增强、5 个数据质检、3 个数据生成工具,建成业内唯一全流程自动化、稳定对外服务的 2D 数字人生产基础设施。
通过 AI-OCR + 多标签分类技术,构建「外规-标签-内规」法规数据库,实现内外规快速检索与对比,帮助银行实现监管合规的自动化风险预警与内规快速响应。
面向真实用户场景的多模态 Agent 产品探索。
面向办公场景的多模态问屏 Agent,连接屏幕理解、知识问答与办公效率工具,负责从产品定义、交互流程到落地验证的首版设计。
从产品定位、信息架构到线上落地的个人 Agent 工作台实践。
企业 IM 原生的本地 Agent 工作台,让 Agent 像联系人一样进入飞书等会话,围绕本机文件、项目目录、多轮上下文和任务状态推进真实工作流。
在美团负责客服大模型评测体系与 Agent 调优,从 0 到 1 实现模型上线前的自动化风险拦截;2026 年 4 月起在阿里巴巴负责 Agent 运营评测及相关业务中后台。
在小冰从 0 到 1 构建虚拟人超级工厂——业内唯一全流程自动化的 2D 数字人定制基础设施,支撑亿级营收。
在毕马威设计 AIFactory 全链路机器学习平台,于工商银行、兴业银行总行落地,孵化 400 万+ 营收的监管科技标杆项目。
在极课大数据(被字节收购)负责智能阅卷软件矩阵,主导 AI-OCR 算法产品化,搜索效率提升 5 倍,辅助硬件量产上市。
人脸识别与 AI 安防监控平台,进入计算机视觉的工程化深水区。
从语音转写与交互产品入行,售前支持 40+ 客户、落地 10+ 项目,理解了 AI 产品「算法效果即体验」的第一性。
复盘 Codex Windows App 本地发热问题:从云端推理误判切回本地进程、插件重启与沙箱测试,定位反直觉负载来源。
阅读原文 →复盘新电脑搭建 AI Coding 环境时的系统级排查:从代理、DNS、Electron 沙箱一路定位到 Windows 时间服务异常。
阅读原文 →面向产品和技术读者的 DeepSeek 算法解读,拆解模型能力、技术路径与产品应用之间的关系。
阅读原文 →早期产品观察文章,从支付宝改版与集五福活动切入,分析支付工具、社交关系和商业场景之间的产品战略差异。
阅读原文 →