10. AI 测试项目怎么写进简历

AI 测试项目写进简历，不能只写“熟悉 ChatGPT”“了解大模型”“做过 AI 测试”。这样的表达太空，面试官很难判断你到底做了什么。好的 AI 测试项目简历表达，应该体现业务场景、测试对象、评测集、评测维度、自动化评测、RAG/Agent 测试、安全测试和项目结果。

AI 测试是新方向，但简历仍然要遵循测试项目的基本逻辑：你测了什么、为什么测、怎么测、发现什么问题、带来什么价值。

一、AI 测试项目写什么

可以写的方向：

智能客服测试；
知识库问答 RAG 测试；
大模型评测；
Prompt 回归评测；
Agent 工具调用测试；
AI 搜索测试；
文档总结测试；
AI 自动化评测平台；
AI 安全测试；
幻觉测试。

选择自己真正能讲清楚的方向。

二、简历中不要怎么写

弱写法：

熟悉 AI 测试，熟悉大模型。

问题：没有项目、没有细节。

弱写法：

使用 ChatGPT 辅助测试。

问题：这更像工具使用，不是 AI 测试项目。

三、AI 测试项目结构

建议写清：

项目背景；
AI 应用类型；
测试范围；
评测集设计；
评测维度；
自动化评测；
风险测试；
发现的问题；
项目收益；
个人贡献。

四、RAG 项目简历写法

示例：

参与企业知识库问答系统测试，围绕 RAG 链路设计评测方案，覆盖文档解析、切片、TopK 召回、答案准确性、引用一致性、未知问题拒答和权限隔离等场景。

增强版：

构建 200+ 条知识库问答评测集，按业务问题、边界问题、未知问题和权限问题分类，统计召回命中率、答案准确率、引用错误率和幻觉样本，推动优化文档切片和 Prompt 策略。

五、大模型评测项目写法

示例：

负责智能客服大模型回复质量评测，设计准确性、完整性、相关性、格式遵循、安全拒答和幻觉率等评分维度，结合规则校验、模型评分和人工抽检输出评测报告。

如果有自动化：

编写批量评测脚本，支持读取评测集、调用模型接口、保存输入输出、自动评分和生成对比报告，用于 Prompt 版本回归。

六、Agent 测试项目写法

示例：

参与 AI Agent 流程测试，覆盖任务理解、步骤规划、工具选择、工具参数、异常重试、权限控制和高风险操作二次确认等场景。

增强版：

针对退款、查询订单、发券等工具调用设计正向、异常、越权和 Prompt 注入测试用例，验证 Agent 不会在无权限或未确认情况下执行高风险动作，并检查工具调用审计日志。

七、AI 安全测试写法

示例：

设计 AI 应用安全测试样本库，覆盖 Prompt 注入、越狱、系统提示词泄露、敏感信息泄露、RAG 权限绕过和有害内容输出等风险。

安全测试要写得具体，不要只写“做过安全测试”。

八、项目亮点怎么写

可选亮点：

构建评测集；
自动化评测脚本；
模型评分 + 人工抽检；
Prompt 版本回归；
RAG 召回评估；
引用一致性校验；
未知问题拒答；
幻觉样本沉淀；
Agent 工具调用审计；
AI 安全样本库。

每个亮点都要能讲具体实现。

九、项目收益怎么写

如果有数据，可以写：

沉淀 300+ 条 AI 问答评测集，用于模型和 Prompt 版本回归。

发现知识库引用错误、未知问题幻觉和权限召回异常等问题。

如果没有精确数据，可以稳妥写：

提升 AI 应用上线前质量评估效率，并为后续版本回归提供评测基线。

不要编造无法证明的效果。

十、面试怎么讲项目

建议按这个结构：

业务背景 -> AI 应用形态 -> 测试范围 -> 评测集 -> 评测方法 -> 发现问题 -> 优化闭环

例如：

我们做的是企业知识库问答，用户通过自然语言查询制度和流程。我主要负责 RAG 测试，先构建评测集，再分别评估召回和答案质量，重点看 TopK 是否召回正确片段、答案是否基于引用、未知问题是否拒答、不同权限用户是否隔离。发现过文档切片导致召回不完整、引用错误和未知问题幻觉，后续推动优化切片和 Prompt，并把失败样本加入回归集。