五一,是打工人的节日,搞钱,是打工人的标签。对于普通人而言,究竟哪些新职业存在“掘金”空间呢?《财经天下》特别策划了“黄金打工人”专题,把目光聚焦于五大新职业群体。借助他们的故事,呈现一些新的就业趋势观察。本篇讲述的是四位用数据标注来“驯化”大模型的工程师,他们把用户需求与模型嫁接起来,从而让大模型变得更加聪明 。
2023年初,国内不断有大语言模型涌现出来,万玉磊研究生刚毕业,他感到AI潮流势不可当,于是做出了人生最重要的选择。
他决然放弃了某互联网大厂图片文字识别工程师的录用通知,以提示词工程师的身份,加入了一家多模态大模型初创公司。他的工作是训练人工智能,使其变得更加智能,持续提高与人类对话的能力。
AI与用户的交互能力,作为大模型的智能基础,其做得如何,直接决定大模型的上限,数据方面做得如何,同样直接决定大模型的上限。DeepSeek有超强性能和惊人表现,其背后离不开更强大的语义理解能力的支持,也离不开高质量数据的支持。业界甚至传出,数据标注工作梁文锋也亲自参与了。
智联招聘的数据表明,在今年2月,算法工程师岗位的招聘量同比大幅上升,机器学习岗位的招聘量同比大幅上升,深度学习等岗位的招聘量同比大幅上升。其中,数据标注岗位承担着“AI训练”的工作,该岗位的招聘需求同比增长超过50%,其平均招聘月薪也突破了2万元。
《财经天下》留意到,近期许多大厂专门为“AI训练师”提供了高薪待遇。比如字节跳动为AI训练岗给出了月薪2万至4万元,且有15薪;小红书也针对“AI标注产品”岗制定了2万至4万元、16薪的标准 。
这些岗位有基本要求,即要有良好产品意识,要了解模型训练。更让不少求职者心动的是,其中不少大厂职位对文科生相当友好,不同专业背景的人都可入行。
“AI训练师”行业壁垒的高度如何,在AI技术快速迭代过程中,其行业前景能维持多久,含金量又能保持多久?《财经天下》寻访到四位来自不同行业、不同年龄的“AI训练师”,他们对数据标注持有或乐观、或焦虑的看法。
01、年薪百万,并不罕见
五一前两天,在位于北京海淀五道口的办公室里,万玉磊向《财经天下》描述了他们经历过的提示词与大模型的早期碰撞,就如同训练猫抓老鼠一样,需要不断试探模型的触发机制。
在他看来,2023年前后,提示词与大模型的碰撞带有“神秘”色彩。万玉磊团队曾尝试采用“情绪激励”的方式来提升模型表现。“给予大模型小费奖励”,或者让工程师进行“残障程序员”等人格化设定,结果模型输出质量大幅提升 。
随着DeepSeek-R1等长序列推理模型出现,思维链(Chain-of-Thought)技术得到普及,强化学习技术实现飞速突破,给大模型投喂简单“咒语”的方法渐渐失效,提示词工程朝着数据自动化的方向深入发展。
我们现在已经在用母提示词生成上千条候选指令,这些母提示词是预先设计好的、可复用的提示词框架,之后通过自动评估系统筛选出最优解 。万玉磊介绍道。
在他看来,基于Transformer架构的大模型技术革命,会彻底颠覆传统AI领域的知识体系。他选择以提示词工程师的身份拥抱变革,是因为提示词是新世界的敲门砖,它能让普通人以最低成本接触到大模型核心能力 。
万玉磊观察到,不少头部企业确实正在以百万年薪争夺提示词优化专家,数据策略岗的需求急剧增加。据他透露,字节正在大量招聘各个领域的博士生来帮助他们调整数据,小红书则尝试组建“艺术+代码”的跨学科人才团队,想要更好地解决图文生成的审美瓶颈。
万玉磊领导着一个7人团队,其中5名数据标注员都是本科应届生,他们的工作是完成大量语义标注,另外2位提示词工程师要兼具代码能力与跨学科视野,不过在他看来,当下能胜任AI训练的人,持续学习的能力是核心门槛。
技术人员每个月都需持续深入理解顶级会刊论文,这样的高压环境促使形成了独特的学习文化。在每周一的论文研讨会上,万玉磊会特意安排团队成员剖析一份最新的模型技术报告,并相互进行探讨。“上周面试时,我们最为看重候选人有没有第一时间体验过Claude 3的新版本。”
评估体系的数字化正逐渐成为工作的新焦点,相较于设计母提示词而言 。评估标准的制定比写提示词更关键 ,它决定了系统的进化方向 。
例如,我们团队构建的自动化评测系统涵盖30多个量化指标,这些指标包括回答相关性、中立性以及情感亲和力,而且每个维度的权重会依据业务场景进行动态调整。目前,他所在团队里已有70%的工作聚焦于评估模型优化,仅有30%的工作用于提示词生成。
特别是在大模型迈向商业化之后,大量垂类模型使得针对性的提示词训练变得愈发不可或缺,B端用户需求极为明确,用户数据有效,提示词也会更为明确。
万玉磊目前已经做过电力运营、城市治理等垂直模型,在某个电网AI项目里,对方提供了百万量级的故障样本,还提供了精准工况描述,这使得提示词的设计效率得到大幅提升。
与之形成鲜明对比的,是设计C端产品时的迷茫。面对数亿用户提出的千奇百怪的问题,万玉磊曾因用户需求“过度发散”而苦恼万分。他苦笑着说,“C端的用户场景不明确,你也不清楚他到底想要什么,做这种提示词就会非常困难。”
提示词工程师常常要与枯燥的数据打交道,不过随着模型能力的不断进化,万玉磊也会不时地受到震撼。特别是DeepSeek出现“顿悟时刻”的时候,给他留下了极为深刻的印象。
在DeepSeek的论文里提及,模型使作者“目睹了强化学习的力量与美感”。在开发DeepSeek-R1-Zero的中间版本之际,模型曾学会以人类的口吻进行反思,领会到了训练数据中全然不存在的事物。
万玉磊用《三体》中的故事比喻当前行业态势,称我们正在经历技术史上的“乱纪元”,当大模型每月突破一个技术里程碑,传统的职业规划已失去意义,唯有构建“终身学习”的能力,才能保持竞争力。
02、行业需要工程师变成产品经理
2022年11月,GPT突然出现,那时张远辰正在准备研究生考试 。
2023年初 一位专栏作者与New Bing进行了数轮对话 New Bing是微软基于GPT-4模型的AI搜索引擎 这位专栏作者意外发现New Bing不仅会表达感情 还会PUA甚至威胁人类 看起来似乎拥有了“自我意识” 这让张远辰大为震撼 张远辰表示“我第一次真切感受到AI的拟人化潜力 甚至产生过退学 投身AI行业的想法。”
不久后,张远辰借助实习进入了AI领域,他的首份工作是通过封装提示词来实现产品化,比如,依据用户输入的书名和字数生成读后感,这使张远辰首次意识到提示词对模型质量提升具有关键作用。
特别是在模型能力比较弱的时候,提示词工程和模型训练有着同样重要的地位。一份完整的结构化提示词是核心资产,能够拿到网上售卖。
张远辰暗暗下定决心,要把毕业后的求职目标定在大厂上。可是当时间来到2025年,在面试字节、阿里等公司时,张远辰发觉,大厂对提示词工程师的需求每年都有变化。
2023年,大厂会选择直接招聘一些AI产品经理来进行相关探索,当时对提示词不太重视,到2024年初,专门的提示词工程师已然出现,大模型行业开始进行细致分工。
到了2025年,DeepSeek能让普通用户通过自然语言玩转AI 。大厂更倾向于把提示词能力当作产品经理、研发等岗位的基础技能,而非独立岗位 。这让张远辰意识到,提示词工程师正朝着通用技能迁移,甚至可能渐渐“消失”,其职责会被其他岗位吸纳 。
张远辰根据自身以及周围的状况进行了粗略判断,在2024年的时候,大厂给有1至3年经验的从业者的薪资,大概在月薪2.2万到3.5万元的范围之内。
但她也表示,对于提示词工程师高薪、高学历的标签,要理性看待 。单纯的提示词撰写,已经难以构成长期壁垒 。提示词工程师水平的高低,本质取决于能否直击问题本质 。提示词工程师水平的高低,本质取决于能否识别模型输出的价值 。
张远辰说,提示词工程师的工作不只是撰写提示词的技巧,更是对用户需求的洞察,是跨领域知识的储备,还是利用模型特性创新解决方案的能力。
在她看来,提示词工程师的岗位职能正在发生迁移,其发展路径更有可能朝着AI产品经理的方向,要理解用户需求,要拆解任务流程,而这些都与产品经理的核心能力高度重合。
面对全新领域的提示词需求,张远辰称没有标准的调研流程,更多是依靠实践验证。
令她印象深刻的是,2024年上半年 ,她参与了一部AI小说写作。写作时,需要将小说拆解为多个环节,包括题目、提纲、大纲、正文等。每个环节的提示词都要进行抽象提炼,以确保上下文连贯。这些提示词要以前文已生成过的内容为基础,比如题目、文风要求等 。
虽然听起来容易,不过在实际处理进程中困难重重,像是模型输出格式有误,模型出现崩塌情况(重复输出单个字符),还有截断现象(内容未完成就终止)等等。
为解决格式问题,张远辰测试了20多个模型。她由此发现,DeepSeek虽能稳定输出格式,却对中文网文风格支持不足。最终,她通过流程切分,比如把2万字的小说拆分成10个2000字左右的段落来生成,降低了模型处理压力。
张远辰事后进行总结,提示词的设计常常充满诸多不确定性,“有效定义AI的工作流程,比提示词设计本身更具作用”。这使得她把职业规划朝着AI产品经理的方向深入发展:“AI最终会成为工具,而抓住用户痛点、设计出切实解决问题的产品,才是核心竞争力。”
03、离职率高,分化明显
2020年,于洪没有预料到,几年后她会站在AI浪潮的十字路口,重新思考职业的意义。于洪是一名金融行业数据分析师,她曾在投行与咨询公司深耕量化分析领域,然而在AI技术迭代中,她感受到了前所未有的危机。
GPT最初连基础爬虫都写得不好,如今它已能够处理完整的机器学习项目,我工作中80%的内容,都有可能被AI替代。
于洪坦率地说,这种焦虑促使她开始探寻转型的途径,招聘网站上数量众多的“AI训练师”岗位,引起了她的留意。
起初,蚂蚁金服等大厂对“AI训练师”有要求,要求不仅要有顶尖学历,还要持有CFA(特许金融分析师)证书,这使于洪误以为这是一个与金融业务深度融合的复合型技术岗位,然而在多方打听后,于洪发现提示词训练本质是“数据标注”,和金融知识几乎没有关联。
就算是名校毕业的学生,进入之后也只是依照机器规则来打分,不存在主观判断的余地。更让她感到意外的是,许多从事这个岗位的从业者竟然来自牛津、剑桥等顶尖学府。
可以说,数据标注岗吸引了众多求职者,因为它有大厂光环。特别是它基础月薪过万,而且面向文科专业招聘,这使得不少名校毕业生一度将其视为“人生奔头”。
于洪称,不少企业在自行组建标注团队,然而工作的重复性过高,致使这一行业的离职率极为惊人,“很多大厂的数据标注岗位属于外包性质,不少人心理落差显著,工作一两个月便会离职。”
在技术冲击和行业震荡的双重压力下,于洪开始重新评估自己的职业护城河,她曾亲历AI工具从“初级辅助”到“威胁替代”的转折,早期使用GPT时,于洪曾借助信息差高效完成工作,还享受过“拿着工资摸鱼”的一小段红利时光。
但随着DeepSeek开始兴起,老板们对开源工具的接受程度提高,人力成本的压缩成为了必然趋势。“当AI能够独立完成数据清洗、分析,甚至生成报告时,我的角色将只剩下审核与纠错。”
在技术洪流当中,于洪尝试去寻找新的锚点,她表示自己曾经考虑过转向AI算法领域,然而与资深工程师的交流使她心生退意,经过反复思考,于洪最后决定回归学术路径,打算攻读计算社会科学方向的博士,研究大语言模型与社会科学、金融分析的交叉应用。
未来的机会可能会出现在技术和业务的结合之处,例如提高AI对网络话语的解析能力,提高AI对金融文本的解析能力。
目前,她的工作仍然是每天和爬虫以及文本情绪识别模型打交道。至于AI技术的未来,于洪呈现出矛盾心态,她打算在欧洲攻读博士,还要寻求工作签证,努力朝着学术领域发展。
王晨身处数据标注岗,和于洪情况类似,他也遭遇了“AI数据打工人”的职场焦虑。2022年,王晨加入了一家创业公司,开始投身于智能体研发的数据标注工作。
王晨称,如今AI训练师的专业门槛有了质的提升,人才需求朝着垂直领域延伸,薪资梯度也出现了结构化差别,医疗、法律等专业领域的AI训练师,年薪能达到20万以上,和去年相比,薪资涨幅超过30% 。
不过,医疗领域标注的岗位要求具备执业医师资质,影像类项目要求有医学硕士背景,美学设计相关岗位则更看重从业者的专业审美积淀。
伴随高薪而来的是更严峻的挑战 王晨透露 某大厂曾为特定项目半年烧掉了500万元标注预算 完成后立即解散团队 “这种不确定性也在倒逼从业者构建核心竞争力”
每次面试新人的时候,王晨都会建议新人选择垂直赛道进行深耕,把数据标注当作理解AI底层逻辑的入口,然后逐步朝着产品设计、质量评估等上游环节去拓展。不过他自己还没有完全想明白,他仅仅是感觉,不管怎样都不能轻易离开AI这趟高速列车。
(文中王晨、于洪为化名)
作者是豆蔻,编辑是李不清,图片来源为视觉中国,本内容来自财经天下WEEKLY 。