标注员:AI狂飙下的“电子民工”
知识
2024-01-10
2669
枯燥、无聊,是数据标注员高频提及的感受。
坐在容纳十几人的机房里,一日日重复已有肌肉记忆的机械标注动作,在石家庄干了三个月3D数据标注的小九很自然地联想到了富士康当初为了逃避成为进厂拧螺丝的厂妹才选择进入诱人光鲜的人工智能行业,如今看来,作为AI发展燃料的小九们,仍在既定轨道上一头撞进富士康式的生活。
不停点鼠标,我和AI谁更像机器人
拉一个框,你熟练的话,大概也就1-2秒。小九介绍道,3D的框比2D复杂,得使劲盯着电脑,框不能歪。每天都有固定任务量,不达标得扣钱,累计下来一个月至少得拉26000个框。
3D数据标注界面 图源网络
小九口中的拉框,是数据标注工作最基础的形态,即在包含了众多内容的图像上通过拉出规整的方状框选定物体,并从自动弹出的弹窗中选定其标签名称便大功告。而后这些标签将用于AI识别与学习,并进一步服务于智能零售、物联网、交通等领域。
这一以打标签为核心技能的职位谈不上有门槛。据人社部发布的《人工智能训练师国家职业技能标准(2021年版)》显示,只要会使用电脑及常用办公软件,即可胜任标注员工作。
从早到晚对着闪烁的电脑屏幕重复数百次拉框动作,小九有时也会恍惚,坐在这不停点鼠标,真分不清我和AI谁更像个机器人。她感到心神疲累时也需强打精神,否则提交的数据在审核员处被打回,则意味着更为麻烦的返工。
返工,被标注员们视为噩梦。有一次同事提交的题被打回来,40多帧全是红点,没有一个好的,全是错的,他整个人就一下垮下来了,脸色很难看。修改错误标注的同时,当日的常规任务量也必须完成,这意味着必然挤占标注员的休息时间,尽管小九已经是每周单休。她自嘲说,我们都叫自己电子民工或者赛博小工。
与此强度的工作不太相衬的是标注员的收入。小九称,她每月底薪为3000元,没有五险一金,超出26000框的工作量才会按30%的比例算奖金,天花板工资也仅为3500元。据石家庄市统计局公开数据,2022年私营单位平均工资折合每月4145元,标注员的收入在这一统计前显出窘迫。
小九所在的公司为十几人的小团队,今年9月份仓促成立,老板与员工都是00后,学历以大专为主。用时2个月完成一个项目后,老板便通知小九暂时休息,团队进入半解散状态,等待下一个项目的来临。项目制的模式灵活敏捷,却是以员工的高流动率为代价,等活儿来很没安全感,随时可能揭不开锅就原地解散了,小九解释道。
这类为光鲜的人工智能行业提供基础、海量、流水线劳动并且隐匿在公众目光背面的新型职业,也被人类学家玛丽·L·格雷称为幽灵劳动。相较于日常被投以关注目光、在城市中醒目穿梭的外卖员、网约车司机等职业,镜头鲜有对焦的小九们的确更像机房里的幽灵。
步入2.0版本,更需要创造力
今年11月30日,ChatGPT问世才满周年,但它已使国内互联网行业打响了一场颇为紧张的军备竞赛。各大互联网巨头和独角兽企业纷纷下场布局大模型产业。
聊天机器人ChatGPT主导的大模型训练方向,使得标注员也步入2.0版本,工作从围绕图像、语音、视频的打标签,进阶为更复杂的文本标注,即通过对创作性劳动使得AI能理解与使用对话中的逻辑与情感,训练AI迈向更高维的强人工智能阶段。
这一发展趋势传导到用工市场,面向大模型的标注工作以AI训练师大模型训练师等新名头在招聘网站上出现。数据标注行业也从以学历较低的年轻人、宝妈群体及乡村女性等为主力的劳动密集型产业,逐渐过渡至多领域高学历人才为主体。
招聘软件上AI数据标注岗位大热
据第三方招聘公司透露,以文心一言为首的大模型项目日前又释放出一批招聘需求,一般以外包形式入职,即与第三方公司签订劳务派遣性质的合同。中文、新闻学、心理学这些专业背景的人才和我们需求比较契合,而且最低也需要是统招一本学历,985、211的学生也不在少数。招聘方介绍,之后也会有转正机会,转到运营之类的正式岗位,但不能承诺一个确定的概率。
AI数据标注职位要求及薪酬
过去对非正式职位不屑一顾的高学历求职者,在年入16万许的高薪引力下,也情愿放下身段进入外包岗位。曼曼过去曾是一名新媒体编辑,专职文字表达的她,离职后选择尝试从未听说的AI角色标注师一职,并入职了一家服务于国内头部大厂的外包公司。
曼曼认为,相较于用标签搭建起AI基础世界观的老师一角,训练师的工作更需要创造力和分析力,我的工作是为游戏人物编写对话,这个编写需要在人物框架内进行,语气、措辞都需要符合他的性格和特定情境,所以这份工作要求你有很强的想象力和文字功底。
在头部互联网公司投身于大模型保密开发的露比,也认为她所合作的下游标注师并非民工式的工种,我们的标注有很多'作为人的输出',人和模型会比较谁写的语料更好,从这角度看标注师更像AI的陪练。露比补充说,我们内部都叫同学,也不刻意区分正职和外包。
曼曼并不希望自己的工作被归入传统的数据标注行业,这让她对朋友解释时会稍感尴尬过去满天飞的标注广告中,无门槛、在家兼职可做、月入过万等宣传让公众对这一职业感到好奇又不信任。已经在迭代中的数据标注从业者,渴望得到正名。
岗位大热,但前景并不明朗
三月份,360创始人周鸿祎在展出首次亮相的360大语言模型产品后,强调无需担忧因AI而引发的失业潮,AI将催生大量新机会,AI训练师就是不错的选项。
与之呼应,量子位智库发布的《中国 AIGC 数据标注产业全景报告》中指出,进入大模型时代,数据标注行业将重新洗牌,人才高学历多领域成硬指标,缺口或达百万。综合来看,业内对这一岗位的需求走高,预期乐观。
然而,真正投身于此的员工却难以全然乐观,仍显出顾虑。标注工作没做多久,曼曼便选择下车,跳槽回了老本行,继续做新媒体编辑。对于这段AI角色标注师的经历,她说:我不会写进简历。职业前景整体来说还不明朗,进机房得上交手机,工作环境缺少互动,创作也只能优先服从特定框架,比较难长期做下去吧。
招聘方对于晋升路径也模棱两可,现在大模型还是摸着石头过河,没人能为这一岗位未来的生命周期作出承诺。但露比不认为服务于AI的标注工作仅是昙花一现,AI训练师不会是过渡性职业,大模型的基础能力提升还有很长的路要走,模型还一直在迭代,人机合作会是长期的历史过程。
也有人把数据标注当做进入AI行业的跳板,先把风口行业的大腿抱紧,Cula调侃说。环境工程专业出身的Cula尝试过多种职业,他对数据标注的工作鲜有抱怨,反而觉得无需过多与人协作的模式让自己很少苦恼人际关系,不怎么内耗了。
并且,在做文本分析时偶然接触Python技术,让他来了兴趣,我现在下班时间再找计算机博士的朋友一对一教我学Python。在工作过程中不断发现自己感兴趣的东西并且去深入一下,也许有天这些技能就能帮我在AI生态里占个位置。
无论如何,悲观与乐观派都承认的共识是:变化在加速发生,大模型的潮水滚滚向前;而人,终需在变动里找到自己能够牢牢占据的位置。
来源:大众新闻客户端
本站涵盖的内容、图片、视频等数据系网络收集,部分未能与原作者取得联系。若涉及版权问题,请联系我们进行删除!谢谢大家!
枯燥、无聊,是数据标注员高频提及的感受。
坐在容纳十几人的机房里,一日日重复已有肌肉记忆的机械标注动作,在石家庄干了三个月3D数据标注的小九很自然地联想到了富士康当初为了逃避成为进厂拧螺丝的厂妹才选择进入诱人光鲜的人工智能行业,如今看来,作为AI发展燃料的小九们,仍在既定轨道上一头撞进富士康式的生活。
不停点鼠标,我和AI谁更像机器人
拉一个框,你熟练的话,大概也就1-2秒。小九介绍道,3D的框比2D复杂,得使劲盯着电脑,框不能歪。每天都有固定任务量,不达标得扣钱,累计下来一个月至少得拉26000个框。
3D数据标注界面 图源网络
小九口中的拉框,是数据标注工作最基础的形态,即在包含了众多内容的图像上通过拉出规整的方状框选定物体,并从自动弹出的弹窗中选定其标签名称便大功告。而后这些标签将用于AI识别与学习,并进一步服务于智能零售、物联网、交通等领域。
这一以打标签为核心技能的职位谈不上有门槛。据人社部发布的《人工智能训练师国家职业技能标准(2021年版)》显示,只要会使用电脑及常用办公软件,即可胜任标注员工作。
从早到晚对着闪烁的电脑屏幕重复数百次拉框动作,小九有时也会恍惚,坐在这不停点鼠标,真分不清我和AI谁更像个机器人。她感到心神疲累时也需强打精神,否则提交的数据在审核员处被打回,则意味着更为麻烦的返工。
返工,被标注员们视为噩梦。有一次同事提交的题被打回来,40多帧全是红点,没有一个好的,全是错的,他整个人就一下垮下来了,脸色很难看。修改错误标注的同时,当日的常规任务量也必须完成,这意味着必然挤占标注员的休息时间,尽管小九已经是每周单休。她自嘲说,我们都叫自己电子民工或者赛博小工。
与此强度的工作不太相衬的是标注员的收入。小九称,她每月底薪为3000元,没有五险一金,超出26000框的工作量才会按30%的比例算奖金,天花板工资也仅为3500元。据石家庄市统计局公开数据,2022年私营单位平均工资折合每月4145元,标注员的收入在这一统计前显出窘迫。
小九所在的公司为十几人的小团队,今年9月份仓促成立,老板与员工都是00后,学历以大专为主。用时2个月完成一个项目后,老板便通知小九暂时休息,团队进入半解散状态,等待下一个项目的来临。项目制的模式灵活敏捷,却是以员工的高流动率为代价,等活儿来很没安全感,随时可能揭不开锅就原地解散了,小九解释道。
这类为光鲜的人工智能行业提供基础、海量、流水线劳动并且隐匿在公众目光背面的新型职业,也被人类学家玛丽·L·格雷称为幽灵劳动。相较于日常被投以关注目光、在城市中醒目穿梭的外卖员、网约车司机等职业,镜头鲜有对焦的小九们的确更像机房里的幽灵。
步入2.0版本,更需要创造力
今年11月30日,ChatGPT问世才满周年,但它已使国内互联网行业打响了一场颇为紧张的军备竞赛。各大互联网巨头和独角兽企业纷纷下场布局大模型产业。
聊天机器人ChatGPT主导的大模型训练方向,使得标注员也步入2.0版本,工作从围绕图像、语音、视频的打标签,进阶为更复杂的文本标注,即通过对创作性劳动使得AI能理解与使用对话中的逻辑与情感,训练AI迈向更高维的强人工智能阶段。
这一发展趋势传导到用工市场,面向大模型的标注工作以AI训练师大模型训练师等新名头在招聘网站上出现。数据标注行业也从以学历较低的年轻人、宝妈群体及乡村女性等为主力的劳动密集型产业,逐渐过渡至多领域高学历人才为主体。
招聘软件上AI数据标注岗位大热
据第三方招聘公司透露,以文心一言为首的大模型项目日前又释放出一批招聘需求,一般以外包形式入职,即与第三方公司签订劳务派遣性质的合同。中文、新闻学、心理学这些专业背景的人才和我们需求比较契合,而且最低也需要是统招一本学历,985、211的学生也不在少数。招聘方介绍,之后也会有转正机会,转到运营之类的正式岗位,但不能承诺一个确定的概率。
AI数据标注职位要求及薪酬
过去对非正式职位不屑一顾的高学历求职者,在年入16万许的高薪引力下,也情愿放下身段进入外包岗位。曼曼过去曾是一名新媒体编辑,专职文字表达的她,离职后选择尝试从未听说的AI角色标注师一职,并入职了一家服务于国内头部大厂的外包公司。
曼曼认为,相较于用标签搭建起AI基础世界观的老师一角,训练师的工作更需要创造力和分析力,我的工作是为游戏人物编写对话,这个编写需要在人物框架内进行,语气、措辞都需要符合他的性格和特定情境,所以这份工作要求你有很强的想象力和文字功底。
在头部互联网公司投身于大模型保密开发的露比,也认为她所合作的下游标注师并非民工式的工种,我们的标注有很多'作为人的输出',人和模型会比较谁写的语料更好,从这角度看标注师更像AI的陪练。露比补充说,我们内部都叫同学,也不刻意区分正职和外包。
曼曼并不希望自己的工作被归入传统的数据标注行业,这让她对朋友解释时会稍感尴尬过去满天飞的标注广告中,无门槛、在家兼职可做、月入过万等宣传让公众对这一职业感到好奇又不信任。已经在迭代中的数据标注从业者,渴望得到正名。
岗位大热,但前景并不明朗
三月份,360创始人周鸿祎在展出首次亮相的360大语言模型产品后,强调无需担忧因AI而引发的失业潮,AI将催生大量新机会,AI训练师就是不错的选项。
与之呼应,量子位智库发布的《中国 AIGC 数据标注产业全景报告》中指出,进入大模型时代,数据标注行业将重新洗牌,人才高学历多领域成硬指标,缺口或达百万。综合来看,业内对这一岗位的需求走高,预期乐观。
然而,真正投身于此的员工却难以全然乐观,仍显出顾虑。标注工作没做多久,曼曼便选择下车,跳槽回了老本行,继续做新媒体编辑。对于这段AI角色标注师的经历,她说:我不会写进简历。职业前景整体来说还不明朗,进机房得上交手机,工作环境缺少互动,创作也只能优先服从特定框架,比较难长期做下去吧。
招聘方对于晋升路径也模棱两可,现在大模型还是摸着石头过河,没人能为这一岗位未来的生命周期作出承诺。但露比不认为服务于AI的标注工作仅是昙花一现,AI训练师不会是过渡性职业,大模型的基础能力提升还有很长的路要走,模型还一直在迭代,人机合作会是长期的历史过程。
也有人把数据标注当做进入AI行业的跳板,先把风口行业的大腿抱紧,Cula调侃说。环境工程专业出身的Cula尝试过多种职业,他对数据标注的工作鲜有抱怨,反而觉得无需过多与人协作的模式让自己很少苦恼人际关系,不怎么内耗了。
并且,在做文本分析时偶然接触Python技术,让他来了兴趣,我现在下班时间再找计算机博士的朋友一对一教我学Python。在工作过程中不断发现自己感兴趣的东西并且去深入一下,也许有天这些技能就能帮我在AI生态里占个位置。
无论如何,悲观与乐观派都承认的共识是:变化在加速发生,大模型的潮水滚滚向前;而人,终需在变动里找到自己能够牢牢占据的位置。
来源:大众新闻客户端
本站涵盖的内容、图片、视频等数据系网络收集,部分未能与原作者取得联系。若涉及版权问题,请联系我们进行删除!谢谢大家!