县城里的数据标注员:“有多少智能,就有多少人工”

邢开瑞面试过上千人,知道数据标注的不超过5个。陶致萍的父母问女儿,是不是要提着油漆桶,在大马路上划线。

李亚梅听老板讲,这份工作的意义在于促进自动驾驶汽车提升性能。她不想那么多,累到坚持不下去,就想着给孩子赚点奶粉钱。

“机器识别准确率变高以后,简单的项目变少,人力需求也变少。”有人认为数据标注行业将会收缩,有人相信需求永不会消散。

(本文首发于2025年1月2日《南方周末》)

责任编辑:谭畅

(谭畅使用AI工具生成/图)

2024年12月末,四季如春的云南降温了。在蒙自一处不起眼的二层小楼里,十位员工对着24英寸的电脑屏幕勾勾画画,办公室只有点击鼠标和敲击键盘的“哒哒”声。坐在窗边的男孩搓搓手,吸吸鼻子,继续工作。

他们在做的是针对自动驾驶车辆的数据标注工作。屏幕上显示一种由雷达车扫描生成的4D逻辑图层,他们需要标明图层中的车道线、行驶区域、道路边界线以及地面标识指引。

数据标注是指对图片、语音、文本、视频等数据进行处理,转换为机器可识别的信息,为人工智能模型的训练和优化提供素材。“前面有多少智能,后面就有多少人工”的调侃,道出了数据标注在人工智能行业发展中起到的基石性作用。

2020年2月,数据标注员作为人工智能训练师的一个工种,被正式纳入国家职业分类目录。短短几年,这个劳动力需求量巨大的行业,迅速在一些中小城市落地生根。

“做梦都在画车道线”

屏幕上的图层是黑白色的,像医学治疗中的X光片,主干路在布满黑灰噪点的阴影里,以更深的颜色突出显示。坐在屏幕前的数据标注员如同看诊的大夫,指着图中一片雾蒙蒙的阴影区域比划一圈,“这是绿化带,在道路边上,因为它有明显的分层。”

员工们熟练地滑动鼠标,画面不时翻转,呈现立体三维图,或俯视平面图。光标牵动着红色坐标线在画面上移动,定下的点变幻成绿色,多点连成线。员工每画出一条线、一个框,都意味着几分钱到手了。

工资,在这里是以分为单位累计的。

“我们按计件结算,一天可以标120块钱,每月能赚三千出头。”在蒙自,这座隶属于红河哈尼族彝族自治州的县级市里,一间约170平方米的办公室和12名数据标注员,是云南凯瑞科技有限公司现有的全部家当。27岁的彝族女孩李亚梅是公司里最年长的数据标注员,她高中学历,出身于蒙自农村,如今是一个两岁孩子的妈妈。她想通过这份工作,给孩子赚点尿不湿和奶粉钱。

月收入两三千元不算高薪,但相比于许多奔波劳累的工作,对着电脑重复操作界面8小时,就可以赚得这份收入,李亚梅感到满足。

以前,李亚梅做销售宽带的话务员,收入差不多,每天连续拨打7个小时电话,时常被人误会为骗子。那是份挑战她性格的工作,“好紧张啊,就希望对面不要接电话”。

数据标注这份工作,李亚梅没经面试,就直接被老板邢开瑞录用。邢开瑞也是27岁,他刚创业,缺人,对员工不设置门槛,“只要你愿意

登录后获取更多权限

立即登录

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

参与评论


精选评论 (20)


暂不留名
回复

暂不留名

01-09

千里迢迢搞电诈的,做这个不有意义得多。

王亚平
回复

王亚平

01-05

细分之下的社会,路越来越窄。

Stephen
回复

Stephen

01-05

会不会因为AI图片版权费少,也更方便

Mark Chen

01-03

有个小建议,天天看AI生成的图片都审美疲劳了,能不能换换口味,每篇都是AI图

Stephen
回复

Stephen

01-05

伟大建立在平凡之上

养虎遗患
回复

养虎遗患

01-04

这个行业的实质就是加速淘汰自己。

188****8307
回复

188****8307

01-04

在通用人工智能的发展过程中,需要很多的人力和资源来培育它,也会创造出更多岗位。但当它出现之后,大部分人的工作都会失去意义。

襄阳翼舟
回复

襄阳翼舟

01-04

有多少智能,就有多少数据安全!

期待美好😊
回复

期待美好😊

01-04

AI和人工,各有特色

HHS
回复

HHS

01-04

数据喂养AI,AI又反过来将劳动者塑造成底层数据

丁言豹₁₃₀₃₀₆₄₂₇₃₈
回复

丁言豹₁₃₀₃₀₆₄₂₇₃₈

01-04

没有哪一行业是容易的

日升之屋
回复

日升之屋

01-04

市场发展迅速,已从简单的标准到复杂的标准,再想进入分一杯羹已然比较困难了。考验员工深度、合作伙伴积累、政策走向

Morris Chen(陈正光军)
回复

Morris Chen(陈正光军)

01-03

这么说的话,现在的软件更是。

大湖渔民

01-03

人工智能外表是一辆豪车,打开车门会发现,其实有一百个人骑着自行车抬它。 说得很形象

终抵群星
回复

终抵群星

01-03

👍

Mark Chen
回复

Mark Chen

01-03

有个小建议,天天看AI生成的图片都审美疲劳了,能不能换换口味,每篇都是AI图

dongtian
回复

dongtian

01-03

一口米饭后面是农民翻地、播种、插秧、引水、除草、施肥、排灌、收割、晾晒、入仓,再加工人除杂、脱壳、碾白、筛选、包装,又加一群人分拣、搬运、堆垛、出仓、送货,以及接水、淘米……等等等等。

139****6263
回复

139****6263

01-03

数据标注是指对图片、语音、文本、视频等数据进行处理,转换为机器可识别的信息,为人工智能模型的训练和优化提供素材。“前面有多少智能,后面就有多少人工”的调侃,道出了数据标注在人工智能行业发展中起到的基石性作用。 2020年2月,数据标注员作为人工智能训练师的一个工种,被正式纳入国家职业分类目录。

若花生
回复

若花生

01-03

让人想起徐冰的“山水画装置”系列作品,前端是唯美的中国传统水墨山水,背后是枯藤、抹布、野草……

大湖渔民
回复

大湖渔民

01-03

人工智能外表是一辆豪车,打开车门会发现,其实有一百个人骑着自行车抬它。 说得很形象

海燕
回复

海燕

01-02

sharpsoft
回复

sharpsoft

01-02

感兴趣点进来,觉得有收获,确实平时看到的就是多么快多么炫酷的AI计算和结果,也感到好奇如何训练AI。这个报道揭示了一点背后似乎不那么光鲜但很实在而琐碎的地图数据标注工作,重复性和琐细会让人乏味疲惫,但是这个小伙子说的很好,“他将来或许也是为国家人工智能发展作出微薄贡献的人。这样想来,他更觉得自己在小县城里,做着一件隐秘而伟大的事业。”这就是找到了工作的价值,有意义感了,没有令人小瞧的工作,都是在为一个大目标或结果添砖加瓦。