新华网 正文
揭秘人工智能训练师:给AI当老师不简单
2020-04-15 09:56:25 来源: 科技日报
关注新华网
微博
Qzone
评论
图集

  近日,在河南省信阳市光山县科思网络科技有限公司内,数百名“人工智能训练师”戴着口罩和耳机作业。新华社记者 李安摄

  如今人工智能在各领域大显身手。尤其在电商服务、票务出行、健康问诊、生活购物等服务体验端,大大提升了工作效率,这背后则离不开人工智能训练师的支持。日前人力资源社会保障部与国家市场监管总局、国家统计局联合向社会发布了16个新职业,其中就包括人工智能训练师。据了解,这是自2015年版《中华人民共和国职业分类大典》颁布以来发布的第二批新职业。而最新分析显示,预估到2022年,人工智能训练师国内外相关从业人数有望达到500万。

  工作主要面向产品的实际使用过程

  根据人力资源社会保障部与国家市场监管总局、国家统计局联合发布的通知,人工智能训练师的定义为使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员,主要集中在新兴产业和现代服务业两个领域。

  光看定义,有人可能还难以区分人工智能训练师和其他人工智能开发者的区别,对此,海南省区块链产业研究院专委副主任、海南大学教授段玉聪分析,从职业定义上,人工智能训练师主要使用智能训练软件,工作面向人工智能产品的实际使用过程。而人工智能开发者主要使用开发类软件,工作面向的是人工智能产品的研发和设计阶段;开发者主要完成的是功能性、系统性的工作,人工智能训练师的工作目标则是提升人工智能产品的性能。

  目前,人工智能训练师这一职业包含多个工种,不同工种的工作内容有所差异,要求的技能侧重也有不同。一般来说,人工智能训练师主要分为数据标注员和人工智能算法测试员。数据标注员在不同的企业会有不同的要求。人工智能算法测试员则对技能要求相对较高,需要具备相关数据处理的理论基础,熟悉相关技术方法,熟练使用开发语言与仿真测试工具并具备算法研发或测试经验。

  人工智能训练师如何训练人工智能?段玉聪说,首先人工智能训练师需要对涉及的数据和知识有一定的认知,然后对数据进行“清洗”,得到结构化的核心知识和关键数据,指定数据标注规则,将数据“喂”给人工智能,对其进行“调教”,不断调整参数优化算法,从而让机器人更好地为人类服务。比如,通过训练AI对情绪的理解,人工智能可以获取人的语音、文字中的敏感信息,根据用户的状态提供个性化、人性化服务。

  国内目前约50万人从事相关岗位

  “科技和生产力的提高极大地丰富了人们的日常生活,社会需求结构也随之发生改变。”人力资源和社会保障部职业技能鉴定中心标准处处长葛恒说,人工智能训练师是伴随着新兴技术应用而出现的新职业,适应经济社会发展需要,满足人们不断提升的需求,顺应新产业、新业态、新模式的发展变化趋势。

  行业发展交叉领域催生出的新型职业和新型岗位,让人工智能训练师市场的需求不断增长。“现在全世界都在促进人工智能技术的研发,人工智能已经渗透到很多行业,比如:数据分析、制造、教育、安防、市政、物流、人机交互、交通等。而这些新的交叉行业,都需要人才来参与实现,所以人工智能训练师对于当前社会来说,需求度是很高的。”海南师范大学副教授邓正杰说。

  阿里巴巴集团客户体验事业群人工智能训练专家王智宇在接受媒体采访时表示,阿里从2015年开始孵化国内第一批的人工智能训练师,目前整个阿里巴巴生态中有20万名人工智能训练师,经过阿里人工智能训练体系培养并获得认证的有近6万人。

  王智宇提到,除了阿里巴巴这样的电商服务集团,国内大大小小的AI公司基本都有自己的人工智能训练师。“整个行业涉及到AI的公司,无论甲方乙方,技术公司或者服务型公司,其实都在开始培养自己的人工智能训练师,这也是与以前不一样的一点。”他透露,国内大概有50万人去从事这样的岗位。

  数据分析显示,按照目前的行业发展速度,应用领域的拓展情况,数据标注员等短期内仍会存在较大的人才缺口;而随着技术的发展对从业人员素质的要求也在不断提高,人工智能算法测试员等技术性人才缺口将更加突出。

  新型落地场景要求提升综合素质

  “我们每天要将成百上千幅照片里的物体分门别类地圈出,再标注出来,比如花盆、地毯、茶几、沙发……这些标好的图片会被送进数据库,成为人工智能的学习素材。比如,当电脑看了几万个标注沙发的物体之后,它才能认识什么是沙发。”贵州小伙子小陈描述自己的工作。

  “对我们来讲,AI训练师最大的挑战是跨界融合,这需要训练师既懂法律知识又懂算法相关知识。”北京智慧正安公司公司CEO李正才表示,我们对应聘者的要求主要是搭起AI工程师和数据标注员之间的桥梁。

  虽然各人才需求方对于人工智能训练师的要求各不同,但不难看出,目前人工智能训练师的主要工作任务不仅包括标注和加工图片、文字、语音等业务,还包括分析提炼专业领域特征,训练和评测人工智能产品相关算法、功能和性能,设计人工智能产品的交互流程和应用解决方案,监控、分析、管理人工智能产品应用数据,调整、优化人工智能产品参数和配置等。

  段玉聪认为,目前,人工智能训练师中,从事数据标注等简单任务的人员确实占比较高。但是,随着人工智能的强化学习等具有无监督自我学习算法的兴起,对于数据的依赖性将减轻,人工智能训练师的工作重点也将发生变化。另外,今后如要对面向具有精神需求的绘画、音乐、文学等应用场景开发数据训练人工智能,人工智能训练师更需要不断学习和提升综合素质。

  面向人类情感等主观感受方面的人工智能标注应用前景巨大。段玉聪建议,对有关人类精神世界的挖掘,相关部门应从人工智能治理进行立法和立标等角度,对人工智能训练师职业道德做好提前铺垫。

  对于如何更好地做好职业规划,首都科技领军人才、清华大学电子工程系博士谢耘提出了更高的要求。他说,人工智能训练师最重要的是要把方法搞透,不同的方法原理,适用于不同类型的问题,人工智能训练师要系统地积累经验,把感性经验总结为理性的认识,不断地持续练习,要按照工匠的标准去要求自己。但是,人工智能训练师不应仅仅局限于工匠格局,应通过经验摸索,进一步总结出更深一层的原理,创造普适性的成果。

+1
【纠错】 责任编辑: 郭亚丽
新闻评论
加载更多
黑脸琵鹭“长驻”闽江口湿地
黑脸琵鹭“长驻”闽江口湿地
北京海淀: 中小学线上教学进行时
北京海淀: 中小学线上教学进行时
梦想已久的婚纱照,来了!
梦想已久的婚纱照,来了!
熟悉的武汉慢慢回来了
熟悉的武汉慢慢回来了


010030101010000000000000011100001210558822