人民日报:发展数据标注技术,把数据“原油”炼成“汽油”
数据标注作为“人工智能+”行动中的关键环节,正迎来快速发展。通过为文本、图像、语音等数据添加标签,数据标注将人类知识转化为机器可识别的信息,为高质量数据集建设提供支撑,有效提升大模型在垂直领域的性能。在国家政策推动下,数据标注产业规模迅速增长。目前,全国已建设7个数据标注基地,服务超过160个大模型,带动相关产值超83亿元。产业呈现三大趋势:技术向智能化、人机协同演进;标注质量要求提高,逐步从劳动密集型转向知识密集型;标注对象从单模态扩展至多模态,覆盖医疗、工业等专业领域。未来,需加强政策落实与产学研合作,推动标注工具研发和标准建设,共同培育壮大数据标注产业生态。
(来源:人民日报)
表情