人工智能高质量数据集建设指南
指南从政策、技术、产业层面介绍了当前高质量数据集建设的背景,梳理了高质量数据集的定义、特征、分类、建设主体以及“三大建设难点”,提出了人工智能数据工程的“五大核心要素”和企业建设高质量数据集“三步走”战略,分析了高质量数据集建设的核心技术,展示了科学、通信、交通、铁塔、医疗、文化等领域高质量数据集建设实践,最后从工程能力、技术创新、质量评估、版权合规、基础制度创新等层面对未来高质量数据集建设的趋势进行了展望,并提出了对政府部门和企业机构的建议,为业界推进高质量数据集建设提供有力支撑。
【目 录】
一、高质量数据集成为人工智能应用升级的核心要素
(一)政策层面:“人工智能+数据要素”政策协同布局
(二)技术层面:人工智能技术演进重构数据工程范式
(三)产业层面:数据成为人工智能行业应用的护城河
二、高质量数据集建设的现状和难点
(一)高质量数据集的“三高”特征
(二)高质量数据集分类维度
(三)高质量数据集建设主体
(四)高质量数据集建设难点
三、搭建人工智能数据工程能力核心要素
(一)管理体系
(二)开发维护
(三)质量控制
(四)资源运营
(五)合规可信
四、高质量数据集建设路径设计
(一)体系规划阶段——构建高质量数据集认知框架
(二)工程建设阶段——打造高质量数据集生产体系
(三)质量监测阶段——构建高质量数据集全流程管控机制
五、高质量数据集“炼化”流程和技术
(一)数据设计和采集
(二)数据治理
(三)数据标注
(四)数据质检
(五)数据运营
六、总结展望和建议
(一)建立AI数据工程体系
(二)推动AI数据技术创新
(三)搭建全流程AI数据质量管理体系
(四)加快AI数据开发利用机制突破
为创新充能 1元 查看完整内容!立即支付