- ML 生命周期
以下是一个较为常见的MLOps(机器学习运维)知识体系全景图的大致介绍:
数据管理
- 数据采集:从各种数据源(如传感器、数据库、文件系统、网络爬虫等)收集原始数据,确保数据的质量和完整性在这一环节有基本把控,例如去除明显错误或重复的数据记录。
- 数据清洗与预处理:处理缺失值、异常值,进行数据标准化、归一化等操作,让数据符合后续机器学习模型训练的要求,像将图像数据统一尺寸等。
- 数据标注(若需要):对于有监督学习任务,通过人工标注或者利用标注工具、众包平台等方式给数据添加合适的标签,比如给图像中的物体标注类别名称。
- 数据版本控制:类似代码版本控制,跟踪数据的不同版本变化,便...