自动标注
自动标注利用AI技术辅助或完成标注工作,大幅提升标注效率。
LLM辅助标注
预标注
使用大语言模型进行预标注,人工只需审核和修改,可提升5-10倍效率。
标注建议
AI提供标注建议,标注员参考建议做出最终决定。
质量检查
使用AI检查标注结果的一致性和合理性,标记可能的问题供人工复核。
主动学习
原理
主动学习策略选择最有价值的数据进行标注:
- 不确定性采样:选择模型最不确定的样本
- 多样性采样:选择代表不同分布的样本
- 错误驱动:选择模型可能出错的样本
效率提升
主动学习可以在标注更少数据的情况下达到相同或更好的模型效果。
半自动标注
半自动标注流程
1. 规则或模型预标注 → 2. 人工审核和修正 → 3. 反馈优化模型 → 4. 循环迭代