有监督、半监督、无监督、弱监督、自监督的定义和区别

有监督、半监督、无监督、弱监督、自监督的定义和区别

dwqy11

40105人浏览 · 2021-02-07 10:41:42

dwqy11 · 2021-02-07 10:41:42 发布

个人对这几个名词粗浅的理解和区分，不甚全面，仅供参考。

有监督：用有标签的数据训练；
无监督：用无标签的数据训练；
半监督：同时用有标签和无标签的数据进行训练。最近非常火热，此领域的发展也非常迅速，先前通常是两阶段的训练，先用（较小规模的）有标签数据训练一个Teacher模型，再用这个模型对（较大规模的）无标签数据预测伪标签，作为Student模型的训练数据；目前已经有很多直接end-to-end地训练，大大减少半监督训练的工作；
自监督：在无标注数据上训练，通过一些方法让模型学习到数据的inner representation，再接下游任务，例如加一个mlp作为分类器等。但接了下游任务之后还是需要在特定的有标签数据上finetune，只是有时候可以选择把前面的层完全固定，只finetune后面接的网络的参数。
弱监督：用包含噪声的有标签数据训练。

以上各个概念的分类并不是严格互斥的。

华为云开发者联盟

为开发者提供学习成长、分享交流、生态实践、资源工具等服务，帮助开发者快速成长。

更多推荐

cover

解锁HDC 2024之旅：从购票到报名，全程攻略

华为云开发者联盟

cover

从原始边列表到邻接矩阵Python实现图数据处理的完整指南

华为云开发者联盟

cover

华为云云原生FinOps解决方案，释放云原生最大价值

华为云开发者联盟

所有评论(0)

查看更多评论

dwqy11

已为社区贡献1条内容