Machine Learning 简明教程
Machine Learning - Supervised vs. Unsupervised
机器学习方法可分为有监督学习或无监督学习。如果您能预测数据范围,并且数据可以划分为类别,那么最佳方法是通过有监督学习帮助算法变得更智能。
如果您预测数据量很大,并且认为数据无法简单地分类或标记,那么最好采用无监督学习方法,让算法智能地处理预测。
Differences between Supervised and Unsupervised Machine Learning
下表显示了有监督和无监督机器学习之间的一些主要差异——
Supervised Technique |
Unsupervised Technique |
有监督机器学习算法使用训练数据及其相关输出(即标签数据)进行训练。 |
无监督机器学习算法不需要标记数据进行训练。 |
有监督机器学习模型学习输入训练数据与其标签之间的关联。 |
无监督机器学习模型从给定的原始数据学习模式和关系。 |
有监督 ML 模型接收反馈以检查它是否正在预测正确输出。 |
无监督 ML 模型不会接收任何反馈。 |
顾名思义,有监督机器学习算法需要监督来训练模型。 |
顾名思义,无监督机器学习算法不需要任何监督来训练模型。 |
我们可以将有监督机器学习算法分为两种广泛的类别,即 Classification 和 Regression 。 |
Clustering, Anomaly Detection, Association 和 Association 是无监督机器学习算法的一些广泛类别。 |
在计算复杂性方面,有监督机器学习方法计算简单。 |
无监督机器学习方法计算复杂。 |
有监督机器学习方法非常准确。 |
无监督机器学习方法准确性较低。 |
在有监督机器学习中,学习是在线进行的。 |
在无监督机器学习中,学习是实时进行的。 |
在实现监督机器学习方法之前,类别的数量已经是已知的。 |
在无监督学习方法中,类别的数量事先未知。 |
监督学习的主要缺点之一是分类大数据。 |
由于在无监督学习中使用的数据没有被标记,因此获取有关数据分类的精确信息是其主要缺点之一。 |
一些众所周知的监督机器学习算法包括 KNN (k-nearest neighbors), Decision tree, Logistic Regression 和 Random Forest 。 |
一些众所周知的无监督机器学习算法包括 Hebbian Learning, K-means Clustering 和 Hierarchical Clustering 。 |