Machine Learning 简明教程

Machine Learning - Supervised vs. Unsupervised

机器学习方法可分为有监督学习或无监督学习。如果您能预测数据范围,并且数据可以划分为类别,那么最佳方法是通过有监督学习帮助算法变得更智能。

如果您预测数据量很大,并且认为数据无法简单地分类或标记,那么最好采用无监督学习方法,让算法智能地处理预测。

Differences between Supervised and Unsupervised Machine Learning

下表显示了有监督和无监督机器学习之间的一些主要差异——

Supervised Technique

Unsupervised Technique

有监督机器学习算法使用训练数据及其相关输出(即标签数据)进行训练。

无监督机器学习算法不需要标记数据进行训练。

有监督机器学习模型学习输入训练数据与其标签之间的关联。

无监督机器学习模型从给定的原始数据学习模式和关系。

有监督 ML 模型接收反馈以检查它是否正在预测正确输出。

无监督 ML 模型不会接收任何反馈。

顾名思义,有监督机器学习算法需要监督来训练模型。

顾名思义,无监督机器学习算法不需要任何监督来训练模型。

我们可以将有监督机器学习算法分为两种广泛的类别,即 ClassificationRegression

Clustering, Anomaly Detection, AssociationAssociation 是无监督机器学习算法的一些广泛类别。

在计算复杂性方面,有监督机器学习方法计算简单。

无监督机器学习方法计算复杂。

有监督机器学习方法非常准确。

无监督机器学习方法准确性较低。

在有监督机器学习中,学习是在线进行的。

在无监督机器学习中,学习是实时进行的。

在实现监督机器学习方法之前,类别的数量已经是已知的。

在无监督学习方法中,类别的数量事先未知。

监督学习的主要缺点之一是分类大数据。

由于在无监督学习中使用的数据没有被标记,因此获取有关数据分类的精确信息是其主要缺点之一。

一些众所周知的监督机器学习算法包括 KNN (k-nearest neighbors), Decision tree, Logistic RegressionRandom Forest

一些众所周知的无监督机器学习算法包括 Hebbian Learning, K-means ClusteringHierarchical Clustering