![Python自然语言处理(微课版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/869/44509869/b_44509869.jpg)
上QQ阅读APP看书,第一时间看更新
1.3.2 无监督学习
无监督学习(Unsupervised Learning)又称为非监督学习,是在没有训练数据集的情况下,对没有标签的数据进行分析并建立模型,发现数据本身的分布特点。与监督学习不同,无监督学习事先没有对数据进行标注,因此无法预测任务,而适合数据分析。
无监督学习分为数据聚类和特征降维。
1.数据聚类
数据聚类(Clustering)是无监督学习的主流应用之一,其目的也是把数据进行分类。对没有标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。
2.特征降维
特征降维(Dimensionality Reduction)是对事物的特性进行压缩和筛选,使用较少的特征概括该数据的重要特性。
机器学习模式总结如表1-4所示。
表1-4 机器学习模式总结
![](https://epubservercos.yuewen.com/CC79B0/23721531409454406/epubprivate/OEBPS/Images/Figure-T22_10961.jpg?sign=1739046165-EnHACI0SkYi8uUXxgqLmgnuDgdvlwIZD-0-dd4b4eb76c3c20ff4bfc1631e3986f4a)