在“无监督学习(unsupervised learning)”中,训练样本的标记信息是位置的,目标通过无标记训练样本的学习来揭示数据的内在性质和规律,为进一步的数据分析提供基础。此类学习任务中研究最多,应用最广的是“聚类”(clustering)。
聚类既能够作为一个单独的过程,用于寻找数据内在的分布结构,又可以作为分类等其他学习任务的前驱过程。