1.2.2 生成式模型
与判别式模型不同,生成式模型试图了解数据是如何生成的。它们通过学习输入数据的分布来生成新的数据实例。生成式模型不仅能够执行分类任务,还能够生成类似于训练集的全新数据样本。常见的生成式模型包括高斯混合模型(Gaussian Mixture Model,GMM)、隐马尔可夫模型(Hidden Markov Model,HMM)和近年来非常流行的生成对抗网络(Generative Adversarial Network,GAN)及扩散模型(Diffusion Model,DM)等。
1. 高斯混合模型
高斯混合模型是一种概率模型,假设所有的数据点都是由有限数量的高斯分布混合生成的。高斯混合模型常用于聚类分析和密度估计。
2. 隐马尔可夫模型
隐马尔可夫模型是一种统计模型,假定系统可以用一个隐藏的马尔可夫链生成观测数据。隐马尔可夫模型广泛应用于时间序列数据的分析,如语音识别和NLP。隐马尔可夫模型的状态变迁如图1-2所示。
图1-2 隐马尔可夫模型的状态变迁
3. 生成对抗网络
生成对抗网络由两部分组成——生成器和判别器。生成器负责产生看起来像真实数据的假数据,而判别器的任务是区分生成的数据和真实数据。生成对抗网络在图像生成、风格转换、图像超分辨率等方面显示出惊人的效果。
4. 扩散模型
扩散模型是一种近年来快速崛起的生成式模型,它通过模拟反向扩散过程来生成数据。这个过程首先从一个随机噪声分布开始,然后逐步通过学习的扩散过程去除噪声,最终生成与真实数据相似的样本。扩散模型在图像和音频合成领域取得了显著成果,尤其是在生成高质量、细节丰富的图像方面表现出色。
生成式模型和判别式模型各有优势及适用场景。判别式模型凭借直接学习输入与输出之间关系的能力,在许多预测和分类任务中表现卓越。而生成式模型则因为能够揭示数据背后的分布特征和生成新数据的能力,在数据增强、未来预测等任务中展现出巨大的潜力。随着研究的深入和技术的发展,两类模型都在不断进化,以解决越来越多的实际问题。