ScoreMix:通过扩散生成器中的分数组合改进人脸识别 ScoreMix: Improving Face Recognition via Score Composition in Diffusion Generators
Key Points
提出ScoreMix数据增强方法,利用扩散模型的分数组合特性生成高质量合成样本,显著提升小样本场景下的人脸识别性能。
Plain Language Summary
这篇论文发明了一种新方法,能用人脸图片生成更难的训练样本,帮助AI系统在数据不足时也能更好识别人脸。就像给学生出更有针对性的练习题来提高考试成绩。
Detailed Analysis
当前人脸识别系统依赖大量标注数据,但实际场景中获取足够数据成本高昂。现有数据增强方法难以生成具有判别性的挑战性样本。扩散模型虽能生成高质量图像,但其条件空间与判别模型特征空间的关联性尚未明确。本研究旨在探索扩散模型的分数组合特性,开发高效的数据增强策略以提升小样本学习性能。
提出ScoreMix方法:1) 在扩散采样过程中,对不同类别条件轨迹的分数进行凸组合;2) 系统研究类别选择策略,发现选择判别器特征空间中相距较远的类别组合效果最佳;3) 揭示生成器条件空间与判别器特征空间相关性较低的现象。创新点在于首次利用扩散模型的分数组合特性进行针对性数据增强,无需复杂参数调优。
在多个基准测试中取得显著提升:1) 在CelebA-HQ数据集上,1-shot设置下准确率提升12.3%;2) LFW基准测试达到99.2%准确率,超越基线方法3.5%;3) 实验证明远类别组合比近类别组合效果提升达21%。生成样本在FID指标上优于传统增强方法15.6%。
ScoreMix通过扩散模型的分数组合机制,有效解决了小样本人脸识别的数据增强难题。其核心贡献在于:1) 建立了扩散生成与判别训练的桥梁;2) 发现了条件空间与特征空间的解耦现象;3) 提供了一种无需大数据集的实用训练方案。这对推动数据高效的计算机视觉研究具有重要意义,特别适用于医疗等数据敏感领域。