Time-RA:基于大语言模型反馈的时间序列异常推理方法 Time-RA: Towards Time Series Reasoning for Anomaly with LLM Feedback
Medium
Relevance: 7/10
Advanced
Reading Level: Advanced
Yiyuan Yang, Zichuan Liu, Lei Song et al. (9 authors)
7月20日 2507.15066v1
Machine Learning cs.LG 大语言模型 自然语言处理
Key Points
提出首个时间序列异常推理任务Time-RA,并构建包含4万样本的多模态基准数据集RATs40K,推动可解释异常检测发展。
Plain Language Summary
这篇论文让电脑不仅能发现数据异常,还能像人一样解释为什么异常。他们收集了4万条带说明的真实数据,用大语言模型帮忙分析,让异常检测变得更智能易懂。
Detailed Analysis
Motivation:
当前时间序列异常检测仅能判断是否异常,缺乏细分类和解释能力。在工业设备监控、医疗监测等领域,仅知道异常远远不够,还需要理解异常类型和原因。传统方法无法满足这一需求,而大语言模型的出现为构建可解释的异常推理系统提供了新可能。
Method:
1) 提出Time-RA新任务,将异常检测转化为生成式推理任务;2) 构建RATs40K数据集,包含10个领域4万样本,每个样本含时间序列、文本和视觉数据,标注14种单变量和6种多变量异常类型;3) 开发基于GPT-4反馈的标注框架提升质量;4) 系统评估现有LLM和多模态LLM在任务上的表现,分析监督微调的关键作用。
Results:
构建的数据集覆盖10个真实场景,包含精细标注的40,000样本。实验显示:1) 现有模型在零样本设置下平均准确率仅58.7%;2) 经过监督微调的模型性能提升21.3%;3) 多模态信息融合使解释合理性提升34.5%。
Conclusion:
该研究首次将时间序列异常检测升级为可解释推理任务,发布的RATs40K数据集填补了领域空白。实验证明大语言模型在该任务上的潜力,同时揭示了监督学习的重要性,为构建下一代可解释异常检测系统奠定了基础。