2022级博士生叶航廷同学的论文 "UADB: Unsupervised Anomaly Detection Booster"被CCF-A类会议(ICDE 2023)接收

发布时间：2023-02-14 点击：次

78m威久国际v9捕鱼官网常毅教授指导的2022级直博生叶航廷同学的论文 "UADB: Unsupervised Anomaly Detection Booster"被CCF-A类会议(ICDE 2023)接收。叶航廷本科就读于威久国际v9ag捕鱼唐敖庆理科试验班，从大学四年级起开始接受常毅老师与微软亚洲研究院的联合指导，2022年保送到我院跟随常毅教授继续攻读直博研究生，从事机器学习与数据挖掘领域的研究工作。本工作与伊利诺伊大学香槟分校博士研究生Zhining Liu同学以及微软亚洲研究院Wei Cao、Jiang Bian博士合作完成。

会议简介：ICDE(International Conference on Data Engineering)是数据库领域的顶级国际会议，主要关注数据工程、数据管理以及相关技术的最新研究成果和发展动态。该会议一年举办一次，由国际数据工程协会 (International Association for Data Engineering, IADE) 主办。

会议类别：CCF-A类会议

会议时间：April 3 – 7, 2023，Anaheim, California, USA

第一作者：叶航廷

论文题目：UADB: Unsupervised Anomaly Detection Booster

论文概述：无监督异常检测（UAD）是一个关键且具有广泛实际应用的数据挖掘问题。由于完全缺乏监督信号，UAD方法通常依赖于隐含假设来检测异常。然而，现实世界的数据是复杂的，在不同领域有很大的差异。没有一个假设可以描述这样的复杂性并且在所有情况下都是有效的，最新的异常检测研究也证实了该结论。基于以上观察，我们认为UAD的研究方向不应该是去寻找一个通用的假设，而应该是寻求设计一个通用的UAD Booster（UADB），使任何UAD模型都具有适应不同数据的能力。由于现有UAD方法采用的是异质的模型结构和假设，因此这是一项具有挑战性的任务。为了实现这一目标，我们深入研究UAD问题并发现，与正常数据相比，异常数据（1）在特征空间中缺乏明显的结构/模式，因此（2）难以被没有适当假设的模型学习，最终导致（3）不同学习者之间的高方差。鉴于这些发现，本文提出：（1）将源UAD模型的知识蒸馏到一个不具有数据假设的模仿学习器（助推器）中；（2）利用它们之间的差异来进行自动校正；从而（3）使助推器超越原始UAD模型。我们使用神经网络作为助推器，因为它具有强大的表征能力和能够进行灵活的后期调整的能力。我们在超过80个表格数据集上进行了大量实验，结果证明了UADB的有效性。

上一篇：2019级博士研究生田明杰同学论文被IEEE ICASSP会议接收下一篇：2022级博士生于卓含研究成果发表在《Nature Communications》

科学研究

2022级博士生叶航廷同学的论文 "UADB: Unsupervised Anomaly Detection Booster"被CCF-A类会议(ICDE 2023)接收