
AAAI由国际人工智能促进协会主办,是人工智能领域历史最悠久、研究方向最广的国际前沿顶级学术会议之一,同时被中国计算机学会(CCF)推荐为A类国际学术会议。第39届国际人工智能大会(AAAI 2025)将于2025年2月25日至3月4日在美国费城举行。学院自去年在该会议上实现昆明理工大学首篇论文发表以来,不断突破国际顶会高质量论文发表。近日,学院在AAAI 2025成功录用三篇论文,涵盖多模态医学图像融合、多视图文档聚类、跨语言依存句法分析等方向的最新研究成果。
ICDE是电气电子工程师学会(IEEE)主办的旗舰会议,与SIGMOD、VLDB并称数据库领域三大国际顶级学术会议,是数据库领域影响力最高的国际学术会议之一,也是CCF推荐的A类国际学术会议。第41届IEEE国际数据工程大会(ICDE)将于2025年5月19日至23日在中国香港举行。近日,学院首次在国际数据库顶会ICDE 2025上发表论文,实现了我校在数据库三大国际顶会零的突破。
以下为上述两个顶会的四篇论文简介(排序不分先后):
(1) 论文标题:BSAFusion: A Bidirectional Stepwise FeatureAlignment Network for Unaligned Medical ImageFusion
作者:李华锋,苏大勇,蔡青,张亚飞
论文简介:如果能在统一的处理框架内,采用单阶段的方式同时实现未配准多模态医学图像的对齐和融合,不仅能实现双任务的协同促进将还有助于降低模型的复杂性。然而,要实现这一模型的设计往往面临着用于融合的特征和用于对齐的特征两者之间不可协调的难题。具体而言,特征对齐要求对应特征具有一致性,而特征融合则要求对应特征具有互补性。为应对这一挑战,本文提出了一种Bidirectional Stepwise Feature Alignment (BSFA)的未对齐医学图像融合方法。为消除模态差异对跨模态特征匹配产生负面影响,我们在BSFA中嵌入了Modal Discrepancy-Free Feature Representation (MDF-FR)特征表述方法。MDF-FR对输入的图像引入了模态特征表示头(Modal Feature Representation Head, MFRH)来集成输入图像的全局信息,通过注入当前图像的头信息到其他模态的图像中,有效降低了模态差异对特征对齐的影响,同时保护了不同图像所携带的互补信息。在特征对齐方面, BSFA基于两点间向量的路径无关性,提出了双向逐步对齐的变形场预测策略,解决了单步对齐跨度大,变形场预测不准确的难题。最后Multi-Modal Feature Fusion块通过将预测到的变形场应用于多模态特征上,实现了输入图像在特征级上的对齐和融合。在多个数据集上的实验结果证明了本文方法的有效性以及相对于已有方法的优越性。

(2)论文题目:Ambiguous Instance-Aware Contrastive Network with Multi-Level Matching for Multi-view Document Clustering
作者:舒振球,孙腾,罗云伟,余正涛
论文简介:多视图文档聚类(Multi-view Document Clustering, MvDC)旨在充分利用不同视图的互补性,从而提升聚类的准确性和鲁棒性。然而,在实际的聚类应用中,大多数现有方法面临以下挑战:1) 这些方法主要基于单一视角(如特征或类别)对多视图数据进行对齐,忽略了表示的多样性和全面性;2) 在跨视图对比学习中,对所有样本一视同仁,未考虑模糊样本的存在,从而削弱了模型的鉴别能力。为了解决这些问题,本文提出了一种基于多级匹配的模糊实例感知对比网络(Ambiguous Instance-aware Contrastive Network with Multi-Level Matching, AICN-MLM)用于多视图文档聚类任务。该模型包含两个主要模块:多级匹配模块和模糊实例感知对比学习模块。前者从特征、伪标签和原型等多个角度对多视图数据进行对齐;后者通过权重调节函数动态调整样本权重,突出模糊样本对的作用。因此,本文的方法能够有效挖掘多视图文档数据的一致性,且关注模糊样本以增强模型的鉴别能力。大量实验结果表明,所提方法在多个多视图文档数据集上具有显著的效果,验证了其有效性。

(3) 论文标题:Dynamic Syntactic Feature Filtering and Injecting Networks for Cross-lingual Dependency Parsing
作者:刘建建,余正涛,李英,黄于欣,高盛祥
(昆明理工大学为论文第一单位,李英老师为论文通讯作者,硕士研究生刘建建为论文第一作者)
论文简介:依存句法分析(dependency parsing),作为自然语言处理中的关键技术之一,旨在分析输入句子的句法和语义信息。虽然通过预训练语言模型增强的依存句法分析器在富资源语言中取得了出色的表现,但其性能在低资源语言中会显著下降。跨语言依存句法分析尝试从富资源语言中学习丰富且有用知识来弥补低资源语言句法信息不足的问题。然而,如何减少不同语言之间的句法结构分布偏差和深度挖掘语言之间的共性依然是跨语言句法分析的巨大挑战。为了解决这些问题,本文在传统的共享-私有模型基础上提出了新颖的语言特定句法特征过滤网络(language-specific syntactic feature filtering network, LSFN)和语言不变句法特征注入网络(Language-invariant syntactic feature injection network, LIIN)。本文在七个低资源语言数据集(越南语、维吾尔语、泰语、沃洛夫语、科普特语、马耳他语和泰米尔语)上进行了实验,实验结果表明与原始的共享-私有模型相比,本文的模型在七种语言上平均取得了1.84的未加标签依存关系准确率(UAS)和3.43加标签依存关系准确率(LAS)的得分提升。对比实验证明了本文提出的LSFN和LIIN模块在有益知识从源语言迁移到目标语言方面具有互补性。详细的分析实验表明本文的模型能够有效捕捉不同语言之间的公共特征,大幅度缓解语言分布偏差带来的负迁移,进一步展现出本文模型的鲁棒性和有效性。

(4) 论文标题:A Length Enhanced B+-tree based index for Efficient Set Similarity Query
作者:贾连印,罗仕琦,丁家满,Suprio Ray,李孟娟,李秀星
论文简介:集合相似度查询在抄袭检测、数据清洗等众多领域应用广泛。现有算法需自顶向下扫描索引并逐节点计算相似度上界,存在计算复杂、过滤效率低等不足。为解决非固定维度的集合难以用一维结构索引的问题,设计了高效的桶映射,将集合映射为整型的key,并巧妙地在映射的key前部扩展集合长度,以支持有效的长度过滤。基于映射的key,设计了新颖的长度增强B+树索引 (LeB)和两个高效的集合相似性查询算法LeBQ和LeBQ+。为解决传统算法需逐节点计算相似度的难题,在LeBQ算法中,我们创新性地提出了对称差分配策略,可根据查询直接获取LeB中满足相似度的key的上界和下界,避免逐节点相似度上界计算的开销,大幅降低了访问的节点数量。结合高效的组合桶差过滤策略,可有效修剪key值上下界内不可能相似的集合,显著降低了候选集的数量。LeBQ+算法结合长度独立的对称差,进一步提高了效率。实验结果表明我们的算法相对现有最高效的算法可达上百倍的效率提升。

AAAI2025网址:https://aaai.org/aaai-24-conference/save-the-date-aaai-25/
ICDE2025网址:https:// ieee-icde.org/2025/