近期,計算機學院胡凱教授課題組多項研究成果成功被人工智能領域國際頂級會議——神經信息處理系統大會(NeurIPS)以及人工智能促進會(AAAI)錄用。
“基于漸進風格遷移無監督域自適應的多序列腎臟腫瘤分割方法” (One-to-Multiple: A Progressive Style Transfer Unsupervised Domain-Adaptive Framework for Kidney Tumor Segmentation),針對多序列磁共振成像中腎臟和腫瘤分割需逐序詳細標注、耗時費力等問題,提出了一種高效的一對多漸進風格遷移無監督域自適應(PSTUDA)框架。該框架通過多級風格字典顯式存儲每個目標域的風格信息,實現了內容與風格的解耦;同時采用級聯風格融合模塊結合逐點實例歸一化方法,逐步重組內容與風格特征,顯著提升了跨模態特征對齊與結構一致性。在兩個CT和MRI腎臟及腫瘤數據集上的實驗結果表明,PSTUDA的圖像生成和分割性能均優于現有方法,同時大幅減少了浮點計算量和模型參數量。該成果被2024年12月在加拿大溫哥華舉辦的NeurIPS會議錄用。

(PSTUDA算法流程圖)
“基于多視圖掩碼對比表征學習的內窺鏡視頻分析”(Multi-view Masked Contrastive Representation Learning for Endoscopic Video Analysis),針對已有方法缺乏細粒度信息考量導致對像素級預測任務不友好等挑戰,提出了一種面向內窺鏡視頻預訓練的多視圖掩碼對比表征學習(M2CRL)框架,采取多視圖掩碼策略,對全局和局部視圖執行掩碼建模,增強內窺鏡視頻中細粒度表征的捕獲。又將多視圖掩碼建模與對比學習相結合,使模型具備細粒度感知和全局判別力。M2CRL在7個內窺鏡視頻數據集上開展預訓練,并在3個數據集上進行下游任務微調。結果表明,M2CRL在分類、分割和檢測任務上均優于現有方法。該成果被2024年12月在加拿大溫哥華舉辦的NeurIPS會議錄用。

(M2CRL算法流程圖)
在語義分割任務中,基于知識蒸餾(KD)的方法往往側重于引導學生在同構架構中模仿教師的知識。為了利用不同歸納偏差架構包含的豐富知識,課題組首次提出從異構角度進行語義分割的通用知識蒸餾方法,命名為 HeteroAKD。為消除特定架構信息影響,將教師和學生中間特征巧妙地投射到了一個對齊的Logits空間中。為利用來自異構架構的豐富知識,提供給學生所需定制化知識,引入了師生知識混合機制(KMM)和師生知識評估機制(KEM)。在三個主流數據集上的廣泛實驗表明,所提HeteroAKD在促進異構架構蒸餾方面優于最先進的知識蒸餾方法?!盎诋悩嫾軜嬛R蒸餾的語義分割方法”(Distilling Knowledge from Heterogeneous Architectures for Semantic Segmentation)已被將于2025年2月在美國費城召開的AAAI會議錄用。

神經信息處理系統大會(NeurIPS)是全球機器學習、人工智能和計算神經科學領域最具影響力的頂級學術會議之一,與國際機器學習大會(ICML)和國際學習表征會議(ICLR)并列為“機器學習三大頂會”,也是CCF推薦的A類國際學術會議,每年吸引了大量高水平論文投稿。人工智能促進會(AAAI)是人工智能領域的主要國際學術組織之一,AAAI年會是國際頂級人工智能學術會議之一,是CCF推薦A類國際學術會議,在人工智能及自然語言處理領域享有較高學術聲譽。

胡凱教授是我校“人工智能”研究團隊核心成員,長期從事人工智能、計算機視覺和醫學圖像分析領域的教學和科研工作,已在國內外高質量學術會議和期刊上公開發表論文80余篇,指導本科生獲“第18屆挑戰杯”黑科技賽道全國特等獎等國家級、省部級學科競賽獎勵30余項,指導研究生獲得湖南省優秀碩士學位論文獎2項、研究生校長獎2項,2023年入選“芙蓉學者獎勵計劃”青年學者,2024年榮獲湖南省生物醫學工程“青年人才獎”。