好爽又高潮了毛片免费下载,国产97在线 | 亚洲,亚洲一区二区三区AV无码,特级AAAAAAAAA毛片免费视频

安防-資訊

智慧城市網 > 資訊 > 企業關注 > 正文

科學島團隊提出一種跨模態機器視覺人工智能模型實現跨模態圖像檢索技術

2024-09-11 11:57:22 合肥物質科學研究院 作者:高皖 點擊量:35508
  【智慧城市網 企業關注】近日,中國科學院合肥物質院智能所先進制造中心王紅強研究員團隊提出一種寬域跨模態機器視覺AI模型,突破了傳統單域模型跨模態信息處理瓶頸,實現了跨模態圖像檢索技術新突破。該研究成果被計算機視覺頂會(歐洲計算機視覺大會,ECCV2024)正式接收。
 
  跨模態機器視覺研究是當前人工智能研究的前沿領域與主要挑戰之一,難點在于如何識別模態間的一致性和互補性。傳統方法通常在圖水平和特征水平上進行,往往受限于信息粒度過大和圖像資源稀缺等問題。科研團隊發現,相比圖和特征,細節關聯在多數情況下更好地保持了跨模態間的不變性。
 
  為此,科研團隊提出了一種寬域信息挖掘神經網絡(WRIM-Net),通過構建全域交互學習機制實現了在空間域、通道域以及尺度域等多域中的細節關聯挖掘,突破了傳統單域模型的局限性。此外,通過設計跨模態關鍵實例對比學習模塊有效引導了網絡提取模態關聯信息。在驗證實驗中,不僅在標準SYSU-MM01和RegDB數據集上,還在最新的大規模跨模態LLCM數據集上證實了所提出模型的有效性,多項關鍵性能指標首次突破90%,比如在SYSU-MM01上R1指標達92.1%,在RegDB上mAP指標達90.5%,接近實際應用水平。該模型可用于視覺追溯與檢索、多模態大模型、醫學影像分析、安防監控等多個人工智能應用領域。
 
  博士生吳勇敢為文章的第一作者,王紅強為通信作者。該研究工作得到了國家自然科學基金項目、中國科學院設備開發、安徽省重點研究與開發計劃等科研項目的支持。
 
  據悉,歐洲計算機視覺大會(ECCV)是計算機視覺領域的頂尖國際學術盛會之一,與ICCV和CVPR并列“三大頂會”。自1986年起,ECCV每兩年舉行一次,聚焦計算機視覺的全方位研究,包括圖像與視頻的處理、分析和理解,及其在機器學習、模式識別、機器人、醫學影像、AR/VR等領域的應用。
 
跨模態信息關聯性與寬域信息挖掘模型原理

聲明:凡來源標明“智慧城市網”的文章版權均為本站所有,如需轉載請務必注明出處,違者本網將追究相關法律責任;所有未標明來源為“智慧城市網”的轉載文章目的在于傳遞更多信息,均不代表本網立場及觀點,“智慧城市網”不對這些第三方內容或鏈接做任何保證或承擔任何責任;如涉及版權等問題,請在內容發表之日起一周內與本網聯系,否則視為放棄相關權利。

我要評論

文明上網,理性發言。(您還可以輸入200個字符)

所有評論僅代表網友意見,與本站立場無關。


資訊視頻會議協會

咨詢中心

服務咨詢QQ交談

在線客服QQ交談

媒體合作QQ交談

展會合作QQ交談

返回首頁