自2022年Open AI推出ChatGPT以來,生成式人工智能技術便迎來了其迅猛的發展浪潮。這些技術在處理文本、圖像、視頻等單一模态數據時,已經展現出了深遠的影響力,成為了推動領域自動化、革新生産方式和輔助人類決策的重要手段。然而,在基礎科學與人工智能的交叉領域,特别是在AI for Science、空間組學、腦科學等研究領域,依賴單一模态的數據分析往往難以充分揭示生物組織的複雜性。為了更深入地理解生物組織不同區域的功能和聯系,在統一的空間坐标上整合來自不同技術的多模态數據一個能夠整合多模态數據的生成式模型顯得尤為關鍵。
基于團隊在多模态數據融合(Nature Biotechnology 2022)的工作積累,2024年8月2日,beat365英国官网网站鄧嶽教授團隊和清華大學自動化系戴瓊海院士團隊合作在Nature Communications上發表了文章《Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model》。文章提出了一種多模态融合的統一生成式模型,通過對圖像數據與空間組學進行聯合生成式建模,實現了對包括腦在内的複雜生物組織的精确刻畫,為空間組學的研究提供了新的工具和方法。

這項研究中提出的空間組學統一生成模型(spatial omics scope, soScope)整合了來自多種觀測技術中的形态學、組學以及空間位置信息,對從高分辨生物組織中采集低分辨觀測數據過程進行生成式建模。這一過程被建模為:低分辨率的空間組學觀測值是由高分辨率空間組學的集合和随機擾動共同影響的結果;而高分辨率空間組學的表達量不僅與特定區域的隐狀态緊密相關,還與高分辨率的形态學特征息息相關。基于這種關聯,soScope模型能夠将不同的空間組學觀測結果,通過一個統一的生成過程來綜合描述(圖1a)。網絡通過整合低分辨率組學信息的空間關系和高分辨率圖像特征,推斷并采樣出高空間分辨率下的空間組學特異性概率分布,實現了對生物組織結構的精确刻畫(圖1)。

圖1. 通過對不同空間組學多模态數據的生成式建模,soScope适用于多種測序平台、多生物組織、多種空間組學聯合分析
利用提出的方法,文章在多種技術産生的數據上進行了實驗。研究團隊首先選擇了空間轉錄組數據領域内廣為應用的平台——Visium和Xenium,構建了低分辨率的仿真數據集。在此基礎上,他們運用soScope模型進行了數據恢複實驗,旨在測試和驗證模型的性能。實驗結果顯示,soScope不僅成功地恢複了人類腸道組織和小鼠大腦的精細結構(圖2a),而且在恢複精度上達到了最高水平(圖2b)。這一結果證明了soScope在處理空間轉錄組數據時的建模精确性,為空間組學研究提供了強有力的支持,證實了soScope作為一種新型工具的潛力和可靠性。

圖2. soScope在空間轉錄組數據上獲得了最高的重建精度,恢複了人類腸道與小鼠大腦的精細結構
在進一步的實驗中,該研究利用了基于spatial CUT&Tag技術采集的小鼠胚胎的數據(圖3a)。這項技術允許研究人員對小鼠胚胎中的DNA與蛋白質相互作用進行深入分析,以測試soScope對于不同空間組學數據的解析能力。soScope成功地消除了小鼠多個器官區域,包括前腦在内的測序噪聲,顯著提升了對小鼠胚胎多個器官結構的辨析度(圖3b)。此外,它還顯著增強了組織内部的連續性,揭示了在原始分辨率下不可見的精細結構,例如小鼠胚胎心髒的雙層結構(圖3c)。這些發現不僅證明了soScope在不同空間組學數據中提高空間分辨率和降低噪聲方面的強大能力,也展示了其在捕獲精細組織結構方面的卓越性能。

圖3. soScope生成了對小鼠包括前腦在内的多個器官的精細空間組學結構并降低了測序噪音
此外,soScope的性能還在多個測序平台(spatia-CITE-seq、spatial ATAC-RNA-seq、slide DNA/RNA-seq等)以及多種生物組織(包括人類皮膚、小鼠肝髒等)上得到了驗證。soScope不僅可用于空間多組學的聯合分析中,還能夠實現不同數據類型間的協同優化,為空間多組學數據的分析提供了工具。
文章通過采用多模态融合的統一生成式框架,成功地在多個空間組學平台和不同的生物組織樣本上進行了深入分析和驗證。這一框架不僅證明了其在處理和整合多種生物數據類型方面的強大能力,而且為研究者提供了一種新的工具,以更全面和精确的方式探究複雜生物結構的精細功能。
本工作得到了國家自然科學基金傑出青年科學基金,國家自然科學基金重點項目的支持。
論文原文鍊接:https://www.nature.com/articles/s41467-024-50837-5