Sitemap: http://www.one8bbs.com/sitemap.xml
科研進(jìn)展

Small Methods | 一種用于歸檔和檢索醫學(xué)磁共振成像數據的高效DNA存儲系統

時(shí)間:2024-06-03  來(lái)源:數字所 文本大?。骸?a href="javascript:doZoom(16)">大 |  | 】  【打印

近日,中國科學(xué)院深圳先進(jìn)技術(shù)研究院姜青山研究員、黃小羅高級工程師、中國農業(yè)科學(xué)院深圳農業(yè)基因組研究所戴俊彪研究員等聯(lián)合在國際學(xué)術(shù)期刊Small Methods (IF=12.4)上發(fā)表了題為An Effective DNA-Based File Storage System for Practical Archiving and Retrieval of Medical MRI Data的研究文章(圖1)。

文章中設計了一種名為"EDS"的DNA存儲方法,通過(guò)改進(jìn)編碼模型、引入冗余核苷酸和設計索引技術(shù),實(shí)現了醫學(xué)MRI數據的可靠歸檔和檢索。




圖1. 文章上線(xiàn)截圖

文章鏈接:https://doi.org/10.1002/smtd.202301585



醫學(xué)MRI數據是診斷、治療規劃和疾病監測等多種領(lǐng)域的重要工具。利用DNA存儲技術(shù)保存醫學(xué)MRI數據將有助于人類(lèi)健康管理。通過(guò)DNA存儲,可以確保這些重要數據在數千年內安全保存并精確恢復,從而保證了這些重要數據的長(cháng)期存儲。此外,DNA存儲還使得過(guò)去的健康數據更容易被未來(lái)的研究人員獲取,這對于縱向研究非常重要,因為它允許研究人員研究疾病的進(jìn)展和治療效果。該工作提出了一種名為“EDS”的方法(圖2),通過(guò)三個(gè)關(guān)鍵組成部分實(shí)現了醫學(xué)MRI數據的歸檔。首先,研究團隊設計了一種新穎的分塊策略,解決了旋轉編碼導致的數據丟失問(wèn)題。其次,提出了一種基于規則的四進(jìn)制轉碼方法,滿(mǎn)足生化約束條件并確??煽康臄祿成?。最后,設計了一種索引技術(shù),簡(jiǎn)化了隨機搜索和訪(fǎng)問(wèn)過(guò)程。



圖2. EDS方法流程圖



研究團隊提出了一種名為“DFS”的索引技術(shù),克服了DNA文件存儲中高額外開(kāi)銷(xiāo)的挑戰,旨在簡(jiǎn)化DNA文件存儲的組織結構,實(shí)現靈活的隨機搜索、訪(fǎng)問(wèn)和文件管理。

圖3中展示的正則標簽(RT,一個(gè)堿基對)有效地幫助搜索特定的分塊(子圖像),將其與其他分塊區分開(kāi)來(lái)。圖像被分割為16個(gè)分塊,每個(gè)分塊被分配了不同的基因標簽,序列索引中設計了唯一的地址(4個(gè)堿基對),以精確定位和檢索所需的序列;此外,在隨機有效負載(平均長(cháng)度為107個(gè)堿基對)之前添加了不同的標簽(DT,四個(gè)堿基對),用于區分每個(gè)分塊的解碼二進(jìn)制數據,進(jìn)而簡(jiǎn)化了存儲數據的組織。



圖3. DFS技術(shù)示意圖



該工作在計算時(shí)間上也提出了新的方法,通過(guò)利用多進(jìn)程技術(shù)優(yōu)化DNA存儲編碼流程,將編碼任務(wù)分解成多個(gè)子任務(wù),并分配多個(gè)CPU進(jìn)行并行計算,提高編碼速率,實(shí)驗共測試了72GB的人體MRI數據,完成編碼僅需9個(gè)小時(shí),編碼時(shí)間效率提升明顯,同時(shí)基于數據進(jìn)行了預測,1TB量級的數據在120 h能完成。通過(guò)計算機模擬和生物合成實(shí)驗證實(shí),EDS方法在醫學(xué)MRI數據存儲方面表現出色,并且具有更好的生化約束控制和較短的計算時(shí)間。為醫學(xué)MRI數據的DNA存儲開(kāi)辟了新的途徑。



圖4. 體內合成驗證EDS 性能測試



這項研究成果為醫學(xué)領(lǐng)域的數據存儲和檢索提供了新的可能性,具有重要的實(shí)際應用前景。隨著(zhù)進(jìn)一步的研究和發(fā)展,DNA存儲技術(shù)有望成為醫學(xué)數據管理的重要工具,為醫學(xué)健康領(lǐng)域帶來(lái)更多的創(chuàng )新和進(jìn)步。

中國科學(xué)院深圳先進(jìn)技術(shù)研究院姜青山研究員、黃小羅研究員高級工程師,中國農業(yè)科學(xué)院深圳農業(yè)基因組研究所戴俊彪研究員為該文章的通訊作者,博士生Abdur Rasool、碩士生洪經(jīng)緯為論文的共同第一作者。該研究獲得國家重點(diǎn)研發(fā)項目、深圳市科技項目等多個(gè)基金的資助。