發(fā)布時(shí)間:2022-01-15
1月6日,中國科學(xué)院廣州生物醫藥與健康研究院陳捷凱課題組開(kāi)發(fā)的單細胞數據IO軟件“scDIOR”于BMC Bioinformatics雜志在線(xiàn)發(fā)表。該軟件統一了多種單細胞分析工具的數據結構,使單細胞數據能夠在不同平臺間快速轉換,減少存儲和內存消耗,將顯著(zhù)提升單細胞研究的效率。
單細胞測序應用極廣,其數據具有樣本量大、信息量大、統計和挖掘極為復雜等特點(diǎn),科學(xué)家往往需要不斷切換不同軟件,不同平臺來(lái)滿(mǎn)足分析需求。然而,單細胞數據在不同平臺之間的傳輸存在技術(shù)障礙,導致科學(xué)家將大量的時(shí)間花費在數據轉換上,嚴重影響研究效率。
為了解決上述問(wèn)題,陳捷凱課題組開(kāi)發(fā)了軟件scDIOR,統一了R和python平臺的三種主流的數據結構,即Seurat,SingleCellExperiment和Scanpy。通過(guò)scDIOR,單細胞數據以統一的H5格式保存,無(wú)論從哪個(gè)平臺開(kāi)始,只需兩行代碼就可實(shí)現單細胞數據在不同工具包之間的快速轉換,支持轉錄組和空間組等多種數據類(lèi)型(可繼續迭代增加),最大程度地保留了原始信息。因此,scDIOR可以快速比較一項分析任務(wù)在不同工具包的差異;依托H5文件格式的“組”,提供部分數據讀取功能,大幅度減少內存消耗和時(shí)間消耗;設計了命令行指令,可實(shí)現批量數據轉化。綜上所述,scDIOR可以應用建立一個(gè)標準的單細胞數據結構,將不同工具的優(yōu)勢連接起來(lái),幫助科學(xué)家更高效地完成單細胞的研究工作。
本研究在陳捷凱研究員和林立惠博士指導下,由生物島實(shí)驗室實(shí)習研究員馮輝堅完成。軟件已經(jīng)過(guò)大量用戶(hù)使用優(yōu)化,可在GitHub下載(鏈接 https://github.com/JiekaiLab/scDIOR),也歡迎提出寶貴意見(jiàn)(可發(fā)至feng_huijian@grmh-gdl.cn)。
單細胞數據IO軟件scDIOR
scDIOR很方便地實(shí)現數據在平臺間的轉換,將不同工具的優(yōu)勢連接起來(lái)
附件下載: