基因组数据的“软件瑞士军刀”可快速了解细胞的行为

摘要:

要想知道一个细胞正在像癌症那样失控地生长,还是在入侵病毒的控制下生长,或者仅仅是在做一个健康细胞的常规工作,最好的方法就是看它的基因表达。虽然生物体内绝大多数细胞都含有相同的基因,但这些基因如何表达才是产生不同细胞类型的原因,例如,肌肉细胞和神经元之间的区别。

Swiss-Army-Knife-for-Genomic-Data.jpg

在过去的十年里,测量单个细胞中基因表达的技术已经彻底改变了生物学。生物学家不再需要对组织内的许多细胞进行基因表达的平均,现在他们可以随时检测每个细胞中哪些基因是活跃的。

然而,计算能力却难以跟上这种数据爆炸的速度。例如,一次实验可以观察10万个细胞,并测量数十万个转录本(基因活跃时产生的RNA片段)的信息,从而产生数百亿个测序片段。单细胞测序的基因组数据可能会占用数TB的空间,并且在大型计算服务器上处理需要几个小时或几天的时间。

现在,一种新的软件工具可以利用普通笔记本电脑的计算能力,在30分钟左右的时间内处理大型基因组数据集。就像一把瑞士军刀,该工具可用于无数种不同的生物需求,并将有助于确保科学研究的可重复性。

该工具可以让任何人在线使用,现在另一个研究小组正在对该工具进行改编,以研究从筛查试验中收集的样本中的SARS-CoV-2病毒。

了解更多:

https://www.nature.com/articles/s41587-021-00870-2

这项研究是作为计算生物学和计算与数学科学Bren教授Lior Pachter(BS '94)和冰岛大学计算机科学教授Páll Melsted实验室之间的合作进行的。Melsted与研究生Sina Booeshaghi(2019年硕士)是共同第一作者。描述该研究的论文于2021年4月1日出现在《自然生物技术》杂志上。

"有很多例子表明,不同的小组使用不同的技术来研究相同的组织,例如,大脑,"Booeshaghi说。"用同一个引擎,也就是我们的技术来处理所有这些数据,有利于整合数据。速度快、效率高,而且可以轻松进行再处理,这对科学的一致性和可重复性非常重要。"

这些工具的易用性、低成本和模块化,将使人类细胞图谱和脑计划细胞普查网络等大型联合体的基因组数据预处理具有一致性和可重复性。

查看评论
created by ceallan