大豆发源于中国,是世界上70%可食用蛋白的来源,蛋白质含量在34%以上,远超牛肉。因此,如何让大豆更高产、更耐旱、更抗虫抗病,就成了科学家解决人类粮食问题的突破口。
7月15日,古奥基因宣布在阿里云上建设的大豆多组学整合数据库正式上线。这对于科学家快速确定潜在功能基因、缩短实验验证周期有很大帮助。比如,育种学家可以从这个宝贵的“图书馆”中找到加快育种进程的基因信息,精准的培育出高产品种。
此前,构建如此庞大的数据库对于IT技术来说是一个很大的挑战。数据维度多,样本量大,其参与计算的数据往往是TB级。以大豆数据库为例,整个过程需要对1000个以上样品进行重测序、转录组分析,以本地中等规模集群计算需要15-20天。
采用阿里云技术之后,古奥基因可根据不同的数据量对节点进行动态的调整和扩展,甚至能同时开启上千台计算节点分析,在12小时内完成全部分析。此外,计算的结果可以直接入库,无需像本地集群一样需要再次上传。
多组学联合分析是当下生命科学研究的热门方向。上述数据库整合了基因组学、转录组学、表型组学、文献及公共数据等多组学知识,支持以基因为线索一键查询基因多态性、表达量及基因定位相关数据。
由云计算掀起的计算革命,正在加速解码生命天书。据了解,目前国内70%以上的基因测序公司和研究机构都在使用阿里云的服务。