程翔仔细盯着屏幕,屏幕上的碱基对,时不时标出一段带问号的替代符号,时不时又是一段红色缺失替代符,或疏或密,带问号的替代符是远在火星扫描时就已经无法确定的碱基对,而红色的缺失替代符,则是因为火星传输数据到地球数据发生了丢失,漫长的距离,光是信号抵达都需要好几分钟,要做到传输不丢数据,代价太大。
以现在的技术能力,也没办法做到高效的确认重发机制。有眼前这个时间戳表示有信号没收到已经非常的不错。
“不少错漏啊。”程翔感慨,不过也没办法,搞研究就是这样,哪有那么多理想的条件,“不过,还能有这么多信息,已经相当的不错了。”
“知足吧。”
毕竟,前期最重要的任务,就是初步确定这个盒子的价值,确切的说,是这盒子里基因的价值。
眼下的工程文件,左侧的活动面板上是一个树形结构,里面有十个子节点,表示着从1到10号盒子的基因测序矢量图文档,双击就可以打开对应的数据视图。这款工程软件,就是银河研究所制定的。
有程翔的把关,一众专业生物专业的专家教授不断给出意见,这款软件在使用上自然非常顺利可靠。
现在最重要的工作是确定这份基因的研究价值,而这种类似解谜般的工作向来都是难度最高的,那种感觉,跟只告诉你前面那座大山里有宝藏,但是不知道埋哪里,要你自己去找一样。
大海捞针莫过于此。
程翔没有立刻去查基因的细节,想了想,“被发现的盒子,在内部一共有49个形状一致的小盒。”
“这也算是一个线索,既然如此。”
程翔想起了这款软件的一个功能,也是非常方便的功能,就是基因测序比对。
和常用的文档字符串比对一样,基因比对,则是将不同dna测序文档进行比对,比对的则是碱基对的排列组合是否一致。不一致的,会逐个做下标记,比对完成后,按快捷键f3,可以快速依次查每一个不同点。
“先比对下吧。”
“说不定就有了什么发现。”
探索过程最常见的就是试错,试错,自然也是从成本最低的开始,没有什么比这个更简单,想到这里,陈翔立刻将使用鼠标,选择全部文档,右键选择比对所有。进度条顿时展开,比对结果实时展示。
一份200b的dna图谱,足够存储16亿个碱基对信息。十份dna测序图谱同时比对,这个运算量一般的电脑根本撑不住。不过,得益于软件需求是一群专业生物研究工作者提出,所以算法早就考虑到了生物科学的特殊性。比对按照增量的方式进行,即时开始,即时出具实时结果,又可以随时终止。
而且,更别提,实验室大楼内部早就配置一部超算,复杂计算可以委托超算进行处理。以超算每秒10的17次方每秒的运算速度,区区两百亿数据量的比对工作,根本不值得一提。
进度条几乎是眨眼即过,比对的结果应声而出。
程翔紧紧盯住屏幕,屏幕上,一份dna碱基对比对视图已经绘制完成,十份视图全部重合的部分则打印白色,存在不同则会黄色标注,点击上去,还能到各编号视图在该位置时基因的实际情况。
不过因为显示和内存的关系,显示器同一时间只能显示一个区间段的结果。
这个区间分段足足十几万个。