在Python中有效获取基因组序列?
-
02-10-2019 - |
题
如何使用 Python 高效获取基因组序列?例如,从 .fa 文件或其他一些容易获得的格式?我基本上想要一个接口 fetch_seq(chrom,strand,start,end) 它将返回指定链上给定染色体上的序列 [start,end]。
类似地,是否有一个用于获取 phastCons 分数的编程 Python 接口?
谢谢。
解决方案
请参阅我在 Biostar 对您问题的回答:
将 SeqIO 与 Fasta 文件结合使用,您将获得文件中每个项目的记录对象。然后你可以这样做:
region = rec.seq[start:end]
拉出切片。使用标准库的好处是您不必担心原始 fasta 文件中的换行符。
其他提示
不隶属于 StackOverflow