フィロバイオパイソンビルディングツリー
質問
私はバイオパイソン、フィロモジュールでツリーを構築しようとしています。
私がこれまでに行ったのは、このイメージです:
各名前には4桁の番号が続き、数字が続きます。この数値には、シーケンスが表される回数を指します。つまり、1578-22は、ノードが22シーケンスを表す必要があることを意味します。
シーケンスが揃ったファイルが揃っています。 ファイル
ツリーを構築する距離を持つファイル: ファイル
だから今、私はノードの各サイズを変更する方法を知っています。各ノードのサイズは異なります。これは、異なる値の配列を簡単に実行することです。
fh = open(MEDIA_ROOT + "groupsnp.txt")
list_size = {}
for line in fh:
if '>' in line:
labels = line.split('>')
label = labels[-1]
label = label.split()
num = line.split('-')
size = num[-1]
size = size.split()
for lab in label:
for number in size:
list_size[lab] = int(number)
a = array(list_size.values())
しかし、配列は任意です。正しいノードサイズを右ノードに入れたいと思います。これを試しました。
for elem in list_size.keys():
if labels == elem:
Phylo.draw_graphviz(tree_xml, prog="neato", node_size=a)
しかし、私がIFステートメントを使用するとき、何も現れません。
とにかくこれをしている?
本当に感謝します!
みなさん、ありがとう
解決
私はついにこれを機能させました。基本的な前提は、あなたが labels/nodelist
あなたを構築するために node_sizes
. 。このようにして、それらは適切に相関します。ツリーを100%見せるためのいくつかの重要なオプションが欠けていると確信していますが、ノードサイズが適切に表示されているようです。
#basically a stripped down rewrite of Phylo.draw_graphviz
import networkx, pylab
from Bio import Phylo
#taken from draw_graphviz
def get_label_mapping(G, selection):
for node in G.nodes():
if (selection is None) or (node in selection):
try:
label = str(node)
if label not in (None, node.__class__.__name__):
yield (node, label)
except (LookupError, AttributeError, ValueError):
pass
kwargs={}
tree = Phylo.read('tree.dnd', 'newick')
G = Phylo.to_networkx(tree)
Gi = networkx.convert_node_labels_to_integers(G, discard_old_labels=False)
node_sizes = []
labels = dict(get_label_mapping(G, None))
kwargs['nodelist'] = labels.keys()
#create our node sizes based on our labels because the labels are used for the node_list
#this way they should be correct
for label in labels.keys():
if str(label) != "Clade":
num = label.name.split('-')
#the times 50 is just a guess on what would look best
size = int(num[-1]) * 50
node_sizes.append(size)
kwargs['node_size'] = node_sizes
posi = networkx.pygraphviz_layout(Gi, 'neato', args='')
posn = dict((n, posi[Gi.node_labels[n]]) for n in G)
networkx.draw(G, posn, labels=labels, node_color='#c0deff', **kwargs)
pylab.show()
結果の木
所属していません StackOverflow