質問

どのようにして作成しても済む配列のジェネレータオブジェクト?

私の問題:

>>> import numpy
>>> def gimme():
...   for x in xrange(10):
...     yield x
...
>>> gimme()
<generator object at 0x28a1758>
>>> list(gimme())
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> numpy.array(xrange(10))
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> numpy.array(gimme())
array(<generator object at 0x28a1758>, dtype=object)
>>> numpy.array(list(gimme()))
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

この熟に発生する出力変えていきたいですね、配列になります。しかし、配列のコンストラクタは繰り返し処理を実行し、発電機、その店舗の発生そのものです。行動したいという思いを込めても済むから.配列(リストの熟())には、いくら、メモリのオーバーヘッド、中間リストの最後の配列のメモリでも同時に行います。ありスペース効率的な方法は何でしょうか?

役に立ちましたか?

解決

Numpy 配列では、Python リストとは異なり、作成時に長さを明示的に設定する必要があります。これは、各項目のスペースをメモリ内で連続的に割り当てるために必要です。連続割り当ては numpy 配列の重要な機能です。これとネイティブ コードの実装を組み合わせることで、通常のリストよりもはるかに高速に操作を実行できるようになります。

これを念頭に置くと、次のいずれかを行わない限り、ジェネレーター オブジェクトを取得して配列に変換することは技術的に不可能です。

  1. 実行時に生成される要素の数を予測できます。

    my_array = numpy.empty(predict_length())
    for i, el in enumerate(gimme()): my_array[i] = el
    
  2. 要素を中間リストに保存したいと考えています。

    my_array = numpy.array(list(gimme()))
    
  3. 2 つの同一のジェネレーターを作成し、最初のジェネレーターを実行して全長を見つけ、配列を初期化してから、再度ジェネレーターを実行して各要素を見つけることができます。

    length = sum(1 for el in gimme())
    my_array = numpy.empty(length)
    for i, el in enumerate(gimme()): my_array[i] = el
    

1 おそらくあなたが探しているものです。 2 スペース効率が悪く、 3 時間効率が悪くなります (発電機を 2 回通過する必要があります)。

他のヒント

のGoogleこのstackoverflowの結果の後ろに、私は<のhref = "http://docs.scipy.org/doc/numpy/reference/generated/numpy.fromiter.html" のrel = "noreferrer" があることがわかりました> numpy.fromiter(data, dtype, count)する。デフォルトのcount=-1は反復可能からすべての要素を取ります。これは、明示的に設定することdtypeが必要です。私の場合、これは働いています:

numpy.fromiter(something.generate(from_this_input), float)

もしnumpy.fromiter()と発電機からの1Dアレイを作成することができるが、

は、numpy.stackと発電機からN次元配列を作成することができます:

>>> mygen = (np.ones((5, 3)) for _ in range(10))
>>> x = numpy.stack(mygen)
>>> x.shape
(10, 5, 3)

また、1次元配列のために働くます:

>>> numpy.stack(2*i for i in range(10))
array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

numpy.stackが内部発生を消費しarrays = [asanyarray(arr) for arr in arrays]と中間リストを作成していることに留意されたいです。実装はここを見つけることができます。

やや接線が、あなたのジェネレータはリスト内包されている場合は、より効果的に(私はこの記事を見た後、自分のコードでこれを発見した)。

あなたの結果を得るためにnumpy.whereを使用することができます

vstack, hstack, は、 dstack 機能で入力として発電機の性の多次元配列.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top