Qual é a maneira mais simples de estender uma matriz numpy em 2 dimensões?

https://stackoverflow.com/questions/877479

22-08-2019
|

Pergunta

Eu tenho uma matriz 2d que tem esta aparência:

XX
xx

O que é a forma mais eficiente para adicionar uma linha extra e coluna:

xxy
xxy
yyy

Para pontos de bônus, eu gostaria de também ser capaz de nocautear linhas e colunas individuais, assim, por exemplo na matriz abaixo eu gostaria de ser capaz de bater para fora toda a um deixando apenas o x de - especificamente Eu estou tentando excluir a linha enésima e a coluna n, ao mesmo tempo - e eu quero ser capaz de fazer isso o mais rápido possível:

xxaxx
xxaxx
aaaaa
xxaxx
xxaxx

Solução

O mais curto em termos de linhas de código que eu posso pensar é para a primeira pergunta.

>>> import numpy as np
>>> p = np.array([[1,2],[3,4]])

>>> p = np.append(p, [[5,6]], 0)
>>> p = np.append(p, [[7],[8],[9]],1)

>>> p
array([[1, 2, 7],
   [3, 4, 8],
   [5, 6, 9]])

E a para a segunda pergunta

    p = np.array(range(20))
>>> p.shape = (4,5)
>>> p
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])
>>> n = 2
>>> p = np.append(p[:n],p[n+1:],0)
>>> p = np.append(p[...,:n],p[...,n+1:],1)
>>> p
array([[ 0,  1,  3,  4],
       [ 5,  6,  8,  9],
       [15, 16, 18, 19]])

Outras dicas

Uma resposta alternativa útil para a primeira pergunta, usando os exemplos de de tomeedee resposta, seria a utilização de numpy vstack e column_stack métodos:

Dada uma matriz p,

>>> import numpy as np
>>> p = np.array([ [1,2] , [3,4] ])

uma matriz aumentada pode ser gerado por:

>>> p = np.vstack( [ p , [5 , 6] ] )
>>> p = np.column_stack( [ p , [ 7 , 8 , 9 ] ] )
>>> p
array([[1, 2, 7],
       [3, 4, 8],
       [5, 6, 9]])

Estes métodos podem ser conveniente, na prática, que np.append () uma vez que permitem 1D matrizes para ser anexado a uma matriz, sem qualquer modificação, em contraste com o seguinte cenário:

>>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ] )
>>> p = np.append( p , [ 7 , 8 , 9 ] , 1 )
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append
    return concatenate((arr, values), axis=axis)
ValueError: arrays must have same number of dimensions

Em resposta à segunda questão, uma boa maneira de remover linhas e colunas é usar a indexação de matriz lógica da seguinte forma:

Dada uma matriz p,

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )

suponha que deseja remover a linha 1 e coluna 2:

>>> r , c = 1 , 2
>>> p = p [ np.arange( p.shape[0] ) != r , : ] 
>>> p = p [ : , np.arange( p.shape[1] ) != c ]
>>> p
array([[ 0,  1,  3,  4],
       [10, 11, 13, 14],
       [15, 16, 18, 19]])

Nota - para usuários Matlab reformadas - se você queria fazer isso em uma frase você precisa índice duas vezes:

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )    
>>> p = p [ np.arange( p.shape[0] ) != r , : ] [ : , np.arange( p.shape[1] ) != c ]

Esta técnica pode também ser estendido para remover sets de linhas e colunas, por isso, se queríamos para remover linhas 0 e 2 e colunas 1, 2 e 3 que poderíamos usar numpy de setdiff1d função para gerar o índice lógico desejado:

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> r = [ 0 , 2 ]
>>> c = [ 1 , 2 , 3 ]
>>> p = p [ np.setdiff1d( np.arange( p.shape[0] ), r ) , : ] 
>>> p = p [ : , np.setdiff1d( np.arange( p.shape[1] ) , c ) ]
>>> p
array([[ 5,  9],
       [15, 19]])

Outra solução elegante para a primeira pergunta pode ser o comando insert:

p = np.array([[1,2],[3,4]])
p = np.insert(p, 2, values=0, axis=1) # insert values before column 2

Leads para:

array([[1, 2, 0],
       [3, 4, 0]])

insert pode ser mais lenta do que append mas permite que você preencha toda linha / coluna com um valor facilmente.

Quanto ao segunda pergunta , delete foi sugerido antes:

p = np.delete(p, 2, axis=1)

que restaura a matriz original novamente:

array([[1, 2], [3, 4]])

Acho que é muito mais fácil de "estender" através da atribuição de uma matriz maior. Por exemplo.

import numpy as np p = np.array([[1,2], [3,4]]) g = np.array(range(20)) g.shape = (4,5) g[0:2, 0:2] = p

Aqui estão as matrizes:

p

array([[1, 2], [3, 4]])

g:

array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]])

eo g resultante após a atribuição:

array([[ 1, 2, 2, 3, 4], [ 3, 4, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]])

resposta à primeira pergunta:

Use numpy.append.

http: //docs.scipy. org / doc / numpy / reference / gerado / numpy.append.html # numpy.append

resposta à segunda pergunta:

Use numpy.delete

http://docs.scipy.org/doc/ numpy / reference / gerado / numpy.delete.html

Você pode usar:

>>> np.concatenate([array1, array2, ...])

por exemplo.

>>> import numpy as np >>> a = [[1, 2, 3],[10, 20, 30]] >>> b = [[100,200,300]] >>> a = np.array(a) # not necessary, but numpy objects prefered to built-in >>> b = np.array(b) # "^ >>> a array([[ 1, 2, 3], [10, 20, 30]]) >>> b array([[100, 200, 300]]) >>> c = np.concatenate([a,b]) >>> c array([[ 1, 2, 3], [ 10, 20, 30], [100, 200, 300]]) >>> print c [[ 1 2 3] [ 10 20 30] [100 200 300]]

~ - + - ~ - + - ~ - + - ~

Às vezes, você vai se deparar com problemas, se um objeto de matriz numpy é inicializado com valores incompletos para sua propriedade de forma. Esse problema é corrigido através da atribuição à propriedade forma a tupla:. (Array_length, element_length)

Nota: Aqui, 'array_length' e 'element_length' são parâmetros inteiros, que você substituir valores para. A 'tuple' é apenas um par de números entre parênteses.

por exemplo.

>>> import numpy as np >>> a = np.array([[1,2,3],[10,20,30]]) >>> b = np.array([100,200,300]) # initialize b with incorrect dimensions >>> a.shape (2, 3) >>> b.shape (3,) >>> c = np.concatenate([a,b]) Traceback (most recent call last): File "<pyshell#191>", line 1, in <module> c = np.concatenate([a,b]) ValueError: all the input arrays must have same number of dimensions >>> b.shape = (1,3) >>> c = np.concatenate([a,b]) >>> c array([[ 1, 2, 3], [ 10, 20, 30], [100, 200, 300]])

talvez você precisa disso.

>>> x = np.array([11,22]) >>> y = np.array([18,7,6]) >>> z = np.array([1,3,5]) >>> np.concatenate((x,y,z)) array([11, 22, 18, 7, 6, 1, 3, 5])

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow