Formatação de alinhamento decimal em python

https://stackoverflow.com/questions/1025379

06-07-2019
|

Pergunta

este deve ser fácil.

Aqui está minha matriz (em vez de um método de geração de matrizes de testes representativos):

>>> ri = numpy.random.randint
>>> ri2 = lambda x: ''.join(ri(0,9,x).astype('S'))
>>> a = array([float(ri2(x)+ '.' + ri2(y)) for x,y in ri(1,10,(10,2))])
>>> a
array([  7.99914000e+01,   2.08000000e+01,   3.94000000e+02,
         4.66100000e+03,   5.00000000e+00,   1.72575100e+03,
         3.91500000e+02,   1.90610000e+04,   1.16247000e+04,
         3.53920000e+02])

Eu quero uma lista de strings onde ' n'.join (list_o_strings) imprimiria:

Eu quero fazer um space bloco para a esquerda e a direita (mas não mais do que o necessário).

Eu quero um zero após o decimal, se isso é tudo o que é depois do decimal.

Eu não quero notação científica.

..e eu não quero perder dígitos significativos. (Em 353.98000000000002, o 2 não é significativo)

Sim, é bom querer ..

Python 2.5 %g, %fx.x, etc. estão confusos para mim, ou não podem fazer isso. Eu não tentei import decimal ainda. Eu não consigo ver isso Numpy também (embora, o array.__str__ e array.__repr__ são decimais alinhados (mas às vezes retornam científicos).

Ah, e a velocidade conta. Estou lidando com grandes matrizes aqui.

Minhas abordagens de solução atuais são:

para str (a) e analisar os suportes de Numpy
para str (e) cada elemento na matriz e dividir ('.') Em seguida, pad e reconstrua
para A.astype ('s'+str (i)) onde eu é o max (len (str (a))), depois pad

Parece que deve haver alguma solução pronta para uso por aí ... (mas não é necessário)

A sugestão superior falha com quando dtype é float64:

>>> a
array([  5.50056103e+02,   6.77383566e+03,   6.01001513e+05,
         3.55425142e+08,   7.07254875e+05,   8.83174744e+02,
         8.22320510e+01,   4.25076609e+08,   6.28662635e+07,
         1.56503068e+02])
>>> ut0 = re.compile(r'(\d)0+$')
>>> thelist = [ut0.sub(r'\1', "%12f" % x) for x in a]
>>> print '\n'.join(thelist)
  550.056103
 6773.835663
601001.513
355425141.8471
707254.875038
  883.174744
   82.232051
425076608.7676
62866263.55
  156.503068

Solução

Desculpe, mas após uma investigação completa, não consigo encontrar nenhuma maneira de executar a tarefa necessária sem um mínimo de pós-processamento (para retirar os zeros que você não deseja ver); algo como:

import re
ut0 = re.compile(r'(\d)0+$')

thelist = [ut0.sub(r'\1', "%12f" % x) for x in a]

print '\n'.join(thelist)

é rápido e conciso, mas quebra sua restrição de ser "pronta para uso"-é, em vez disso, uma combinação modular de formatação geral (que quase faz o que você quer, mas deixa zero que você deseja se esconder) e um re. para remover zeros traseiros indesejados. Praticamente, acho que faz exatamente o que você precisa, mas suas condições são declaradas, acredito, com restrição demais.

Editar: A pergunta original foi editada para especificar dígitos mais significativos, não requer espaço principal extra além do que é necessário para o maior número e fornecer um novo exemplo (onde minha sugestão anterior, acima, não corresponde à saída desejada). O trabalho de remover o espaço em branco que é comum a um monte de cordas é melhor realizado com textwrap.dedent - Mas isso funciona em uma única string (com linhas novas) enquanto a saída necessária é uma lista de strings. Não tem problema, vamos juntar as linhas, deduzi -las e dividi -las novamente:

import re
import textwrap

a = [  5.50056103e+02,   6.77383566e+03,   6.01001513e+05,
         3.55425142e+08,   7.07254875e+05,   8.83174744e+02,
         8.22320510e+01,   4.25076609e+08,   6.28662635e+07,
         1.56503068e+02]

thelist = textwrap.dedent(
        '\n'.join(ut0.sub(r'\1', "%20f" % x) for x in a)).splitlines()

print '\n'.join(thelist)

emite:

      550.056103
     6773.83566
   601001.513
355425142.0
   707254.875
      883.174744
       82.232051
425076609.0
 62866263.5
      156.503068

Outras dicas

A formatação de string pythons pode imprimir apenas os decimais necessários (com %g) ou usar um conjunto fixo de decimais (com %f). No entanto, você deseja imprimir apenas os decimais necessários, exceto se o número for um número inteiro, você deseja um decimal e isso o torna complexo.

Isso significa que você acabaria com algo como:

def printarr(arr):
    for x in array:
        if math.floor(x) == x:
            res = '%.1f' % x
        else:
            res = '%.10g' % x
        print "%*s" % (15-res.find('.')+len(res), res)

Isso primeiro criará uma string com 1 decimal, se o valor for um número inteiro ou imprimirá com decimais automáticos (mas apenas até 10 números) se não for um número fracionário. Por fim, ele o imprimirá, ajustado para que o ponto decimal seja alinhado.

Provavelmente, porém, Numpy realmente faz o que você quer, porque você normalmente deseja que seja no modo exponencial se for muito longo.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow