Analog do Python da função Natsort do PHP (classifique uma lista usando um algoritmo de "ordem natural") [duplicado
Pergunta
Esta pergunta já tem uma resposta aqui:
Eu gostaria de saber se há algo semelhante a PHP Natsort função em python?
l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
l.sort()
dá:
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
Mas eu gostaria de obter:
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
ATUALIZAR
Base de solução ligada esse link
def try_int(s):
"Convert to integer if possible."
try: return int(s)
except: return s
def natsort_key(s):
"Used internally to get a tuple by which s is sorted."
import re
return map(try_int, re.findall(r'(\d+|\D+)', s))
def natcmp(a, b):
"Natural string comparison, case sensitive."
return cmp(natsort_key(a), natsort_key(b))
def natcasecmp(a, b):
"Natural string comparison, ignores case."
return natcmp(a.lower(), b.lower())
l.sort(natcasecmp);
Solução
A partir de minha resposta para Algoritmo de classificação natural:
import re
def natural_key(string_):
"""See http://www.codinghorror.com/blog/archives/001018.html"""
return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_)]
Exemplo:
>>> L = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
>>> sorted(L)
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
>>> sorted(L, key=natural_key)
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
Para apoiar strings unicode, .isdecimal()
deve ser usado em vez de .isdigit()
. Veja o exemplo em @Comentário de Phihag. Relacionado: Como revelar a propriedade de valor numérico Unicodes.
.isdigit()
também pode falhar (valor de retorno que não é aceito por int()
) para um bytestring no python 2 em alguns locais, por exemplo, ' xb2' ('²') na localidade CP1252 no Windows.
Outras dicas
Você pode conferir o terceiro Natsort Biblioteca em Pypi:
>>> import natsort
>>> l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
>>> natsort.natsorted(l)
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
Divulgação completa, eu sou o autor.
Esta função pode ser usada como o key=
argumento para sorted
no python 2.x e 3.x:
def sortkey_natural(s):
return tuple(int(part) if re.match(r'[0-9]+$', part) else part
for part in re.split(r'([0-9]+)', s))