Comment supprimer les doublons de la liste Python et maintenir l'ordre? [dupliquer]
Question
Cette question a déjà une réponse ici:
À partir d’une liste de chaînes, je souhaite la trier par ordre alphabétique et supprimer les doublons. Je sais que je peux le faire:
from sets import Set
[...]
myHash = Set(myList)
mais je ne sais pas comment extraire les membres de la liste du hachage par ordre alphabétique.
Je ne suis pas marié au hash, donc tout moyen d'y parvenir fonctionnera. De plus, les performances ne sont pas un problème, je préférerais donc une solution exprimée clairement en code à une solution rapide mais plus opaque.
Autres conseils
Si votre entrée est déjà triée, il existe peut-être un moyen plus simple de le faire:
from operator import itemgetter
from itertools import groupby
unique_list = list(map(itemgetter(0), groupby(yourList)))
Si vous souhaitez conserver l'ordre de la liste d'origine, utilisez simplement OrderedDict avec None
comme valeur.
En Python2:
from collections import OrderedDict
from itertools import izip, repeat
unique_list = list(OrderedDict(izip(my_list, repeat(None))))
En Python3, c'est encore plus simple:
from collections import OrderedDict
from itertools import repeat
unique_list = list(OrderedDict(zip(my_list, repeat(None))))
Si vous n'aimez pas les itérateurs (zip et répétition), vous pouvez utiliser un générateur (fonctionne à la fois en 2 & amp; 3):
from collections import OrderedDict
unique_list = list(OrderedDict((element, None) for element in my_list))
Si vous recherchez la clarté, plutôt que la rapidité, je pense que c'est très clair:
def sortAndUniq(input):
output = []
for x in input:
if x not in output:
output.append(x)
output.sort()
return output
C'est O (n ^ 2) cependant, avec l'utilisation répétée de not in pour chaque élément de la liste d'entrée.
> mais je ne sais pas comment récupérer les membres de la liste dans le hachage par ordre alphabétique.
Ce n’est pas vraiment votre question principale, mais pour référence future, la réponse de Rod à l’aide de sorted
peut être utilisée pour parcourir les clés de dict
dans l’ordre trié:
for key in sorted(my_dict.keys()):
print key, my_dict[key]
...
et aussi parce que les tuple
sont ordonnés par le premier membre du tuple, vous pouvez faire la même chose avec items
:
for key, val in sorted(my_dict.items()):
print key, val
...
Pour les données de chaîne
output = []
def uniq(input):
if input not in output:
output.append(input)
print output