¿Cómo pasar de la lista de palabras a una lista de letras distintas en Python

https://stackoverflow.com/questions/2245903

20-09-2019
|

Pregunta

El uso de Python, estoy tratando de convertir una frase de palabras en una lista plana de todas las letras distintas en esa frase.

Aquí está mi código actual:

words = 'She sells seashells by the seashore'

ltr = []

# Convert the string that is "words" to a list of its component words
word_list = [x.strip().lower() for x in words.split(' ')]

# Now convert the list of component words to a distinct list of
# all letters encountered.
for word in word_list:
    for c in word:
        if c not in ltr:
            ltr.append(c)

print ltr

Este código devuelve ['s', 'h', 'e', 'l', 'a', 'b', 'y', 't', 'o', 'r'], que es correcta, pero hay una manera más Pythonic a esta respuesta, probablemente usando listas por comprensión / set?

Cuando intento de combinar anidación lista de comprensión y filtrado, consigo listas de listas en lugar de una lista plana.

El orden de las letras distintas en la lista final (ltr) no es importante; Lo que es crucial es que sean únicos.

Solución

Conjuntos ofrecen una solución sencilla y eficaz.

words = 'She sells seashells by the seashore'

unique_letters = set(words.lower())
unique_letters.discard(' ') # If there was a space, remove it.

Otros consejos

Hacer ltr un conjunto y cambiar su cuerpo un poco de bucle:

ltr = set()

for word in word_list:
    for c in word:
       ltr.add(c)

O usando una lista por comprensión:

ltr = set([c for word in word_list for c in word])

set([letter.lower() for letter in words if letter != ' '])

Editar : Yo sólo lo intentó y encontró que esto también funciona (tal vez esto es lo que se refería a SilentGhost):

set(letter.lower() for letter in words if letter != ' ')

Y si es necesario tener una lista en lugar de un conjunto, puede

list(set(letter.lower() for letter in words if letter != ' '))

>>> set('She sells seashells by the seashore'.replace(' ', '').lower())
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])
>>> set(c.lower() for c in 'She sells seashells by the seashore' if not c.isspace())
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])
>>> from itertools import chain
>>> set(chain(*'She sells seashells by the seashore'.lower().split()))
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])

Aquí hay algunos tiempos hechos con py3k:

>>> import timeit
>>> def t():                    # mine (see history)
    a = {i.lower() for i in words}
    a.discard(' ')
    return a

>>> timeit.timeit(t)
7.993071812372081
>>> def b():                    # danben
    return set(letter.lower() for letter in words if letter != ' ')

>>> timeit.timeit(b)
9.982847967921138
>>> def c():                    # ephemient in comment
    return {i.lower() for i in words if i != ' '}

>>> timeit.timeit(c)
8.241267610375516
>>> def d():                    #Mike Graham
    a = set(words.lower())
    a.discard(' ')
    return a

>>> timeit.timeit(d)
2.7693045186082372

set(l for w in word_list for l in w)

words = 'She sells seashells by the seashore'

ltr = list(set(list(words.lower())))
ltr.remove(' ')
print ltr

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow