¿Cómo dividir cadenas en texto y número?
Pregunta
Me gustaría dividir cadenas como estas
'foofo21'
'bar432'
'foobar12345'
en
['foofo', '21']
['bar', '432']
['foobar', '12345']
¿Alguien sabe una manera fácil y sencilla de hacer esto en Python?
Solución
Me acercaría a esto usando re.match
de la siguiente manera:
match = re.match(r"([a-z]+)([0-9]+)", 'foofo21', re.I)
if match:
items = match.groups()
# items is ("foo", "21")
Otros consejos
>>> def mysplit(s): ... head = s.rstrip('0123456789') ... tail = s[len(head):] ... return head, tail ... >>> [mysplit(s) for s in ['foofo21', 'bar432', 'foobar12345']] [('foofo', '21'), ('bar', '432'), ('foobar', '12345')] >>>
>>> r = re.compile("([a-zA-Z]+)([0-9]+)")
>>> m = r.match("foobar12345")
>>> m.group(1)
'foobar'
>>> m.group(2)
'12345'
Entonces, si tiene una lista de cadenas con ese formato:
import re
r = re.compile("([a-zA-Z]+)([0-9]+)")
strings = ['foofo21', 'bar432', 'foobar12345']
print [r.match(string).groups() for string in strings]
Salida:
[('foofo', '21'), ('bar', '432'), ('foobar', '12345')]
Otra opción más:
>>> [re.split(r'(\d+)', s) for s in ('foofo21', 'bar432', 'foobar12345')]
[['foofo', '21', ''], ['bar', '432', ''], ['foobar', '12345', '']]
Siempre soy el que saca el findall () =)
>>> strings = ['foofo21', 'bar432', 'foobar12345']
>>> [re.findall(r'(\w+?)(\d+)', s)[0] for s in strings]
[('foofo', '21'), ('bar', '432'), ('foobar', '12345')]
Tenga en cuenta que estoy usando una expresión regular más simple (menos escribir) que la mayoría de las respuestas anteriores.
import re
s = raw_input()
m = re.match(r"([a-zA-Z]+)([0-9]+)",s)
print m.group(0)
print m.group(1)
print m.group(2)
sin usar regex, usando la función incorporada isdigit (), solo funciona si la parte inicial es texto y la última parte es número
def text_num_split(item):
for index, letter in enumerate(item, 0):
if letter.isdigit():
return [item[:index],item[index:]]
print(text_num_split("foobar12345"))
SALIDA:
['foobar', '12345']
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow