Espressione regolare senza distinzione tra maiuscole e minuscole senza ricompilare?

https://stackoverflow.com/questions/500864

20-08-2019
|

Domanda

In Python, posso compilare un'espressione regolare in modo che non faccia distinzione tra maiuscole e minuscole utilizzando re.compile:

>>> s = 'TeSt'
>>> casesensitive = re.compile('test')
>>> ignorecase = re.compile('test', re.IGNORECASE)
>>> 
>>> print casesensitive.match(s)
None
>>> print ignorecase.match(s)
<_sre.SRE_Match object at 0x02F0B608>

C'è un modo per fare lo stesso, ma senza usare re.compile.Non riesco a trovare nulla di simile a Perl i suffisso (es. m/test/i) nella documentazione.

Soluzione

Passa re.IGNORECASE al flags parametro di search , match o sub :

re.search('test', 'TeSt', re.IGNORECASE)
re.match('test', 'TeSt', re.IGNORECASE)
re.sub('test', 'xxxx', 'Testing', flags=re.IGNORECASE)

Altri suggerimenti

Puoi anche eseguire ricerche senza distinzione tra maiuscole e minuscole utilizzando la ricerca / corrispondenza senza il flag IGNORECASE (testato in Python 2.7.3):

re.search(r'(?i)test', 'TeSt').group()    ## returns 'TeSt'
re.match(r'(?i)test', 'TeSt').group()     ## returns 'TeSt'

Il marcatore senza distinzione tra maiuscole e minuscole, (?i) può essere incorporato direttamente nel modello regex:

>>> import re
>>> s = 'This is one Test, another TEST, and another test.'
>>> re.findall('(?i)test', s)
['Test', 'TEST', 'test']

È inoltre possibile definire la distinzione tra maiuscole e minuscole durante la compilazione del modello:

pattern = re.compile('FIle:/+(.*)', re.IGNORECASE)

#'re.IGNORECASE' for case insensitive results short form re.I
#'re.match' returns the first match located from the start of the string. 
#'re.search' returns location of the where the match is found 
#'re.compile' creates a regex object that can be used for multiple matches

 >>> s = r'TeSt'   
 >>> print (re.match(s, r'test123', re.I))
 <_sre.SRE_Match object; span=(0, 4), match='test'>
 # OR
 >>> pattern = re.compile(s, re.I)
 >>> print(pattern.match(r'test123'))
 <_sre.SRE_Match object; span=(0, 4), match='test'>

Nelle importazioni

import re

Nell'elaborazione in fase di esecuzione:

RE_TEST = r'test'
if re.match(RE_TEST, 'TeSt', re.IGNORECASE):

Va detto che non lo uso re.compile è uno spreco.Ogni volta che viene chiamato il metodo match precedente, verrà compilata l'espressione regolare.Questa è una pratica errata anche in altri linguaggi di programmazione.Quanto segue è la pratica migliore.

Nell'inizializzazione dell'app:

self.RE_TEST = re.compile('test', re.IGNORECASE)

Nell'elaborazione in fase di esecuzione:

if self.RE_TEST.match('TeSt'):

Per eseguire operazioni senza distinzione tra maiuscole e minuscole, fornire re.IGNORECASE

>>> import re
>>> test = 'UPPER TEXT, lower text, Mixed Text'
>>> re.findall('text', test, flags=re.IGNORECASE)
['TEXT', 'text', 'Text']

e se vogliamo sostituire il testo corrispondente al caso ...

>>> def matchcase(word):
        def replace(m):
            text = m.group()
            if text.isupper():
                return word.upper()
            elif text.islower():
                return word.lower()
            elif text[0].isupper():
                return word.capitalize()
            else:
                return word
        return replace

>>> re.sub('text', matchcase('word'), test, flags=re.IGNORECASE)
'UPPER WORD, lower word, Mixed Word'

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow