Novato a RegEx

https://stackoverflow.com/questions/3196493

02-10-2019
|

Pregunta

Tengo esta cadena de ejemplo:

&Lt;! [If Gte Mso 9]>&Lt;Xml>  &Lt;Br /> &Lt;O:Office Document Settings>  &Lt;Br /> &Lt;O:Allow Png/>  &Lt;Br /> &Lt;/O:Off...

Y me gustaría apuntar específicamente a cualquier cosa que se inicie en un "«" y termina en un ">", y reemplazarlo con ningún espacio "".

Estado usando Rubular, pero estoy teniendo un momento difícil aprender cómo configurar éste para arriba.

Cualquier IDAES?

Solución

result = subject.gsub(/&Lt;[^>]*>/, '')

debe hacer el truco.

medios [^>]*:. Ajuste de cualquier número de caracteres excepto >

Otros consejos

El patrón es simple como que:

&Lt;[^>]*>

Sólo una sugerencia, yo uso Rubular para ayudar con la expresión regular escribiendo una depuración.

Seguro que parece como si estuviera tratando de análisis sintáctico XML con las expresiones regulares, que es una forma muy difícil y frágil para extraer los datos que necesita de ese documento.

podría estar mejor analizarlo y seleccionando la información que necesita el uso de XPath o DOM.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow