Expresiones regulares para simplificar Yahoo respuestas de alimentación Título
Pregunta
Estoy tratando de analizar la alimentación yahoo respuestas - http://answers.yahoo.com/rss / allq La cuestión es que los títulos tienen
[Categoría]: Pregunta abierta:
en cada título que no quiero ... Quiero escribir una expresión regular para eliminar este ...
cualquier cosa que podemos hacer para eliminar todas las cartas en la partida [y la primera:. Debe hacerlo
hay un espacio después de la :
también, tenemos que eliminar eso también.
Gracias por esto de antemano, yo también tratar de encontrar una solución a mí mismo.
Solución
Ha considerado el uso de Yahoo YQL servicio para analizar este feed (o en otras páginas web)?
Ya tienen consultas de ejemplo para que usted pueda obtener en Yahoo Respuestas de datos:
-
answers.getbycategory: http://developer.yahoo.com/yql/console/#h= seleccione% 20 *% 20from% 20answers.getbycategory% 20where% 20category_id% 3D2115500137% 20y% 20type% 3D% 22resolved% 22
-
answers.getbyuser: http://developer.yahoo.com/yql/console/#h= seleccione% 20% * 20from% 20answers.getbyuser% 20where% 20user_id% 3D% 22YbaMGtHFaa% 22
-
answers.getquestion: http://developer.yahoo.com/yql/console/#h= seleccione% 20% * 20from% 20answers.getquestion% 20where% 20question_id% 3D% 2220090526102023AAkRbch% 22
-
answers.search: http://developer.yahoo.com/yql/console/#h= seleccione% 20 *% 20from% 20answers.search% 20where% 20query% 3D% 22cars% 22% 20y% 20category_id% 3D2115500137% 20y% 20type% 3D% 22resolved% 22
(Como digo en caso de que no eran conscientes de este servicio conveniente. Lo uso en lugar de la pantalla de raspado con RegEx.)
Otros consejos
la siguiente expresión regular debe hacer el trabajo:
^\[.*?:
Ejemplo de uso en C #:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
Lo que hace es empezar con un soporte [
y tomar todos los caracteres hasta que coincida con un :
y tomar el espacio follwing.
Espero que esta ayuda, Tom.
Gracias @ cmptrgeekken para señalar la cosa no fuera codicioso!