Regexp для упрощения выхода на Yahoo отвечает Название подачи
Вопрос
Я пытаюсь разобрать ленты yahoo ответов - http://answers.yahoo.com/rsss/allq.Вопрос в том, что названия имеют
Категория]: Открытый вопрос:
В каждом титул, что я не хочу ... Я хочу написать Regexp, чтобы удалить это ...
Все, что мы можем сделать, чтобы удалить все буквы в старте [и первым: должен сделать это.
после :
Кроме того, нам нужно это тоже удалить.
Заранее спасибо за это, я также попытаюсь найти решение самого.
Решение
Вы считаете, что используя Yahoo's Yql. Сервис для анализа этой подачи (или других веб-страниц)?
У них уже есть образец запросов для вас, чтобы получить данные о ответах Yahoo:
answers.getbycategory: http://developer.yahoo.com/yql/console/#h=Select%20.*% 20From% 20answers.getbycategory% 20-го места% 20Category_id% 3D2115500137% 20 и% 20Type% 3D% 22RESTED% 22
answers.getbyuser: http://developer.yahoo.com/yql/console/#h=Select%20.*% 20From% 20answers.getbyuser% 20-го места% 20USER_ID% 3D% 22ybamgthfaa% 22
answers.getQuestion: http://developer.yahoo.com/yql/console/#h=Select%20.*% 20From% 20answers.getQuestion% 20-го места% 20Question_id% 3D% 2220090526102023AAKRBCH% 22
Ответы. Iearch: http://developer.yahoo.com/yql/console/#h=Select%20.*% 20FROM% 20ANSWERS.Search% 20-го места% 20Query% 3D% 22CARS% 22% 20 и% 20CARTE_ID% 3D2115500137% 20 и% 20Type% 3D% 22RESTED% 22
(Просто FYI на случай, если вы не знали об этом удобном сервисе. Я использую его вместо экрана, соскоб с Regex.)
Другие советы
Следующее регулярное выражение должно выполнять работу:
^\[.*?:
Образец использования в C #:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
Что это делает с [
кронштейн и возьмите любые персонажи, пока он не совпадает :
и возьмите следующее место.
Надеюсь, это поможет, Том.
Спасибо @ CMPTRGEEKKEN за то, что указываю на не жадную вещь!