Нокогири:Как выделить узлы путем сопоставления текста?
Вопрос
Если у меня есть куча элементов, таких как:
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
Есть ли встроенный метод nokogiri, который бы выдавал мне все, например, p элементов, содержащих текст "Apple"?(приведенный выше пример элемента будет соответствовать, например).
Решение
Nokogiri может сделать это (сейчас), используя расширения jQuery для CSS:
require 'nokogiri'
html = '
<html>
<body>
<p>foo</p>
<p>bar</p>
</body>
</html>
'
doc = Nokogiri::HTML(html)
doc.at('p:contains("bar")').text.strip
=> "bar"
Другие советы
Вот XPath, который работает:
require 'nokogiri'
doc = Nokogiri::HTML(DATA)
p doc.xpath('//li[contains(text(), "Apple")]')
__END__
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
Надеюсь, это поможет
Вы также можете сделать это очень легко с помощью Никкоу:
doc.search('p').text_includes('bar')
Попробуйте использовать этот XPath:
p = doc.xpath('//p[//*[contains(text(), "Apple")]]')
Не связан с StackOverflow