Нокогири:Как выделить узлы путем сопоставления текста?

https://stackoverflow.com/questions/1474688

16-09-2019
|

Вопрос

Если у меня есть куча элементов, таких как:

<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>

Есть ли встроенный метод nokogiri, который бы выдавал мне все, например, p элементов, содержащих текст "Apple"?(приведенный выше пример элемента будет соответствовать, например).

Решение

Nokogiri может сделать это (сейчас), используя расширения jQuery для CSS:

require 'nokogiri'

html = '
<html>
  <body>
    <p>foo</p>
    <p>bar</p>
  </body>
</html>
'

doc = Nokogiri::HTML(html)
doc.at('p:contains("bar")').text.strip
=> "bar"

Другие советы

Вот XPath, который работает:

require 'nokogiri'

doc = Nokogiri::HTML(DATA)
p doc.xpath('//li[contains(text(), "Apple")]')

__END__
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>

Надеюсь, это поможет

Вы также можете сделать это очень легко с помощью Никкоу:

doc.search('p').text_includes('bar')

Попробуйте использовать этот XPath:

p = doc.xpath('//p[//*[contains(text(), "Apple")]]')

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow