Wie kann ich HTML-Escape-Zeichen / Entitäten als Text extrahieren, wenn Web-Schaben? (Rubin & nokogiri)

StackOverflow https://stackoverflow.com/questions/2122118

  •  22-09-2019
  •  | 
  •  

Frage

In meinem Rubin + mechanize (nokogiri) Skript Ich benutze dieses Stück Code:

row.at_xpath('td[3]/div[1]/a/text()').to_s.strip

auf einem Forum, in dem die Post-Titel html aussieht wie:

<a href="showthread.php?t=233891" >&lt;/body&gt; on Footer ?</a>

und ich erhalte von XPath diese Zeichenfolge &lt;/body&gt; on Footer ?

Ich mag bekommen, was ich im Web-Browser sehen kann </body> on Footer ?

Wie kann ich das tun, für alle HTML-Escape-Zeichen / Entitäten?

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top