Wie Inhalt eines Tags in Unicode in BeautifulSoup zu machen?
-
20-08-2019 - |
Frage
Dies ist eine Suppe aus einer Wordpress Post Detailseite:
content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))
Ich möchte das umschließende div
Tag wegzulassen, wenn item['content']
zuweisen. Gibt es eine Möglichkeit, alle Kind-Tags eines Tags in Unicode zu machen? So etwas wie:
item['content'] = content.contents.__unicode__()
Das gibt mir einen einzigen Unicode-String statt einer Liste.
Lösung
Haben Sie versucht:
unicode(content)
Es wandelt content
Markup zu einem einzigen Unicode-String.
Edit: Wenn Sie das umschließende Tag nicht wollen, versuchen Sie:
content.renderContents()
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow