Frage

Dies ist eine Suppe aus einer Wordpress Post Detailseite:

content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))

Ich möchte das umschließende div Tag wegzulassen, wenn item['content'] zuweisen. Gibt es eine Möglichkeit, alle Kind-Tags eines Tags in Unicode zu machen? So etwas wie:

item['content'] = content.contents.__unicode__()

Das gibt mir einen einzigen Unicode-String statt einer Liste.

War es hilfreich?

Lösung

Haben Sie versucht:

unicode(content)

Es wandelt content Markup zu einem einzigen Unicode-String.

Edit: Wenn Sie das umschließende Tag nicht wollen, versuchen Sie:

content.renderContents()
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top