سؤال

افترض أن لدي بعض كود HTML، مثل هذا (تم إنشاؤه من علامة تخفيض أو نسيج أو شيء ما):

<h1>A header</h1>
<p>Foo</p>
<h2>Another header</h2>
<p>More content</p>
<h2>Different header</h2>
<h1>Another toplevel header
<!-- and so on -->

كيف يمكنني توليد جدول محتوياته باستخدام بيثون؟

هل كانت مفيدة؟

المحلول

استخدام محلل HTML مثل lxml أو جميلة للعثور على جميع عناصر الرأس.

نصائح أخرى

إليك مثال على استخدام LXML و XPath.

from lxml import etree
doc = etree.parse("test.xml")
for node in doc.xpath('//h1|//h2|//h3|//h4|//h5'):
    print node.tag, node.text
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top