Est-il possible d'afficher les numéros de ligne plus de 65535 lorsque vous validez un fichier XML à l'aide de LXML?

StackOverflow https://stackoverflow.com/questions/19826050

  •  05-07-2022
  •  | 
  •  

Question

J'essaie de valider un fichier XML avec environ 1 million de lignes à l'aide de LXML. Ceci est mon code.

import codecs
import lxml.etree as ET

xsd_file = codecs.open(r'test.xsd', 'rb', 'utf-8')
xml_file = codecs.open(r'test.xml', 'rb', 'utf-8')

xmlschema_doc = ET.parse(xsd_file)
xmlschema = ET.XMLSchema(xmlschema_doc)

doc = ET.parse(xml_file)

print (xmlschema.error_log.filter_from_errors())

Mais j'ai trouvé que la sortie indique toujours "65535: 0" si la ligne en erreur dépasse 65535.

file:///C:test.xml:65535:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element 'word': Missing child element(s). 
file:///C:test.xml:65535:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element 'word': Missing child element(s).
file:///C:test.xml:65535:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element 'word': Missing child element(s).

Je ne peux donc pas identifier où se trouvent les lignes ci-dessus. Y a-t-il des solutions?

Était-ce utile?

La solution

Cela semble être un bug dans libxml, Pas dans LXML lui-même persay, et est là depuis 2006. Il semble qu'il ne peut pas être facilement résolu en raison des problèmes de compatibilité descendants.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top