Domanda

È possibile rimuovere i tag dalle frasi?Si può realizzarlo scansionando il file e trovare tag e rimuoverli, ma poiché ci sono molti tag (alcuni modelli hanno 30+, alcuni hanno circa 48-50, seguono fondamentalmente il Penn Treebank POS Tags ), èC'è un modo veloce e dolce per rimuovere i tag in modo più efficiente? Ho controllato l'API, ma non c'era un metodo di questo tipo per la rimozione dei tag.

È stato utile?

Soluzione

Non c'è niente di speciale costruito per questo, ma poiché l'output include sia la parola che il suo tag, non sono sicuro del motivo per cui è necessario eseguire nuovamente la scansione del documento originale.Non riesci a cancellare i tag eliminando dall'ultimo carattere del tagseparator ('/' o qualsiasi altra cosa) fino al bianco-spazio?Oppure, potrebbe essere più semplice da usare

-outputFormat tsv
.

Allora otterrai due colonne con le parole nella prima colonna e il tag nella seconda colonna e puoi semplicemente mantenere la prima colonna quando è stata eseguita.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top