Rimuovere i tag del tagger POS
-
13-12-2019 - |
Domanda
È possibile rimuovere i tag dalle frasi?Si può realizzarlo scansionando il file e trovare tag e rimuoverli, ma poiché ci sono molti tag (alcuni modelli hanno 30+, alcuni hanno circa 48-50, seguono fondamentalmente il Penn Treebank POS Tags ), èC'è un modo veloce e dolce per rimuovere i tag in modo più efficiente? Ho controllato l'API, ma non c'era un metodo di questo tipo per la rimozione dei tag.
Soluzione
Non c'è niente di speciale costruito per questo, ma poiché l'output include sia la parola che il suo tag, non sono sicuro del motivo per cui è necessario eseguire nuovamente la scansione del documento originale.Non riesci a cancellare i tag eliminando dall'ultimo carattere del tagseparator ('/' o qualsiasi altra cosa) fino al bianco-spazio?Oppure, potrebbe essere più semplice da usare
-outputFormat tsv
.
Allora otterrai due colonne con le parole nella prima colonna e il tag nella seconda colonna e puoi semplicemente mantenere la prima colonna quando è stata eseguita.