Domanda

Sto cercando un semplice ma "abbastanza buono" Libreria (e dizionario) di riconoscimento di entità denominata per Java, sto cercando di elaborare e-mail e documenti ed estrarre alcune "informazioni di base". piace: Nomi, luoghi, indirizzo e date

Mi sono guardato intorno, e la maggior parte sembra essere sul lato pesante e su progetti di NLP completi.

Qualche consiglio?

È stato utile?

Soluzione 2

A proposito, di recente mi sono imbattuto in OpenCalais che sembra avere la funzionalità che stavo cercando.

Altri suggerimenti

Potresti dare un'occhiata a una delle le mie risposte precedenti a un problema simile.

Oltre a ciò, i sistemi NER più leggeri dipendono molto dal dominio utilizzato. Troverai molti strumenti e documenti sui sistemi NER biomedici, per esempio. Oltre al mio post precedente (che contiene già la mia raccomandazione principale se si desidera fare NER), ecco alcuni altri strumenti che potresti voler esaminare:

  • Il Stanford CER-NER
  • Il Postech Biomedical NER System se tu sono interessati a questo particolare dominio
  • OpenCalais sembra essere un sistema commerciale. Ci sono involucri UIMA per OpenCalais ma sembrano datati. Esiste anche un annotatore di Context-Mapper basato su dizionario per UIMA che può aiutarti. Essere consapevoli del fatto che UIMA implica un notevole sovraccarico nella curva di apprendimento ;-)
  • OpenNLP hanno anche uno strumento NER.
  • Balie fa anche NER, tra le altre cose.
  • ABNER fa NER, ma di nuovo si concentra sul dominio biomedico.
  • I JULIE Lab Tools dell'università di Jena, Germania anche fare NER. Hanno versioni standalone e motori di analisi UIMA.

Un'osservazione aggiuntiva: non andrai via senza tokenizzazione sull'input. La tokenizzazione del linguaggio naturale è leggermente non banale, ecco perché ti suggerisco di usare una cassetta degli attrezzi che fa entrambe le cose per te.

Potresti provare anche API di alchimia . È simile a Open Calais.

Per la grammatica della PNL puoi controllare http://code.google.com/p/graph -expression / e http://gate.ac.uk/

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top