Domanda

Sono rimasto molto colpito dal sistema OpenCalais. È (è / ha) un servizio web a cui invii il tuo testo, lo analizzano, quindi ti viene fornita una serie di tag categorizzati (abilitati per RDF) a cui appartiene il tuo documento.

Ma - al momento - l'inglese è l'unica lingua supportata.

Conosci sistemi simili che gestiscono documenti multilingua? (Sono interessato all'italiano, ma la multi lingua è ovviamente un vantaggio)

È stato utile?

Soluzione

Apache Stanbol può analizzare testi in molte lingue diverse. Finora sono supportate le seguenti lingue (i valori di precisione e richiamo possono variare in base alla lingua):

  • Inglese,
  • ?? (cinese),
  • Español (spagnolo),
  • ??????? (russo),
  • Português (portoghese),
  • Deutsch (tedesco),
  • Italiano (italiano) ,
  • Nederlands (olandese),
  • Svenska (svedese),
  • Dansk (danese),
  • ??????? (arabo),
  • ????? (ebraico),
  • ??? (giapponese).

L'analisi restituirà le entità rilevate. Il formato di output dell'analisi può essere:

  • JSON-LD,
  • RDF / XML,
  • RDF / JSON,
  • Tartarughe,
  • N-triple.

Le entità o la codifica dei testi possono essere ulteriormente personalizzate in base alla configurazione del sistema. Idealmente, qualsiasi vocabolario personalizzato può essere inserito nel sistema.

Esistono un paio di endpoint dimostrativi:

Non sono sicuro che tutte le lingue di cui sopra siano supportate negli endpoint sopra menzionati.

RedLink GmbH fornirà servizi cloud basati su Apache Stanbol e sul software correlato.

Il plugin WordLift per WordPress fornisce già l'analisi del testo all'interno di WordPress per tutti i lingue sopra menzionate (attualmente in fase di test). Puoi provarlo installando il plug-in in WordPress e inviando contenuti testuali nel corpo del post.

Puoi anche iscriverti e scrivere alla Mailing list di Apache Stanbol per specifiche richieste o informazioni.

Altri suggerimenti

OpenCalais supporta la codifica dei metadati sia in francese che in spagnolo per le entità. L'insieme di entità verrà esteso nelle versioni future. Consulta la nostra documentazione online all'indirizzo http://www.opencalais.com/documentation/calais -Web-service-api

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top