Question

J'ai été très impressionné par le système OpenCalais. C'est (est / a) un service Web où vous envoyez votre texte, ils l'analysent, puis une série de balises catégorisées (activées par RDF) auxquelles votre document appartient.

Mais pour le moment, l'anglais est la seule langue prise en charge.

Connaissez-vous des systèmes similaires gérant des documents multilingues? (Je suis intéressé par l’italien, mais la multi-langue est un atout, bien sûr)

Était-ce utile?

La solution

Apache Stanbol peut analyser des textes dans de nombreuses langues. Jusqu'à présent, les langues suivantes sont prises en charge (les valeurs de précision et de rappel peuvent varier en fonction de la langue):

  • anglais,
  • ?? (chinois),
  • Español (espagnol),
  • ??????? (russe),
  • Português (portugais),
  • Deutsch (allemand),
  • Italiano (italien) ,
  • Nederlands (néerlandais),
  • Svenska (suédois),
  • Dansk (danois),
  • ??????? (arabe),
  • ????? (hébreu),
  • ??? (japonais).

L'analyse renverra les entités découvertes. Le format de sortie d'analyse peut être:

  • JSON-LD,
  • RDF / XML,
  • RDF / JSON,
  • Tortues,
  • N-TRIPLES.

Les entités, ou balises, de textes peuvent être encore personnalisées en fonction de la configuration du système. Idéalement, tout vocabulaire personnalisé peut être branché sur le système.

Il existe quelques points finaux de démonstration:

Je ne sais pas si toutes les langues ci-dessus sont prises en charge dans les terminaux mentionnés ci-dessus.

RedLink GmbH va fournir des services de cloud basés sur Apache Stanbol et les logiciels associés.

Le plug-in WordLift pour WordPress fournit déjà une analyse de texte dans WordPress pour tous les langues susmentionnées (actuellement en phase de test). Vous pouvez l'essayer en installant le plug-in dans WordPress et en soumettant du contenu textuel dans le corps du message.

Vous pouvez également vous inscrire et écrire à la liste de diffusion Apache Stanbol pour plus d'informations. demandes ou informations.

Autres conseils

OpenCalais prend en charge le balisage de métadonnées en français et en espagnol pour les entités. L'ensemble des entités sera étendu dans les prochaines versions. Consultez notre documentation en ligne à l'adresse http://www.opencalais.com/documentation/calais. -web-service-api

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top