Pregunta

Estaba muy impresionado con el sistema OpenCalais. Es (es / tiene) un servicio web donde envía su texto, lo analizan, luego se le proporciona una serie de etiquetas categorizadas (habilitadas para RDF) a las que pertenece su documento.

Pero, por el momento, el inglés es el único idioma admitido.

¿Conoces sistemas similares que manejen documentos en varios idiomas? (Me interesa el italiano, pero el idioma múltiple es una ventaja, por supuesto)

¿Fue útil?

Solución

Apache Stanbol puede analizar textos en muchos idiomas diferentes. Hasta ahora se admiten los siguientes idiomas (los valores de precisión y recuperación pueden variar según el idioma):

  • inglés,
  • ?? (chino),
  • Español (español),
  • ??????? (ruso),
  • Português (portugués),
  • Deutsch (alemán),
  • Italiano (italiano) ,
  • Nederlands (holandés),
  • Svenska (sueco),
  • Dansk (danés),
  • ??????? (árabe),
  • ????? (hebreo),
  • ??? (japonés).

El análisis devolverá las entidades descubiertas. El formato de salida del análisis puede ser:

  • JSON-LD,
  • RDF / XML,
  • RDF / JSON,
  • Tortugas,
  • N-TRIPLES.

Las entidades, o el etiquetado, de los textos pueden adaptarse aún más según la configuración del sistema. Idealmente, cualquier vocabulario personalizado se puede conectar al sistema.

Hay un par de puntos finales de demostración:

No estoy seguro de si todos los idiomas anteriores son compatibles con los puntos finales mencionados anteriormente.

RedLink GmbH proporcionará servicios en la nube basados ??en Apache Stanbol y software relacionado.

El complemento de WordLift para WordPress ya proporciona análisis de texto dentro de WordPress para todos los idiomas mencionados anteriormente (actualmente en etapa de prueba). Puede probarlo instalando el complemento en WordPress y enviando contenido textual en el cuerpo de la publicación.

También puede suscribirse y escribir a la lista de correo de Apache Stanbol para obtener información específica solicitudes o información.

Otros consejos

OpenCalais admite el etiquetado de metadatos en francés y español para entidades. El conjunto de entidades se ampliará en futuras versiones. Consulte nuestra documentación en línea en http://www.opencalais.com/documentation/calais -web-service-api

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top