Pergunta

Fiquei muito impressionado com o sistema OpenCalais. É de (é / tem) um serviço web onde você enviar seu texto, eles analisá-lo, em seguida, que são fornecidos com uma série de classificados (RDF habilitado) tags que o documento pertence.

Mas - no momento -. Inglês é o idioma suportado apenas

Você sabe de sistemas similares que lidam com documentos em vários idiomas? (Estou interessado n italiano, mas vários idiomas é uma vantagem, é claro)

Foi útil?

Solução

Apache Stanbol pode analisar textos em várias línguas diferentes. Até agora, os seguintes idiomas são suportados (valores de precisão e de recall pode variar de acordo com o idioma):

  • Inglês,
  • ?? (chinês),
  • Español (Espanhol),
  • ??????? (Russo),
  • Português (Portuguese),
  • Deutsch (Alemão),
  • Italiano (Italiano) ,
  • Nederlands (Holandês),
  • Svenska (Sueco),
  • Dansk (Dinamarquês),
  • ??????? (Arabic),
  • ????? (hebraico),
  • ??? (Japonês).

A análise irá retornar as entidades descobertas. O formato de saída análise pode ser:

  • JSON-LD,
  • RDF / XML,
  • RDF / JSON,
  • Turtles,
  • N-triplos.

Entidades ou marcação, de textos pode ser ainda adaptado de acordo com a configuração do sistema. Idealmente qualquer vocabulário personalizado pode ser conectado ao sistema.

Há um par de demonstração pontos finais:

Não tenho certeza se todos os idiomas acima são suportados nos acima mencionados pontos finais.

redlink GmbH vai fornecer serviços em nuvem baseados em Apache Stanbol e software relacionado.

O WordLift plug-in para WordPress já fornece análise de texto dentro de WordPress para todas as línguas acima mencionadas (atualmente em teste de fase). Você pode experimentá-lo de instalar o plug-in no WordPress e enviar conteúdos textuais no corpo post.

Você também pode se inscrever e escrever no Apache Stanbol lista de discussão para específica pedidos ou informações.

Outras dicas

OpenCalais suporta tanto francês e metadados Espanhol marcação de entidades. O conjunto de entidades será estendida em lançamentos futuros. Veja nossa documentação online em http://www.opencalais.com/documentation/calais -web-service-api

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top