문제

나는 Opencalais 시스템에 깊은 인상을 받았습니다. 그것은 당신이 당신의 텍스트를 보내고, 그것들을 분석하고, 그것들을 분석하고, 당신은 당신의 문서가 속하는 일련의 분류 된 (RDF 활성화) 태그를 제공합니다.

그러나 현재 - 영어는 유일하게 지원되는 언어입니다.

다중 언어 문서를 처리하는 유사한 시스템을 알고 있습니까? (나는 이탈리아어에 관심이 있지만 멀티 언어는 물론 플러스입니다)

도움이 되었습니까?

해결책

아파치 스탠 볼 여러 언어로 텍스트를 분석 할 수 있습니다. 지금까지 다음 언어가 지원됩니다 (정밀 및 리콜 값은 언어에 따라 다를 수 있음) :

  • 영어,
  • 中文 (중국어),
  • Español (스페인어),
  • 초 러시아어 (러시아어),
  • 포르투갈어 (포르투갈어),
  • 도이치 (독일),
  • 이탈리아 노 (이탈리아),
  • 네더 랜드 (네덜란드),
  • Svenska (스웨덴어),
  • Dansk (덴마크어),
  • العريي러운 (아라비아),
  • עבר 배우 (히브리어),
  • 日本語 (일본어).

분석은 발견 된 개체를 반환합니다. 분석 출력 형식은 다음과 같습니다.

  • JSON-LD,
  • RDF/XML,
  • RDF/JSON,
  • 거북이,
  • n 트리플.

텍스트의 엔티티 또는 태깅은 시스템 구성에 따라 추가로 조정할 수 있습니다. 이상적으로는 모든 사용자 정의 어휘를 시스템에 연결할 수 있습니다.

몇 가지 데모 엔드 포인트가 있습니다.

위의 모든 언어가 미리 언급 된 엔드 포인트에서 지원되는지 확실하지 않습니다.

레드 링크 gmbh Apache Stanbol 및 관련 소프트웨어를 기반으로 클라우드 서비스를 제공 할 예정입니다.

그만큼 WordLift 플러그인 WordPress의 경우 이미 WordPress 내에서 텍스트 분석을 제공합니다 미리 언급 된 모든 언어 (현재 테스트 단계에 있음). WordPress에 플러그인을 설치하고 게시물 본문에 텍스트 내용을 제출할 수 있습니다.

구독하고 쓸 수도 있습니다 Apache Stanbol 메일 링리스트 특정 요청 또는 정보.

다른 팁

Opencalais는 엔티티의 프랑스 및 스페인 메타 데이터 태그를 모두 지원합니다. 엔티티 세트는 향후 릴리스에서 확장됩니다. 온라인 문서를 참조하십시오 http://www.opencalais.com/documentation/calais-web-service-api

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top