시스템과 같은 다문 오피 칼라?
-
11-07-2019 - |
문제
나는 Opencalais 시스템에 깊은 인상을 받았습니다. 그것은 당신이 당신의 텍스트를 보내고, 그것들을 분석하고, 그것들을 분석하고, 당신은 당신의 문서가 속하는 일련의 분류 된 (RDF 활성화) 태그를 제공합니다.
그러나 현재 - 영어는 유일하게 지원되는 언어입니다.
다중 언어 문서를 처리하는 유사한 시스템을 알고 있습니까? (나는 이탈리아어에 관심이 있지만 멀티 언어는 물론 플러스입니다)
해결책
아파치 스탠 볼 여러 언어로 텍스트를 분석 할 수 있습니다. 지금까지 다음 언어가 지원됩니다 (정밀 및 리콜 값은 언어에 따라 다를 수 있음) :
- 영어,
- 中文 (중국어),
- Español (스페인어),
- 초 러시아어 (러시아어),
- 포르투갈어 (포르투갈어),
- 도이치 (독일),
- 이탈리아 노 (이탈리아),
- 네더 랜드 (네덜란드),
- Svenska (스웨덴어),
- Dansk (덴마크어),
- العريي러운 (아라비아),
- עבר 배우 (히브리어),
- 日本語 (일본어).
분석은 발견 된 개체를 반환합니다. 분석 출력 형식은 다음과 같습니다.
- JSON-LD,
- RDF/XML,
- RDF/JSON,
- 거북이,
- n 트리플.
텍스트의 엔티티 또는 태깅은 시스템 구성에 따라 추가로 조정할 수 있습니다. 이상적으로는 모든 사용자 정의 어휘를 시스템에 연결할 수 있습니다.
몇 가지 데모 엔드 포인트가 있습니다.
위의 모든 언어가 미리 언급 된 엔드 포인트에서 지원되는지 확실하지 않습니다.
레드 링크 gmbh Apache Stanbol 및 관련 소프트웨어를 기반으로 클라우드 서비스를 제공 할 예정입니다.
그만큼 WordLift 플러그인 WordPress의 경우 이미 WordPress 내에서 텍스트 분석을 제공합니다 미리 언급 된 모든 언어 (현재 테스트 단계에 있음). WordPress에 플러그인을 설치하고 게시물 본문에 텍스트 내용을 제출할 수 있습니다.
구독하고 쓸 수도 있습니다 Apache Stanbol 메일 링리스트 특정 요청 또는 정보.
다른 팁
Opencalais는 엔티티의 프랑스 및 스페인 메타 데이터 태그를 모두 지원합니다. 엔티티 세트는 향후 릴리스에서 확장됩니다. 온라인 문서를 참조하십시오 http://www.opencalais.com/documentation/calais-web-service-api