자바 게이트 API.성공적으로 파이프 라인을 생성하는 중입니다. 처리 된 문서에서 주석 세트를 어떻게 가져올 수 있습니까?

StackOverflow https://stackoverflow.com/questions/4885717

  •  28-10-2019
  •  | 
  •  

문제

문법이 좋지 않아 미리 죄송합니다.

GATE API로 파이프 라인을 만들었으며 성공적으로 실행했습니다. 다음과 같이 serialanalysercontroller를 만들었습니다. pipeline= (SerialAnalyserController) Factory.createResource ( "gate.creole.SerialAnalyserController"); , 그런 다음 파일 모음을로드합니다 (이전에 채워짐)

pipeline.setCorpus (foo) 마지막으로 pipeline.execute ()입니다.

모두 훌륭하게 작동하며 결과를 봅니다.내 문제는 말뭉치에서 처리 된 각 문서에 대해 AnnotationSet을 얻는 방법을 찾을 수 없다는 것입니다.예를 들어 AnnotationSet ( "sentences")을 찾아서 원본 텍스트 파일에서 문장이 시작되고 중지되는 오프셋을 찾고 싶습니다.API는 SerialAnalyserController에서 주석을 얻는 방법-프로세스 파이프 라인이 완료된 후 각 gate.Document를 얻는 방법을 알려주지 않습니다.

미리 감사합니다

도움이 되었습니까?

해결책

알았습니다!

코퍼스를 되찾은 다음, 코퍼스가 목록이기 때문에 get (x) 메소드를 사용하여 원하는 문서를 얻은 다음 annotationSet을 얻습니다.

감사합니다

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top