문제

나는 이상한 문제가있다.

스탠포드 명명 된 엔티티 인식 (NER) 태그 지정을 사용하여 태그를 지정하고 싶은 문장 목록이 있습니다. Stanford Ner Demo 웹 사이트 (Java 데모 코드)에서 제공되는 다음 코드 줄을 사용하여 태그를 지정했습니다.

for (String str : List<sentences>) {
   System.out.print(classifier.classifyToString(str, "slashTags", false));
}
.

태그가 지정되어야 할 전혀 태그가없는 문장 중 일부를 수동으로 확인할 때까지 모든 것이 올바르게 진행되고 있다고 생각했습니다. 그러나 태그가없는이 문장이 일부 샘플 목록으로 선택되고 위의 코드로 테스트를 거쳤습니다. 그래서 나는 내가 틀린 곳에서 혼란 스럽다. 태그가 올바르지 않은 문장은 1000 - 1500 문장의 범위에서와 같습니다. 그래서 내가 이들을 별도의 목록에서 잘못 태그로 한 문장을 실행하면 태그가 지정됩니다. 분류기에 영향을 미치는 데이터 세트 (0.10 만)의 크기는 무엇입니까?

예 : 다음 문장을 고려하십시오 - "IBM Corporation 소개" 위의 문장은 0.10 만 데이터 세트에서 상당한 숫자로 존재합니다. 따라서 0.10 만 데이터 세트에서 위의 코드를 사용하여 태그를 수행 할 때 이들과 같은 많은 문장이 전혀 태그가 없습니다. 그러나 내가 손을 들이고 목록에 넣은 다음 태그를 작성한 다음 태그가 지정됩니다.

나는 모든 접근 방식을 시도했고, 위의 데이터 세트에서 태그를 지정할 때 위의 문장에 대해 태그를 지정하지 않은 것으로 나타났습니다.

나는 다음의 3 가지 다른 방법을 시도했다. 1. classifier.classifyToString (InputString, "슬래시 태그", false) 2. classifier.classify (InputString) 3. classifier.classifyTacherfacterOffsets (InputString)

내가 잘못 될 아이디어 나 제안은 무엇입니까?

감사합니다

도움이 되었습니까?

해결책

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top