사용할 데이터 마이닝 애플리케이션은 무엇입니까? [닫은

StackOverflow https://stackoverflow.com/questions/419524

  •  03-07-2019
  •  | 
  •  

문제

내가 사용한 마지막은 Weka. 마지막으로 Java가 API (JDM)를 내놓고 있다고 들었습니다. 누구나 자신의 경험을 도구와 공유 할 수 있습니까? 분류/클러스터링 도구를 사용하는 데 주로 관심이 있으며 (WEKA는 여기에서 괜찮은 작업을 수행합니다) 도구에는 API 지원이 적합해야합니다.

도움이 되었습니까?

해결책

나는 텍스트 분류에 weka를 사용했습니다. 좋았습니다. 그만큼 또한 좋습니다. 데이터 표현을 유지하고 알고리즘을 수정할 수있는 프레임 워크의 아이디어는 훌륭합니다.

다른 팁

나는 사용 중입니다 RapidMiner (이전에는 도르트문트 Univ.의 Yale). Java 기반 오픈 소스 도구이며 인기있는 분류기/클러스터링 방법의 대부분을 구현합니다. 또한 WEKA 툴킷을 위해 구현 된 알고리즘을 제공하므로 더 많은 옵션이 있습니다. 사용하기 쉬운 GUI와 Java 기반 API가 함께 제공됩니다.

WEKA는 분류, 클러스터링 등을 위해 여러 교과서 알고리즘이 구현 된 인기있는 데이터 마이닝 플랫폼입니다. 빠른 프로토 타이핑에 적합합니다. 즉, 시스템을 신속하게 설정하고 의도 한 바를 확인하는 것이 좋습니다.

그러나 Weka에는 두 가지 주요 문제가 있습니다. 첫 번째는 GPL 라이센스에 따라 배포되므로 상용 패키지의 일부로 사용할 수 없으며 변경을 수정할 수 없으며 변경 사항을 게시 할 수 없습니다. 또한 WEKA의 또 다른 약점은 많은 양의 데이터를 처리하지 않는다는 것입니다. 데이터가 컴퓨터 메모리에 맞지 않으면 문제가 있습니다.

이 두 가지 문제는 다음과 같습니다 아파치 마호 아우트 패키지. 비교적 새롭고 기능이 부족하지만 데이터 마이닝 문제에 따라 귀하가 가진 올바른 선택 일 수 있습니다.

우리는 분류 및 클러스터링을 위해 개발 한 일부 소프트웨어에서 WEKA를 사용했습니다. 저는 데이터 마이닝 전문가는 아니지만 다른 많은 제품과 함께 평가 한 팀은 확실히 자신의 물건을 알고 있으며 일반적으로 선반에서 매우 비싼 물건을 사용하는 데 사용됩니다.

연간 KDNUGGETS Polls 2007, 2008 및 2009에 따르면 RapidMiner는 전 세계 데이터 마이닝 전문가 중에서 가장 널리 사용되는 오픈 소스 데이터 마이닝 솔루션입니다.KDNUGGETS 데이터 마이닝 툴 폴 2009

RapidMiner는 오픈 소스이며 100% Java이며 RapidMiner는 훨씬 유연하며 WEKA보다 훨씬 더 많은 기능을 제공합니다.

정말 오렌지 데이터 마이닝 툴킷을 확인해야합니다. 드래그 앤 드롭 GUI와 Python API가 제공됩니다.

나는 Java로 개발 된 내 자신의 소프트웨어를 사용하고 트랜잭션 데이터베이스 또는 시퀀스 데이터베이스의 빈번한 패턴 및 협회 규칙 마이닝을 전문으로합니다.

http://www.philippe-fournier-viger.com/spmf/

다른 인기있는 데이터 마이닝 소프트웨어에서는 찾을 수없는 일부 알고리즘을 포함하여 46 개의 알고리즘을 제공합니다. GUI 버전과 소스 코드 버전이 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top