사용할 데이터 마이닝 애플리케이션은 무엇입니까? [닫은
-
03-07-2019 - |
문제
내가 사용한 마지막은 Weka. 마지막으로 Java가 API (JDM)를 내놓고 있다고 들었습니다. 누구나 자신의 경험을 도구와 공유 할 수 있습니까? 분류/클러스터링 도구를 사용하는 데 주로 관심이 있으며 (WEKA는 여기에서 괜찮은 작업을 수행합니다) 도구에는 API 지원이 적합해야합니다.
해결책
나는 텍스트 분류에 weka를 사용했습니다. 좋았습니다. 그만큼 책 또한 좋습니다. 데이터 표현을 유지하고 알고리즘을 수정할 수있는 프레임 워크의 아이디어는 훌륭합니다.
다른 팁
나는 사용 중입니다 RapidMiner (이전에는 도르트문트 Univ.의 Yale). Java 기반 오픈 소스 도구이며 인기있는 분류기/클러스터링 방법의 대부분을 구현합니다. 또한 WEKA 툴킷을 위해 구현 된 알고리즘을 제공하므로 더 많은 옵션이 있습니다. 사용하기 쉬운 GUI와 Java 기반 API가 함께 제공됩니다.
WEKA는 분류, 클러스터링 등을 위해 여러 교과서 알고리즘이 구현 된 인기있는 데이터 마이닝 플랫폼입니다. 빠른 프로토 타이핑에 적합합니다. 즉, 시스템을 신속하게 설정하고 의도 한 바를 확인하는 것이 좋습니다.
그러나 Weka에는 두 가지 주요 문제가 있습니다. 첫 번째는 GPL 라이센스에 따라 배포되므로 상용 패키지의 일부로 사용할 수 없으며 변경을 수정할 수 없으며 변경 사항을 게시 할 수 없습니다. 또한 WEKA의 또 다른 약점은 많은 양의 데이터를 처리하지 않는다는 것입니다. 데이터가 컴퓨터 메모리에 맞지 않으면 문제가 있습니다.
이 두 가지 문제는 다음과 같습니다 아파치 마호 아우트 패키지. 비교적 새롭고 기능이 부족하지만 데이터 마이닝 문제에 따라 귀하가 가진 올바른 선택 일 수 있습니다.
우리는 분류 및 클러스터링을 위해 개발 한 일부 소프트웨어에서 WEKA를 사용했습니다. 저는 데이터 마이닝 전문가는 아니지만 다른 많은 제품과 함께 평가 한 팀은 확실히 자신의 물건을 알고 있으며 일반적으로 선반에서 매우 비싼 물건을 사용하는 데 사용됩니다.
연간 KDNUGGETS Polls 2007, 2008 및 2009에 따르면 RapidMiner는 전 세계 데이터 마이닝 전문가 중에서 가장 널리 사용되는 오픈 소스 데이터 마이닝 솔루션입니다.KDNUGGETS 데이터 마이닝 툴 폴 2009
RapidMiner는 오픈 소스이며 100% Java이며 RapidMiner는 훨씬 유연하며 WEKA보다 훨씬 더 많은 기능을 제공합니다.
정말 오렌지 데이터 마이닝 툴킷을 확인해야합니다. 드래그 앤 드롭 GUI와 Python API가 제공됩니다.
나는 Java로 개발 된 내 자신의 소프트웨어를 사용하고 트랜잭션 데이터베이스 또는 시퀀스 데이터베이스의 빈번한 패턴 및 협회 규칙 마이닝을 전문으로합니다.
http://www.philippe-fournier-viger.com/spmf/
다른 인기있는 데이터 마이닝 소프트웨어에서는 찾을 수없는 일부 알고리즘을 포함하여 46 개의 알고리즘을 제공합니다. GUI 버전과 소스 코드 버전이 있습니다.