Pregunta

¿Cuáles son algunas bibliotecas de aprendizaje automático de C / c ++ que admiten la agrupación de datos multidimensionales? (por ejemplo K-medias)

Hasta ahora me he topado

Estoy tentado a rodar por mi cuenta, pero estoy seguro de que los preexistentes tienen un rendimiento mucho mejor optimizado con más puntos de vista en el código.

¿Fue útil?

Solución

The Open Source C Clustering Library del equipo del Genoma Humano en la La Universidad de Tokio se ve prometedora. Tiene K-medias así como otros algoritmos de agrupación jerárquica plana. Desplácese hacia abajo en su página para ver la biblioteca sin la GUI. El proyecto Wikipedia-Clustering parece agradable y un poco más liviano. Aquí hay una biblioteca especializada de K-means de la Universidad de Mariland . Le sugiero que los mire considerando su tipo de datos. El preprocesamiento de datos para crear vectores de características puede ser difícil.

Otros consejos

No estoy seguro de si está buscando algoritmos como C4.5, ID3, etc. o no. Si lo hace, puede descargar las fuentes individuales de los sitios web de las universidades donde se investigan activamente.

E.g: C4.5 La fuente se puede encontrar en sitio web de Quinlan .

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top