Domanda

Cerco set di dati che possono essere utilizzati per implementare sistema di raccomandazione caso d'uso di Apache Mahout. So di soli MovieLens set di dati da gruppo GroupLens Research .

Qualcuno sa qualsiasi altro set di dati che possono essere utilizzati per l'implementazione del sistema di raccomandazione? Sono particolarmente interessato a insiemi di dati voce basati anche se altri insiemi di dati sono i benvenuti.

È stato utile?

Soluzione

questo è Sebastian da Mahout.

C'è un set di dati da un sito di incontri ceco disponibile che potrebbe essere di vostro interesse: http: //www.occamslab.com/petricek/data/

A proposito del termine oggetto-based si riferisce ad un particolare approccio di filtraggio collaborativo non al set di dati in sé, che è di solito sotto forma comune di tripels user-item-valutazione che il filtraggio collaborativo più si avvicina a lavoro con.

Ci piacerebbe sentire dai vostri risultati e le esperienze di sperimentazione (se li si vuole condividere) sul nostro mailinglist utente in user@mahout.apache.org

Altri suggerimenti

Mentre la ricerca di set di dati, ho trovato alcuni siti che elenco disponibile al pubblico serie di dati che possono utilizzati per il data mining. Alcuni di questi possono essere usati per Mahout troppo.

bixo Labs

UCI Dataset

KDnuggets

Potete guardare iPinYou RTB offerta Data Set Quora: http://qr.ae/OrqgM http://contest.ipinyou.com/data-release.html

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top