Domanda

Sono curioso di sapere quali sono i metodi/approcci per superare il problema dell'"avvio a freddo" in cui quando un nuovo utente o un elemento entra nel sistema, a causa della mancanza di informazioni su questa nuova entità, formulare raccomandazioni è un problema.

Posso pensare di fare alcune raccomandazioni basate sulle previsioni (come genere, nazionalità e così via).

È stato utile?

Soluzione

Forse ci sono volte basta non dovrebbe fare una raccomandazione? "Dati insufficienti" dovrebbero qualificarsi come una di quelle volte.

Ho appena non vedo come raccomandazioni di previsione sulla base di "sesso, nazionalità e così via" ammonteranno a più di stereotipi.

IIRC, posti come Amazon costruito i loro database per un po 'prima di stendere le raccomandazioni. Non è il genere di cosa che si desidera ottenere sbagliato; ci sono un sacco di storie là fuori su raccomandazioni inappropriate sulla base di dati insufficienti.

Altri suggerimenti

È possibile avvio a freddo di un sistema di raccomandazione.

Ci sono due tipi di sistemi di raccomandazione; filtraggio collaborativo e basato sul contenuto. sistemi basati contenuto utilizzano i meta dati circa le cose che si raccomandano. La domanda è allora quello meta-dati sono importanti? Il secondo approccio è filtraggio collaborativo, che non si preoccupa dei meta dati, utilizza solo quello che la gente ha fatto o detto su un elemento per fare una raccomandazione. Con filtraggio collaborativo non devi preoccuparti di ciò che termini i meta-dati sono importanti. In realtà non è necessario alcun metadati per rendere la raccomandazione. Il problema con il filtraggio collaborativo è che avete bisogno di dati. Prima di avere dati sufficienti è possibile utilizzare le raccomandazioni basate sui contenuti. È possibile fornire raccomandazioni che si basano su entrambi i metodi, e all'inizio avere il 100% in base al contenuto, allora come si ottiene più dati iniziano a mescolare in filtraggio collaborativo basato. Questo è il metodo che ho usato in passato.

Un'altra tecnica comune è quella di trattare la parte di content-based come un semplice problema di ricerca. Basta mettere in metadati come il testo o il corpo del documento poi indicizzare i documenti. Si può fare questo con Lucene e Solr senza scrivere codice.

Se volete sapere come base opere di filtraggio collaborativo, controllare il capitolo 2 di "Programmazione Intelligenza Collettiva" di Toby Segaran

Lavorare su questo problema io stesso, ma questo documento da Microsoft sulle macchine di Boltzmann sembra utile: http : //research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

Questo è stato chiesto diverse volte prima (naturalmente, non riesco a trovare queste domande ora: /, ma la conclusione generale era che è meglio evitare tali raccomandazioni In varie parti del worls stessi nomi appartengono a sesso diverso, e così via. ...

I consigli basati su "utenti simili hanno apprezzato..." devono chiaramente attendere.Puoi distribuire coupon o altri incentivi agli intervistati se sei assolutamente impegnato a fare previsioni basate sulla somiglianza degli utenti.

Esistono altri due modi per avviare a freddo un motore di suggerimenti.

  1. Costruisci tu stesso un modello.
  2. Chiedi ai tuoi fornitori di inserire le informazioni chiave per un modello di scheletro.(Potrebbe anche richiedere incentivi in ​​$.)

Ci sono molte potenziali insidie ​​​​in tutto ciò, che è troppo buon senso per menzionare.

Come ci si potrebbe aspettare, qui non c'è il pranzo gratis.Ma pensala in questo modo:i motori di raccomandazione non sono un piano aziendale.Migliorano semplicemente il piano aziendale.

Ci sono tre cose necessarie per affrontare il freddo di inizio Problema:

  1. I dati devono essere stati profilato in modo tale che si hanno molte caratteristiche diverse (con dati di prodotto il termine usato per la 'funzione' è spesso 'sfaccettature di classificazione'). Se fate i dati non correttamente profilo come si entra dalla porta, il vostro motore di raccomandazione rimarrà 'freddo' come non ha nulla con cui classificare le raccomandazioni.

  2. Il più importante: Avete bisogno di un circuito di user-feedback con cui gli utenti possono rivedere le raccomandazioni proposte del motore personalizzazione. Ad esempio, Sì / No pulsante 'stato questo suggerimento utile?' dovrebbe coda una revisione di partecipanti in un set di dati di formazione (vale a dire la 'raccomandare' di formazione set di dati) ad un altro insieme di dati di formazione (vale a dire non si consiglia dati di addestramento).

  3. Il modello utilizzato per la (Consiglia / Sconsigliato) suggerimenti non dovrebbe mai essere considerato come un one-size-fits-all raccomandazione. Oltre alla classificazione del prodotto o servizio da suggerire a un cliente, come la società di classifica ogni specifico cliente conta troppo. Se funziona correttamente, ci si dovrebbe aspettare che i clienti con caratteristiche diverse avranno suggerimenti differenti per (Consiglia / Sconsigliato) in una data situazione. Che sarebbe la 'personalizzazione' parte di motori di personalizzazione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top