Pregunta

Disculpas si este no es el lugar correcto para preguntar -. No estoy seguro de si esto encaja mejor con estadísticas o Ciencias de datos

Estoy usando la analítica para ayudar a identificar a los vendedores atributos de sus usuarios corresponden a las conversiones exitosas (como alguien que compra un producto, la suscripción a un boletín de noticias o suscribirse a un servicio). Los atributos pueden ser cosas como qué sitio de donde vinieron (de referencia), su ubicación, la hora / día de la semana, tipo de dispositivo, navegador, etc.

Lo que me gustaría decir (aunque no estoy seguro de que sea posible) es aislar las diferencias en la tasa de conversión a un atributo individual, algo así como: '11% de los usuarios de Facebook convierte mientras que sólo el 3% de los no -Facebook usuarios convertidos', lo que significa que el atributo 'de referencia' y el nivel del atributo 'Facebook' son responsables de conversiones.

Teniendo en cuenta que es posible que tenga 100s de variables casi independientes, es incluso posible aislar el efecto de una variable y un nivel de esa variable? A diferencia de una combinación de ellos que es más probable que sea la conducción de la diferencia? Si es así, qué técnica o paradigma conceptual hacer yo utilizo para identificar qué nivel variable es responsable de la mayor elevación en mi variable dependiente, la tasa de conversión?

¿Fue útil?

Solución

Yo sugeriría que usted considere sea reducción de dimensionalidad enfoque directo. Compruebe mi respuesta relevante en este sitio. Otra opción válida es utilizar modelado variable latente , por ejemplo, modelos de ecuaciones estructurales . Puede comenzar con artículos relevantes en Wikipedia ( este y esta , respectivamente) y, a continuación, según sea necesario, leer más artículos especializados o más prácticas, papeles y libros.

Licenciado bajo: CC-BY-SA con atribución
scroll top