Préparer les données: de nombreux produits par ligne
-
31-10-2019 - |
Question
Je voudrais trouver comment changer ma structure de données pour le rendre compatible avec un modèle ML, avec les contraintes suivantes:
- Un produit est défini par {id, prix, continuablevariable1, ..., continuvariable10}
- L'ensemble de formation est Train.csv. Chaque ligne contient une date, un produit et une liste de produits (produits concurrents)
- Pour chaque rangée de train.csv, la taille de la liste des produits peut changer.
Il serait facile si je n'avais qu'un seul produit concurrent: je pourrais mettre toutes les colonnes dans le même fichier. Mais j'ai beaucoup de produits concurrents. La variable de sortie est le prix du produit.
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange