Code de script pour le déséquilibre des cours dans Biolabs Orange
-
31-10-2019 - |
Question
J'essaie de manipuler certaines données dans Biolabs Orange, en utilisant le widget de script Python intégré et des informations à Tutoriel Biolabs Orange sur les scripts.
Cependant, j'ai du mal à prendre les résultats de Smote et à les mettre dans un format pour Orange:
Ceci est le code que j'utilise dans le widget de script Python:
# Get libraries
import Orange
import numpy as np
from Orange.data import Domain, Table
from imblearn.over_sampling import SMOTE
#in_data = Orange.data.Table('WORKING_temp.csv')
df = in_data.copy()
# set variables for SMOTE
sm = SMOTE(random_state=42)
# get table of data (X) and class variables (y)
X, y = df.X, df.Y
# resample data and classes
X_res, y_res = sm.fit_sample(X, y)
df.X = X_res
df.Y = y_res
temp = Orange.data.Table(df.X, df.Y)
temp.domain = df.domain
out_data = Orange.data.Table(temp)
Le résultat est une valeur d'énergie, qui, je pense, est liée à la modification de la longueur des variables de classe et de la table de données, tout en laissant la longueur d'index d'origine?
"ValueError: n'a pas pu diffuser le tableau d'entrée de la forme (3724,10) en forme (3724)"
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange