Formattazione dei dati da utilizzare in skmultilearn
-
31-10-2019 - |
Domanda
Ho un frame di dati di valori X e uno con i valori y in quello che penso sia il formato corretto. Ho preso la singola caratteristica Y e l'ho convertita in manichini in modo che sia binario ed è m file da n funzionalità.
from sklearn.model_selection import train_test_split
X = df.drop('target',axis=1)
y = pd.get_dummies(df['target'], sparse=True, drop_first=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=99, train_size=0.60
Ho cercato di capire come dovrebbero essere esattamente i dati da documentazione Ma non ho molta fortuna.
Ho provato per la prima volta quanto segue:
import skmultilearn.problem_transform import BinaryRelevance
from sklearn.naive_bayes import GaussianNB
classifier = BinaryRelevance(GaussianNB())
classifier.fit(X_train, y_train)
Dove i set di treni X, Y sono i dati di dati Panda. Ciò si traduce nel seguente errore:
TypeError: no suppoerted conversion for types: (dytype('O'),)
Poi mi sono convertito in matrici:
X_train = X_train.asmatrix()
y_train = y_train.asmatrix()
Ho ricevuto lo stesso errore. Poi ho provato
X_train = np.matrix(X_train)
y_train = np.matrix(y_train)
Stesso errore di nuovo. C'è un modo semplice per passare dal telaio dati al formato corretto per i modelli SkmultileArn?
Nessuna soluzione corretta
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a datascience.stackexchange