Formattazione dei dati da utilizzare in skmultilearn

https://datascience.stackexchange.com/questions/30573

31-10-2019
|

Domanda

Ho un frame di dati di valori X e uno con i valori y in quello che penso sia il formato corretto. Ho preso la singola caratteristica Y e l'ho convertita in manichini in modo che sia binario ed è m file da n funzionalità.

from sklearn.model_selection import train_test_split

X = df.drop('target',axis=1)
y = pd.get_dummies(df['target'], sparse=True, drop_first=True)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=99, train_size=0.60

Ho cercato di capire come dovrebbero essere esattamente i dati da documentazione Ma non ho molta fortuna.

Ho provato per la prima volta quanto segue:

import skmultilearn.problem_transform import BinaryRelevance
from sklearn.naive_bayes import GaussianNB

classifier = BinaryRelevance(GaussianNB())
classifier.fit(X_train, y_train)

Dove i set di treni X, Y sono i dati di dati Panda. Ciò si traduce nel seguente errore:

TypeError: no suppoerted conversion for types: (dytype('O'),)

Poi mi sono convertito in matrici:

X_train = X_train.asmatrix()
y_train = y_train.asmatrix()

Ho ricevuto lo stesso errore. Poi ho provato

X_train = np.matrix(X_train)
y_train = np.matrix(y_train)

Stesso errore di nuovo. C'è un modo semplice per passare dal telaio dati al formato corretto per i modelli SkmultileArn?

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange