ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python – ValueError:未知标签类型:’unknown’

2019-09-30 09:59:39  阅读:471  来源: 互联网

标签:logistic-regression python pandas numpy scikit-learn


我尝试运行以下代码.顺便说一句,我是python和sklearn的新手.

import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression


# data import and preparation
trainData = pd.read_csv('train.csv')
train = trainData.values
testData = pd.read_csv('test.csv')
test = testData.values
X = np.c_[train[:, 0], train[:, 2], train[:, 6:7],  train[:, 9]]
X = np.nan_to_num(X)
y = train[:, 1]
Xtest = np.c_[test[:, 0:1], test[:, 5:6],  test[:, 8]]
Xtest = np.nan_to_num(Xtest)


# model
lr = LogisticRegression()
lr.fit(X, y)

其中y是0和1的np.ndarray

我收到以下内容:

File “C:\Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py”, line >1174, in fit
check_classification_targets(y)

File “C:\Anaconda3\lib\site-packages\sklearn\utils\multiclass.py”, line 172, >in check_classification_targets
raise ValueError(“Unknown label type: %r” % y_type)

ValueError: Unknown label type: ‘unknown’

来自sklearn文档:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit

y:类似数组,形状(n_samples,)
目标值(分类中的类别标签,回归中的实数)

我的错误是什么?

UPD:

y是数组([0.0,1.0,1.0,…,0.0,1.0,0.0],dtype = object)大小是(891,)

解决方法:

您的y是object类型,因此sklearn无法识别其类型.在y = train [:,1]行后面添加y = y.astype(‘int’)行.

标签:logistic-regression,python,pandas,numpy,scikit-learn
来源: https://codeday.me/bug/20190930/1835505.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有