ICode9

精准搜索请尝试: 精确搜索
  • 什么是机器学习中的回归算法?scikit-learn中的四大回归算法学习2023-01-23 18:27:40

    回归算法一直以来都是机器学习的核心算法之一,今天我们给大家总结sklearn中的线性回归、Lasso回归、岭回归、弹性回归四个算法的概念与使用。 回归是一种稳健的统计测量,用于研究一个或多个独立(输入特征)变量和一个因变量(输出)之间的关系。在 AI 中,回归是一种有监督的机器学习算法,可以

  • 如何在python中的sklearn中获取GridSearchCV中的选定功能2019-12-10 23:59:45

    我使用交叉验证(rfecv)的递归特征消除作为GridSearchCV的特征选择技术. 我的代码如下. X = df[my_features_all] y = df['gold_standard'] x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0) k_fold = StratifiedKFold(n_splits=5, shuffle=True, ran

  • python-是否有一种方法可以选择使用用户定义的距离量度来在scikits中选择k个最近的邻居?2019-12-01 13:56:42

    我必须使用余弦相似性度量标准和一些其他用户定义的度量标准,将K最近邻用于一组向量.如何通过使用scikits学习来实现?我找到了sklearn.neighbors.KNeighborsClassifier,但是我无法找出用户定义指标的任何选项.我当前正在使用最新版本的scikits学习0.11.解决方法:尚无法(尚未?)将预先

  • scikit学习:创建自定义CountVectorizer和ChiSquare时出现问题2019-12-01 11:56:34

    我有以下代码(基于示例here),但无法正常工作: [...] def my_analyzer(s): return s.split() my_vectorizer = CountVectorizer(analyzer=my_analyzer) X_train = my_vectorizer.fit_transform(traindata) ch2 = SelectKBest(chi2,k=1) X_train = ch2.fit_transform(X_train,Y_

  • python-具有硬边距和C值的svm2019-11-27 17:58:04

    我必须创建一个带有RBF内核和硬边距的svm分类器.如果我正确理解,则余量的种类由C参数控制.也就是说,C参数越大,我得到的硬边界就越大.是否有一个典型的C值模拟非常健壮的“硬边距”?还是有其他方法可以模拟强大的硬边距?当然,我们总是可以讨论为什么我们需要模仿硬利润.但是在这种情

  • python-2D数组中的NaN插值.人口稀少2019-11-22 18:09:30

    我有一些NaN值的二维数组.我想使用我拥有数据的位置来修补(插值)这些值.该数组如下所示. 如果可能的话,我想进行插值,以便当我远离非NaN值时,我会越来越接近值0. 我怎样才能做到这一点? 我读到大约gridddata,但它似乎旨在用于非结构化N维数据.我也阅读了other threads中的答案,但我

  • Python SKLearn:逻辑回归概率2019-11-22 11:06:22

    我正在使用Python SKLearn模块执行逻辑回归.我有一个因变量矢量Y(从M个类中的1个取值)和独立变量矩阵X(具有N个特征).我的代码是 LR = LogisticRegression() LR.fit(X,np.resize(Y,(len(Y)))) 我的问题是,LR.coef_和LR.intercept_代表什么.我最初以为他们持有的

  • python scikit中更快的数据拟合(或学习)功能2019-11-22 10:05:28

    我正在将scikit用于机器学习.尽管我完全按照其官方文档中的步骤进行操作,但是遇到两个问题.这是代码的主要部分: 1)trdata是使用sklearn.train_test_split创建的训练数据.2)ptest和ntest分别是阳性和阴性的测试数据 ## Preprocessing scaler = StandardScaler(); scaler.fit(trdat

  • python-fit()何时停止在scikit中运行?2019-11-21 20:09:49

    我正在使用scikit-learn来训练分类器.我特别在使用linear_model.LogisticRegression.但是我的问题是:培训的停止标准是什么?因为我看不到任何指示时期数的参数! 随机森林也一样吗?解决方法:LogisticRegression的迭代次数没有硬性限制.而是尝试以指定的容差tol检测收敛:tol越小,算法将运

  • scikit.learn cross_val_score中的错误2019-11-21 04:57:54

    请参考以下地址的笔记本 LogisticRegression 这部分代码 scores = cross_val_score(LogisticRegression(), X, y, scoring='accuracy', cv=10) print scores print scores.mean() 在Windows 7 64位计算机上生成以下错误 ------------------------------------------------------

  • Scikit学习:随机Logistic回归给出ValueError:输出数组是只读的2019-11-20 22:57:59

    我试图用我的数据拟合随机Logistic回归,但无法继续.这是代码: import numpy as np X = np.load("X.npy") y = np.load("y.npy") randomized_LR = RandomizedLogisticRegression(C=0.1, verbose=True, n_jobs=3) randomized_LR.fit(X, y) 这给出了一个错误: 344 if is

  • 有没有办法检索由sklearn.tree.DecisionTreeClassifier生成的节点的最终数量?2019-11-20 20:57:53

    如果没有对max_depth,min_samples等进行限制,是否可以检索sklearn.tree.DecisionTreeClassifier生成的最终节点数?解决方法:部分原因是我没有自己的决策树,因此无法在此处提供具体示例.但是,我认为深入研究源代码可能会有所帮助. https://github.com/scikit-learn/scikit-learn/blob

  • 内核估计每点使用一个带宽值2019-11-20 19:59:01

    我熟悉通常的内核密度估计(KDE),其中单个带宽值用于为每个采样点生成多元(通常是高斯)函数.然后,通过对所有采样点的高斯函数求和来获得最终的KDE. 假设我有N个样本点(假设为1维),每个样本点都有一个误差估计,例如: sample_points = [0.5, 0.7, 0.3, 1.2, 0.01, 3.6, 0.4] errors =

  • Python:如何正确处理熊猫DataFrame中的NaN,以在Scikit-learn中进行功能选择2019-11-20 15:58:14

    这与我发布的here问题有关,但是这个问题更具体,更简单. 我有一个pandas DataFrame,其索引是唯一的用户标识符,列对应于唯一的事件,并且值1(有人值守),0(未出席)或NaN(未邀请/不相关).相对于NaN,矩阵非常稀疏:有数百个事件,大多数用户最多只被邀请参加几十个事件. 我创建了一些额外的

  • Python sklearn中集群中心的标签2019-11-20 13:55:27

    当使用sklearn类sklearn.cluster进行K-means聚类时,拟合的k-means对象具有3个属性,包括一个名为cluster_centers_的聚类中心(中心x特征)的numpy数组.但是,这些中心没有附加标签. 我的问题是:cluster_centers_中的中心(行)是否按标签值排序?也就是说,第1行是否对应于标记为1的群集的中

  • 使用Scikit-Learn的SVR,如何在预测目标时结合分类和连续特征?2019-11-20 11:57:10

    我想使用支持向量机来解决回归问题,以基于一些特征的预测,该特征是分类的和连续的.例如,我有[白人,亚洲人,西班牙裔,黑人],#年的教学经验和多年的教育经验. 对于分类,我利用了sci-kit的预处理模块,并对这4个种族进行了热编码.在这种情况下,一位白人教师看起来像[1,0,0,0],因此我有

  • 修改大型cython项目的工作流2019-11-20 00:56:08

    我需要对scikit-learn进行一些修改,包括对cython代码的更改. 我以前没有研究过cython,所以可以提供一些指导-到目前为止,我已经将所有依赖项放入python virtualenv中,并克隆并安装了sklearn git. 现在,有什么好的方法可以修改.pyx文件?我应该进行修改然后重新安装以查看效果吗?还是改

  • python-如何合并多个朴素贝叶斯分类器的输出?2019-11-19 13:57:12

    我是新来的. 我在Sklearn工具箱中使用朴素贝叶斯分类器(NBC)构建了一组弱分类器. 我的问题是如何结合每个NBC的输出来做出最终决定.我希望我的决定是概率而不是标签. 我在python中制作了以下程序.我假设来自sklean的虹膜数据集的2类问题.为了进行演示/学习,我按如下方法制作了4个NB

  • 使用sample_weight参数时,sklearn LogisticRegressiondict_proba()给出错误的预测2019-11-19 02:55:18

    我正在尝试SciKit学习.我以为我会尝试加权Logistic回归,但是在使用sample_weight参数初始化它时,我从sklearn的LogisticRegression对象中得到了毫无意义的预测. 这是一个演示问题的玩具示例.我建立了一个非常简单的数据集,具有一个功能和一个二进制目标输出. feat target weight

  • 在sklearn python中撤消L2规范化2019-11-18 20:55:28

    一旦我使用sklearn l2规范化器规范化了我的数据并将其用作训练数据: 如何将预测的输出变回“原始”形状? 在我的示例中,我将归一化的住房价格用作y,将归一化的居住空间用作x.每个都适合自己的X_和Y_Normalizer. y_predict也处于标准化状态,我该如何变成原始原始货币状态? 谢谢.解决方

  • python-IndexError:数组的索引过多.具有42个特征的块状数组不均一2019-11-18 17:59:28

    我正在尝试实例化测试集进行分类,加载具有41个特征和1个标签的数据集: import numpy as np f = open("mydataset") dataset = np.genfromtxt(f, delimiter=',', dtype=None) X = dataset[:, 0:40] # select columns 1 through 41 y = dataset[:, 41] # select column 42 (the l

  • 如何使用Scikit Learn dictvectorizer从Python中的密集数据帧获取编码数据帧?2019-11-18 17:58:31

    我有一个数据框,如下所示: user item affinity 0 1 13 0.1 1 2 11 0.4 2 3 14 0.9 3 4 12 1.0 由此,我要创建一个编码数据集(用于fastFM),如下所示: user1 user2 user4 user4 item11 item12 item13 item14 affinity

  • python-SciKit FastICA返回什么?FastICA和fastica有什么区别(两者都返回不同的值)?2019-11-18 13:55:31

    我正在尝试使用scikit学习模块在学校进行机器学习练习. sklearn ICA文档“使用ICA进行盲源分离” [http://scikit-learn.org/stable/auto_examples/decomposition/plot_ica_blind_source_separation.html#example-decomposition-plot-ica-blind-source-separation-py].]已提供了我

  • python-如何比较两个sklearn估计是否相等?2019-11-18 11:57:00

    我有两个sklearn估计量,想要对其进行比较: import numpy as np from sklearn.tree import DecisionTreeClassifier X, y = np.random.random((100,2)), np.random.choice(2,100) dt1 = DecisionTreeClassifier() dt1.fit(X, y) dt2 = DecisionTreeClassifier() dt3 = sklearn.

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有