python-如何在scikit-learn中使用SGDRegressor

2019-10-28 09:07:19 阅读：331 来源： 互联网

标签：scikit-learn statistics machine-learning python numpy

我试图弄清楚如何正确使用scikit-learn的SGDRegressor模型.
为了适合数据集,我需要调用一个函数fit(X,y),其中x是一个形状为(n_samples,n_features)的numpy数组,而y是一个长度为n_samples的1d numpy数组.我试图弄清楚y应该代表什么.

例如我的数据显示如下：

我的特征是从1972年开始的年份,这些值是该年的相应值.我试图预测诸如2008或2012之类的未来年份的值.我假设数据中的每一行都应该代表X中的行/样本,其中的每个元素都是一年的值.在那种情况下,你会是什么？我当时以为y应该只是年份,但是y的长度应该是n_features而不是n_samples.如果y的长度为n_samples,则y的长度可能为5(以下所示数据中的样本数).我想我必须以某种方式转换此数据.

解决方法:

在机器学习中,y代表数据的标签或目标.也就是说,您的训练数据(X)的正确答案.

如果您想学习一些与年份相对应的值,那么这些年份将是您的训练数据(X),与它们相关的正确值将是您的目标(y).

您可能会注意到,这符合您在第一段中提到的大小：X的形状为(n_samples,n_features),因为它的条目数与您拥有的年份一样多,并且每个条目的大小均为1(您只有1个功能,年份)和y的长度为n_samples,因为您具有与每年关联的值.

标签：scikit-learn,statistics,machine-learning,python,numpy
来源： https://codeday.me/bug/20191028/1951404.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

python-如何在scikit-learn中使用SGDRegressor