ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python-RepeatedKFold实际上是什么意思?

2019-11-09 06:55:25  阅读:1334  来源: 互联网

标签:cross-validation scikit-learn data-science machine-learning python


假设n_repeats = 5,折叠数为3(n_splits = 3).

这是否意味着验证者正在为我们的估算器/模型创建3折以使用每一折(例如KFold的用途),然后将该过程重复5次?

这意味着我们的模型将总共使用5 x 3 = 15倍?

解决方法:

是的,您基本上可以通过循环调用KFolds.split()n_repeats次来达到相同的效果.

设置示例:

X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([0, 0, 1, 1])

然后运行:

rkf = RepeatedKFold(n_splits=2, n_repeats=1, random_state=2652124)
for train_index, test_index in rkf.split(X):
  print("TRAIN:", train_index, "TEST:", test_index)

…产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]

…就像KFold(n_splits = 2,random_state = 2652124)一样.更改为n_repeats = 2会产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]

等等.

标签:cross-validation,scikit-learn,data-science,machine-learning,python
来源: https://codeday.me/bug/20191109/2012630.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有