dask_ml.model_selection.KFold

dask_ml.model_selection.KFold

dask_ml.model_selection.KFold(n_splits=5, shuffle=False, random_state=None)

K折交叉验证器

提供用于将数据分割为训练集/测试集的训练/测试索引。默认情况下,将数据集分割为 k 个连续的折叠(不进行洗牌)。

每个折叠会用作一次验证集,而剩余的 k - 1 个折叠则构成训练集。

参数
n_splits整型,默认为 5

折叠数量。必须至少为 2。

shuffle布尔型,可选

在将数据分割成批次之前是否进行洗牌。

random_state整型,RandomState 实例或 None,可选,默认为 None

如果为整型,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,则随机数生成器是 np.random 使用的 RandomState 实例。在 shuffle == True 时使用。

方法

get_metadata_routing()

获取此对象的元数据路由。

get_n_splits([X, y, groups])

返回交叉验证器中的分割迭代次数。

split(X[, y, groups])

生成用于将数据分割为训练集和测试集的索引。

__init__(n_splits=5, shuffle=False, random_state=None)