dask_ml.model_selection.KFold
dask_ml.model_selection
.KFold¶
- 类 dask_ml.model_selection.KFold(n_splits=5, shuffle=False, random_state=None)¶
K折交叉验证器
提供用于将数据分割为训练集/测试集的训练/测试索引。默认情况下,将数据集分割为 k 个连续的折叠(不进行洗牌)。
每个折叠会用作一次验证集,而剩余的 k - 1 个折叠则构成训练集。
- 参数
- n_splits整型,默认为 5
折叠数量。必须至少为 2。
- shuffle布尔型,可选
在将数据分割成批次之前是否进行洗牌。
- random_state整型,RandomState 实例或 None,可选,默认为 None
如果为整型,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,则随机数生成器是 np.random 使用的 RandomState 实例。在
shuffle
== True 时使用。
方法
get_metadata_routing
()获取此对象的元数据路由。
get_n_splits
([X, y, groups])返回交叉验证器中的分割迭代次数。
split
(X[, y, groups])生成用于将数据分割为训练集和测试集的索引。
- __init__(n_splits=5, shuffle=False, random_state=None)¶