dask_ml.datasets.make_counts

dask_ml.datasets.make_counts

dask_ml.datasets.make_counts(n_samples=1000, n_features=100, n_informative=2, scale=1.0, chunks=100, random_state=None)

生成一个用于计数数据建模的虚拟数据集。

参数
n_samplesint

输出数组中的行数

n_featuresint

输出数组中的列数(特征数)

n_informativeint

与结果相关的特征数

scalefloat

将真实系数数组按此比例缩放

chunksint

每个 Dask 数组块的行数。

random_stateint, RandomState 实例或 None(默认)

确定数据集创建的随机数生成。传递一个整数可在多次函数调用中获得可重现的输出。参见 术语表

返回值
Xdask.array, 大小 (n_samples, n_features)
ydask.array, 大小 (n_samples,)

非负整数值数据的数组

示例

>>> X, y = make_counts()