dask_ml.datasets.make_counts
dask_ml.datasets.make_counts¶
- dask_ml.datasets.make_counts(n_samples=1000, n_features=100, n_informative=2, scale=1.0, chunks=100, random_state=None)¶
生成一个用于计数数据建模的虚拟数据集。
- 参数
- n_samplesint
输出数组中的行数
- n_featuresint
输出数组中的列数(特征数)
- n_informativeint
与结果相关的特征数
- scalefloat
将真实系数数组按此比例缩放
- chunksint
每个 Dask 数组块的行数。
- random_stateint, RandomState 实例或 None(默认)
确定数据集创建的随机数生成。传递一个整数可在多次函数调用中获得可重现的输出。参见 术语表。
- 返回值
- Xdask.array, 大小
(n_samples, n_features)
- ydask.array, 大小
(n_samples,)
非负整数值数据的数组
- Xdask.array, 大小
示例
>>> X, y = make_counts()