dask_ml.preprocessing.MinMaxScaler

`dask_ml.preprocessing`.MinMaxScaler¶

class dask_ml.preprocessing.MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)¶

通过将每个特征缩放到给定范围来变换特征。

该估计器单独缩放和转换每个特征，使其在训练集上处于给定范围内，例如零到一之间。

变换公式如下

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中 min, max = feature_range。

这种变换通常用作零均值、单位方差缩放的替代方案。

MinMaxScaler 不会减弱离群值的影响，但它会将其线性缩放到固定范围内，其中出现的最大数据点对应于最大值，最小数据点对应于最小值。有关示例可视化，请参阅将 MinMaxScaler 与其他缩放器进行比较。

更多信息请参阅用户指南。

参数

feature_rangetuple (min, max)，默认值=(0, 1): 期望的变换后数据范围。
copy布尔型，默认值=True: 设置为 False 可执行原地行归一化并避免复制（如果输入已是 numpy 数组）。
clip布尔型，默认值=False: 设置为 True 可将保留数据的变换值剪裁到提供的 feature range 内。

0.24 版本新增。

属性

min_形状为 (n_features,) 的 ndarray: 每个特征的最小值调整。等同于 min - X.min(axis=0) * self.scale_
scale_形状为 (n_features,) 的 ndarray: 每个特征数据的相对缩放。等同于 (max - min) / (X.max(axis=0) - X.min(axis=0))

0.17 版本新增：scale_ 属性。
data_min_形状为 (n_features,) 的 ndarray: 数据中看到的每个特征的最小值

0.17 版本新增：data_min_
data_max_形状为 (n_features,) 的 ndarray: 数据中看到的每个特征的最大值

0.17 版本新增：data_max_
data_range_形状为 (n_features,) 的 ndarray: 数据中看到的每个特征范围 (data_max_ - data_min_)

0.17 版本新增：data_range_
n_features_in_整数: fit 期间看到的特征数量。

0.24 版本新增。
n_samples_seen_整数: 估计器处理的样本数量。在新的 fit 调用时会重置，但在 partial_fit 调用之间会递增。
feature_names_in_形状为 (n_features_in_,) 的 ndarray: 在 fit 期间看到的特征名称。仅当 X 的所有特征名称都是字符串时才定义。

1.0 版本新增。

另请参阅

minmax_scale: 没有估计器 API 的等效函数。

注意

NaN 被视为缺失值：在 fit 中忽略，在 transform 中保留。

示例

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

方法

`fit`(X[, y])	计算用于后续缩放的最小值和最大值。
`fit_transform`(X[, y])	拟合数据，然后变换数据。
`get_feature_names_out`([input_features])	获取变换后的输出特征名称。
`get_metadata_routing`()	获取此对象的元数据路由。
`get_params`([deep])	获取此估计器的参数。
`inverse_transform`(X[, y, copy])	根据 feature_range 撤消对 X 的缩放。
`partial_fit`(X[, y])	在线计算 X 的最小值和最大值，用于后续缩放。
`set_inverse_transform_request`(*[, copy])	请求传递给 `inverse_transform` 方法的元数据。
`set_output`(*[, transform])	设置输出容器。
`set_params`(**params)	设置此估计器的参数。
`set_transform_request`(*[, copy])	请求传递给 `transform` 方法的元数据。
`transform`(X[, y, copy])	根据 feature_range 缩放 X 的特征。

__init__(feature_range=(0, 1), *, copy=True, clip=False)¶

dask_ml.preprocessing.RobustScaler

dask_ml.preprocessing.QuantileTransformer

dask_ml.preprocessing.MinMaxScaler

dask_ml.preprocessing.MinMaxScaler¶

`dask_ml.preprocessing`.MinMaxScaler¶