dask_ml.preprocessing.OrdinalEncoder

`dask_ml.preprocessing`.OrdinalEncoder¶

class dask_ml.preprocessing.OrdinalEncoder(columns=None)¶

对分类列进行有序（整数）编码。

参数

columns序列，可选: 要编码的列。必须是分类 dtype。默认编码所有分类 dtype 列。

属性

columns_Index

编码前/后训练数据中的列

categorical_columns_Index

训练数据中的分类列

noncategorical_columns_Index

训练数据中其余的列

dtypes_dict

将列名映射到以下类型的字典：

CategoricalDtype 的实例 (pandas >= 0.21.0)
(类别, 有序) 元组

注意

此转换器仅适用于 dask 和 pandas DataFrame。对于 dask DataFrame，所有分类数据都应该是已知的。

逆转换可用于 dataframe 或 array。

示例

>>> data = pd.DataFrame({"A": [1, 2, 3, 4],
...                      "B": pd.Categorical(['a', 'a', 'a', 'b'])})
>>> enc = OrdinalEncoder()
>>> trn = enc.fit_transform(data)
>>> trn
   A  B
0  1  0
1  2  0
2  3  0
3  4  1

>>> enc.columns_
Index(['A', 'B'], dtype='object')

>>> enc.non_categorical_columns_
Index(['A'], dtype='object')

>>> enc.categorical_columns_
Index(['B'], dtype='object')

>>> enc.dtypes_
{'B': CategoricalDtype(categories=['a', 'b'], ordered=False)}

>>> enc.fit_transform(dd.from_pandas(data, 2))
Dask DataFrame Structure:
                   A     B
npartitions=2
0              int64  int8
2                ...   ...
3                ...   ...
Dask Name: assign, 8 tasks

方法

`fit`(X[, y])	确定要编码的分类列。
`fit_transform`(X[, y])	拟合数据，然后进行转换。
`get_metadata_routing`()	获取此对象的元数据路由。
`get_params`([deep])	获取此估计器的参数。
`inverse_transform`(X)	对 X 中的列进行逆有序编码
`set_output`(*[, transform])	设置输出容器。
`set_params`(**params)	设置此估计器的参数。
`transform`(X[, y])	对 X 中的分类列进行有序编码

__init__(columns=None)¶

dask_ml.preprocessing.DummyEncoder

dask_ml.preprocessing.LabelEncoder

dask_ml.preprocessing.OrdinalEncoder

dask_ml.preprocessing.OrdinalEncoder¶

`dask_ml.preprocessing`.OrdinalEncoder¶