dask_ml.preprocessing.OrdinalEncoder
dask_ml.preprocessing
.OrdinalEncoder¶
- class dask_ml.preprocessing.OrdinalEncoder(columns=None)¶
对分类列进行有序(整数)编码。
- 参数
- columns序列,可选
要编码的列。必须是分类 dtype。默认编码所有分类 dtype 列。
- 属性
- columns_Index
编码前/后训练数据中的列
- categorical_columns_Index
训练数据中的分类列
- noncategorical_columns_Index
训练数据中其余的列
- dtypes_dict
将列名映射到以下类型的字典:
CategoricalDtype 的实例 (pandas >= 0.21.0)
(类别, 有序) 元组
注意
此转换器仅适用于 dask 和 pandas DataFrame。对于 dask DataFrame,所有分类数据都应该是已知的。
逆转换可用于 dataframe 或 array。
示例
>>> data = pd.DataFrame({"A": [1, 2, 3, 4], ... "B": pd.Categorical(['a', 'a', 'a', 'b'])}) >>> enc = OrdinalEncoder() >>> trn = enc.fit_transform(data) >>> trn A B 0 1 0 1 2 0 2 3 0 3 4 1
>>> enc.columns_ Index(['A', 'B'], dtype='object')
>>> enc.non_categorical_columns_ Index(['A'], dtype='object')
>>> enc.categorical_columns_ Index(['B'], dtype='object')
>>> enc.dtypes_ {'B': CategoricalDtype(categories=['a', 'b'], ordered=False)}
>>> enc.fit_transform(dd.from_pandas(data, 2)) Dask DataFrame Structure: A B npartitions=2 0 int64 int8 2 ... ... 3 ... ... Dask Name: assign, 8 tasks
方法
fit
(X[, y])确定要编码的分类列。
fit_transform
(X[, y])拟合数据,然后进行转换。
get_metadata_routing
()获取此对象的元数据路由。
get_params
([deep])获取此估计器的参数。
inverse_transform
(X)对 X 中的列进行逆有序编码
set_output
(*[, transform])设置输出容器。
set_params
(**params)设置此估计器的参数。
transform
(X[, y])对 X 中的分类列进行有序编码
- __init__(columns=None)¶