dask_ml.linear_model.LogisticRegression

dask_ml.linear_model.LogisticRegression

class dask_ml.linear_model.LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1.0, class_weight=None, random_state=None, solver='admm', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1, solver_kwargs=None)

逻辑回归的估计器。

参数
penaltystr 或 Regularizer,默认值 ‘l2’

要使用的正则化器。仅与 ‘admm’、‘lbfgs’ 和 ‘proximal_grad’ 求解器相关。

对于字符串值,仅 ‘l1’ 或 ‘l2’ 有效。

dual布尔型

被忽略

tol浮点型,默认值 1e-4

收敛的容差。

C浮点型

正则化强度。请注意 dask-glm 求解器使用参数化 \(\lambda = 1 / C\)

fit_intercept布尔型,默认值 True

指定是否应将常数(也称偏置或截距)添加到决策函数中。

intercept_scaling布尔型

被忽略

class_weight字典或 ‘balanced’

被忽略

random_state整型, RandomState 或 None

用于在打乱数据时使用的伪随机数生成器的种子。如果为整型,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,随机数生成器是 np.random 使用的 RandomState 实例。在 solver == ‘sag’ 或 ‘liblinear’ 时使用。

solver{‘admm’, ‘gradient_descent’, ‘newton’, ‘lbfgs’, ‘proximal_grad’}

要使用的求解器。详见 算法

max_iter整型,默认值 100

求解器收敛的最大迭代次数。

multi_class字符串,默认值 ‘ovr’

被忽略。目前不支持多类别求解器。

verbose整型,默认值 0

被忽略

warm_start布尔型,默认值 False

被忽略

n_jobs整型,默认值 1

被忽略

solver_kwargs字典,可选,默认值 None

传递给求解器的额外关键字参数。

属性
coef_数组,形状 (n_classes, n_features)

模型系数的学习值

intercept_浮点型或 None

截距的学习值,如果模型中添加了截距的话

示例

>>> from dask_glm.datasets import make_classification
>>> X, y = make_classification()
>>> lr = LogisticRegression()
>>> lr.fit(X, y)
>>> lr.decision_function(X)
>>> lr.predict(X)
>>> lr.predict_proba(X)
>>> lr.score(X, y)

方法

decision_function(X)

预测 X 中样本的置信度分数。

fit(X[, y])

在训练数据上拟合模型

get_metadata_routing()

获取此对象的元数据路由。

get_params([deep])

获取此估计器的参数。

predict(X)

预测 X 中样本的类别标签。

predict_proba(X)

预测 X 中样本的概率估计。

score(X, y)

给定数据和标签的平均准确率

set_params(**params)

设置此估计器的参数。

__init__(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1.0, class_weight=None, random_state=None, solver='admm', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1, solver_kwargs=None)