广义线性模型
目录
广义线性模型¶
|
线性回归估计器。 |
|
逻辑回归估计器。 |
|
泊松回归估计器。 |
广义线性模型是一类广泛使用的模型。这些实现在单机或分布式集群上都能很好地扩展到大型数据集。它们可以由多种优化算法提供支持,并使用多种正则项。
它们遵循 scikit-learn 估计器 API,因此可以轻松集成到网格搜索和管道等现有例程中,但使用新的、可扩展的算法在外部实现,因此可以处理分布式 Dask 数组和 DataFrame,而不仅仅是单机 NumPy 和 Pandas 数组和 DataFrame。
示例¶
In [1]: from dask_ml.linear_model import LogisticRegression
In [2]: from dask_ml.datasets import make_classification
In [3]: X, y = make_classification(chunks=50)
In [4]: lr = LogisticRegression()
In [5]: lr.fit(X, y)
Out[5]: LogisticRegression()
算法¶
|
交替方向乘子法 |
|
Michael Grant 实现的梯度下降。 |
|
使用 scipy.optimize 实现的 L-BFGS 求解器 |
|
牛顿法用于逻辑回归。 |
|
近端梯度法 |
正则项¶
|
弹性网络正则化。 |
|
L1 正则化。 |
|
L2 正则化。 |
正则化对象的抽象基类。 |