关注于数据分析的小站

2019年09月的文章

第6页
# 监督学习:从高维观察预测输出变量-0dayhub
Sklearn

# 监督学习:从高维观察预测输出变量

lin, han阅读(7158)赞(0)

校验者:         @Kyrie         @片刻 @Loopy 翻译者:         @森系 监督学习解决的问题 监督学习 在于学习两个数据集的联系:观察数据 X 和我们正在尝试预测的额外变量 y (通常称“目标”或“标签...

# 模型选择:选择估计量及其参数-0dayhub
Sklearn

# 模型选择:选择估计量及其参数

lin, han阅读(6041)赞(0)

校验者:         @片刻 翻译者:         @森系 分数和交叉验证分数 如我们所见,每一个估计量都有一个可以在新数据上判定拟合质量(或预期值)的 score 方法。越大越好. >>> from sklearn i...

# 无监督学习: 寻求数据表示-0dayhub
Sklearn

# 无监督学习: 寻求数据表示

lin, han阅读(6428)赞(0)

校验者:         @片刻 翻译者:         @X 聚类: 对样本数据进行分组 可以利用聚类解决的问题 对于 iris 数据集来说,我们知道所有样本有 3 种不同的类型,但是并不知道每一个样本是那种类型:此时我们可以尝试一个 ...

# 把它们放在一起-0dayhub
Sklearn

# 把它们放在一起

lin, han阅读(5592)赞(0)

校验者:         @片刻 翻译者:         @X 模型管道化 我们已经知道一些模型可以做数据转换,一些模型可以用来预测变量。我们可以建立一个组合模型同时完成以上工作: import numpy as np import ma...

Sklearn

# 寻求帮助

lin, han阅读(4237)赞(0)

校验者:         @片刻 翻译者:         @X 项目邮件列表 如果您在使用 scikit 的过程中发现错误或者需要在说明文档中澄清的内容,可以随时通过 Mailing List 进行咨询。 机器学习从业者的 Q&A...

Sklearn

# 处理文本数据

lin, han阅读(4346)赞(0)

校验者:         @NellyLuo         @那伊抹微笑         @微光同尘 翻译者:         @Lielei 本指南旨在一个单独实际任务中探索一些主要的 scikit-learn 工具: 分析关于 20 ...

# 1.5. 随机梯度下降-0dayhub
Sklearn

# 1.5. 随机梯度下降

lin, han阅读(5720)赞(3)

校验者:         @A         @HelloSilicat @Loopy @qinhanmin2014 翻译者:         @L 随机梯度下降(SGD) 是一种简单但又非常高效的方法,主要用于凸损失函数下线性分类器的判...

# 选择正确的评估器(estimator)-0dayhub
Sklearn

# 选择正确的评估器(estimator)

lin, han阅读(5463)赞(0)

校验者: 翻译者:         @李孟禹 通常,解决机器学习问题的最困难的部分可能是找到恰当的的评估器(estimator)。 不同的评估器更适合不同类型的数据和不同的问题。 下面的流程图是一些粗略的指导,可以让用户根据自己的数据来选择...

Sklearn

# 安装 scikit-learn

lin, han阅读(4045)赞(0)

校验者:         @小瑶 @Loopy 翻译者:         @片刻 Note 如果你想为这个项目做出贡献,建议你 安装最新的开发版本 . 安装最新版本 Scikit-learn 要求: Python (>= 3.5), ...