关注于数据分析的小站

2019年09月的文章

第4页
# 4.1. 部分依赖图-0dayhub
Sklearn

# 4.1. 部分依赖图

lin, han阅读(6825)赞(5)

校验者: 待核验 翻译者:         @Loopy 部分依赖图(以下简称PDP)显示了目标响应[1]和一组“目标”特征之间的依赖关系,并边缘化所有其他特征(“补充”特征)的值。直观地,我们可以将部分依赖关系解释为预期目标响应作为“目标...

Sklearn

# 5. 数据集转换

lin, han阅读(4678)赞(4)

scikit-learn 提供了一个用于转换数据集的库, 它也许会 clean(清理)(请参阅 预处理数据), reduce(减少)(请参阅 无监督降维), expand(扩展)(请参阅 内核近似)或 generate(生成)(请参阅 特征...

# 5.2. 特征提取-0dayhub
Sklearn

# 5.2. 特征提取

lin, han阅读(5942)赞(4)

校验者:         @if only 翻译者:         @片刻 模块 sklearn.feature_extraction 可用于提取符合机器学习算法支持的特征,比如文本和图片。 注意 特征特征提取与特征选择有很大的不同:前者...

# 1.3. 内核岭回归-0dayhub
Sklearn

# 1.3. 内核岭回归

lin, han阅读(6015)赞(5)

校验者:         @不吃曲奇的趣多多         @Loopy @qinhanmin2014 翻译者:         @Counting stars 内核岭回归(Kernel ridge regression-KRR)[1] ...

# 5.3 预处理数据-0dayhub
Sklearn

# 5.3 预处理数据

lin, han阅读(7429)赞(4)

校验者:         @if only 翻译者:         @Trembleguy sklearn.preprocessing 包提供了几个常见的实用功能和变换器类型,用来将原始特征向量更改为更适合机器学习模型的形式。 一般来说,...

Sklearn

# 5.4 缺失值插补

lin, han阅读(4755)赞(3)

校验者:         @if only 待二次校验 翻译者:         @Trembleguy         @Loopy 因为各种各样的原因,真实世界中的许多数据集都包含缺失数据,这类数据经常被编码成空格、NaNs,或者是其他...

Sklearn

# 5.5. 无监督降维

lin, han阅读(5547)赞(4)

校验者:         @程威 翻译者:         @十四号 如果你的特征数量很多, 在监督步骤之前, 可以通过无监督的步骤来减少特征. 很多的 无监督学习 方法实现了一个名为 transform 的方法, 它可以用来降低维度. 下...

# 5.6. 随机投影-0dayhub
Sklearn

# 5.6. 随机投影

lin, han阅读(6010)赞(4)

校验者:         @FontTian         @程威 翻译者:         @Sehriff sklearn.random_projection 模块实现了一个简单且高效率的计算方式来减少数据维度,通过牺牲一定的精度(作...