关注于数据分析的小站

Sklearn 第4页

# 5. 数据集转换

lin, han阅读(4678)赞(4)

scikit-learn 提供了一个用于转换数据集的库, 它也许会 clean(清理)(请参阅 预处理数据), reduce(减少)(请参阅 无监督降维), expand(扩展)(请参阅 内核近似)或 generate(生成)(请参阅 特征...

# 5.2. 特征提取-0dayhub

# 5.2. 特征提取

lin, han阅读(5942)赞(4)

校验者:         @if only 翻译者:         @片刻 模块 sklearn.feature_extraction 可用于提取符合机器学习算法支持的特征,比如文本和图片。 注意 特征特征提取与特征选择有很大的不同:前者...

# 1.3. 内核岭回归-0dayhub

# 1.3. 内核岭回归

lin, han阅读(6015)赞(5)

校验者:         @不吃曲奇的趣多多         @Loopy @qinhanmin2014 翻译者:         @Counting stars 内核岭回归(Kernel ridge regression-KRR)[1] ...

# 5.3 预处理数据-0dayhub

# 5.3 预处理数据

lin, han阅读(7429)赞(4)

校验者:         @if only 翻译者:         @Trembleguy sklearn.preprocessing 包提供了几个常见的实用功能和变换器类型,用来将原始特征向量更改为更适合机器学习模型的形式。 一般来说,...

# 5.4 缺失值插补

lin, han阅读(4755)赞(3)

校验者:         @if only 待二次校验 翻译者:         @Trembleguy         @Loopy 因为各种各样的原因,真实世界中的许多数据集都包含缺失数据,这类数据经常被编码成空格、NaNs,或者是其他...

# 5.5. 无监督降维

lin, han阅读(5547)赞(4)

校验者:         @程威 翻译者:         @十四号 如果你的特征数量很多, 在监督步骤之前, 可以通过无监督的步骤来减少特征. 很多的 无监督学习 方法实现了一个名为 transform 的方法, 它可以用来降低维度. 下...

# 5.6. 随机投影-0dayhub

# 5.6. 随机投影

lin, han阅读(6010)赞(4)

校验者:         @FontTian         @程威 翻译者:         @Sehriff sklearn.random_projection 模块实现了一个简单且高效率的计算方式来减少数据维度,通过牺牲一定的精度(作...

# 5.7. 内核近似-0dayhub

# 5.7. 内核近似

lin, han阅读(5873)赞(4)

校验者:         @FontTian         @numpy         @Loopy 翻译者:         @程威 这个子模块包含与某些 kernel 对应的特征映射的函数,这个会用于例如支持向量机的算法当中(see...

# 5.8. 成对的矩阵, 类别和核函数-0dayhub

# 5.8. 成对的矩阵, 类别和核函数

lin, han阅读(5400)赞(2)

校验者:         @FontTian         @numpy 翻译者:         @程威 The sklearn.metrics.pairwise 子模块实现了用于评估成对距离或样本集合之间的联系的实用程序。 本模块同时...