特征工程 – 华为云河南代理-西数云-郑州云淘科技有限公司

AI开发平台ModelArts

华为云AI开发平台ModelArts过滤式特征选择_云淘科技

概述过滤式特征选择根据特征对标签的重要性对特征进行筛选，特征重要性较高的特征，提升训练的精度和效率。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataF…

2023.05.16 131 0

AI开发平台ModelArts

华为云AI开发平台ModelArts线性特征重要性_云淘科技

概述用线性模型计算训练数据的特征重要性。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFrame类型对象输出特征的重要性和特征在线性模型中的we…

2023.05.16 135 0

AI开发平台ModelArts

华为云AI开发平台ModelArts特征工程_云淘科技

二值化卡方选择派生特征转换 FP-growth 最小最大规范化正则化独热编码主成分分析离散化标准化字符串标签化奇异值分解过滤式特征选择线性特征重要性特征尺度变换特征异常检测特征异常平滑 gbdt编码模型训练 g…

2023.05.16 138 0

AI开发平台ModelArts

华为云AI开发平台ModelArts特征尺度变换_云淘科技

概述支持对稠密或稀疏的数值类特征进行常见的尺度变换，支持常见的log2、log10、ln、abs及sqrt等尺度变化函数。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pys…

2023.05.16 139 0

AI开发平台ModelArts

华为云AI开发平台ModelArts特征异常检测_云淘科技

概述特征异常检测的方法包括箱型图（Box-plot）和AVF（Attribute Value Frequency）箱型图用于检测连续值类特征的数据，根据四分位数检测异常特征。 AVF用于检测枚举值类特征的数据，根据枚举特征的取值频率及阈…

2023.05.16 142 0

AI开发平台ModelArts

华为云AI开发平台ModelArts特征异常平滑_云淘科技

概述特征异常平滑算子用于将数据中的异常数据平滑到一定的区间，可选择采用箱线图、阈值、百分位和z-score的方法确定平滑区间。 z-score方式：计算所需要平滑的特征的均值mean和标准差std，并引入置信因子cl 平滑区间上界：平滑…

2023.05.16 183 0

AI开发平台ModelArts

华为云AI开发平台ModelArtsgbdt编码模型训练_云淘科技

概述利用训练好的gbdt分类模型对输入的特征进行离散化处理。对每棵树的叶子节点进行编码，预测的时候遍历到叶子节点对应位置的编码为1，该树其余节点的编码为0。该节点主要用于生产gbdt的分类模型，并存储到输入参数对应的位置上。输入参数 …

2023.05.16 173 0

AI开发平台ModelArts

华为云AI开发平台ModelArtsgbdt编码模型应用_云淘科技

概述利用训练好的gbdt分类模型对输入的特征进行离散化处理。对每棵树的叶子节点进行编码，预测的时候遍历到叶子节点对应位置的编码为1，该树其余节点的编码为0。该节点主要用于读取gbdt编码模型训练阶段保存的模型，并对数据进行离散化编码。输…

2023.05.16 156 0

AI开发平台ModelArts

华为云AI开发平台ModelArts离散化_云淘科技

概述根据用户输入的桶的个数，按照分位数分桶，将用户指定的某个数值列离散化。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFrame类型对象输出数…

2023.05.05 150 0

AI开发平台ModelArts

华为云AI开发平台ModelArts标准化_云淘科技

概述对数据集的某些数值列，根据均值和方差进行标准化。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFrame类型对象输出数据集参数说明参数 …

2023.05.05 138 0

标签：特征工程

分类

近期文章

近期评论

友情链接

分类目录

标签： 特征工程

分类

近期文章

近期评论

友情链接

分类目录

标签：特征工程