华为云AI开发平台ModelArts线性特征重要性_云淘科技
概述
用线性模型计算训练数据的特征重要性。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 |
输出
特征的重要性和特征在线性模型中的weights,格式是dataFrame。
列名 |
公式 |
---|---|
weight |
abs(w_) |
importance |
abs(w_j) * STD(f_i) |
参数说明
参数 |
参数说明 |
---|---|
feature_cols |
特征列 |
label_col |
label列 |
item_spliter |
稀疏特征的iterm之间的分割符 |
kv_spliter |
稀疏特征中每个iterm的KV分割符 |
model_path |
线性模型的输入路径 |
样例
输入数据
配置流程
运行流程
输出结果
父主题: 特征工程
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家