华为云AI开发平台ModelArts皮尔森系数_云淘科技
概述
皮尔森系数是一种线性相关系数,用于反映两个变量线性相关程度的统计量。选择输入的dataframe中的两列数值列,计算其皮尔森系数。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
output |
output_port_1 |
dataframe类型的皮尔森系数结果 |
参数说明
参数 |
是否必选 |
参数说明 |
默认值 |
---|---|---|---|
input_col1 |
是 |
皮尔森系数计算第一列列名 |
“” |
input_col2 |
是 |
皮尔森系数计算第二列列名 |
“” |
样例
数据样本
图1 数据样本
配置流程
运行流程
算法参数设置
查看结果
col1_name |
col2_name |
total |
valid |
pearson |
---|---|---|---|---|
f1 |
f2 |
10 |
10 |
0.9842079934534723 |
父主题: 数据分析
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家