华为云AI开发平台ModelArts全表统计_云淘科技

概述

对数据集指定的某些列做全表统计,包括元素总数、null值个数、nan值个数、最小值、最大值、方差、标准差等。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

表1

参数

子参数

参数说明

output

output_port_1

dataframe类型的统计结果

参数说明

参数

是否必选

参数说明

默认值

select_columns_str

列名组成的格式化字符串,例如:

“column_a”

“column_a,column_b”

“”则表示全选

“”

样例

数据样本

配置流程

运行流程:

算法参数设置:

查看结果:

父主题: 数据分析

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家