概述 对数据集画出对应的散点图。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 无 参数说明 参数 子参数 参数说明 star…
概述 对数据集的某一列,画出对应的饼形图。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 无 参数说明 参数 子参数 参数说明…
概述 对数据集中选择的某些列,画出对应的折线图。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象。 输出 无 参数说明 参数 子参数 …
概述 对数据集选择出来的某列,画出其条形图,字符串列显示每个特征出现的数目,数值列显示每个数值区间对应的样本数目。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中…
概述 对用户选择的数值列进行百分位统计。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 统计结果数据集 参数说明 参数 子参数…
概述 对sklearn孤立森林算法的封装。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数…
概述 采用梯度提升树回归算法计算数据集特征的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和gbt_regressor_model参数,表示直接…
概述 采用梯度提升树分类算法计算数据集特征的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和gbt_classify_model参数,表示直接根…
概述 采用决策树回归算法计算数据集特征的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和decision_tree_regressor_mode…
概述 采用决策树分类算法计算数据集特征的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集。 如果没有pipeline_model和decision_tree_classify_mode…