AI开发平台ModelArts – 第 104 页 – 华为云河南代理-西数云-郑州云淘科技有限公司

概述过滤式特征选择根据特征对标签的重要性对特征进行筛选，特征重要性较高的特征，提升训练的精度和效率。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataF…

2023.05.16 84 0

概述读CSV文件支持从LOCAL、OBS、HDFS读取CSV类型的文件数据。输入无输出表1 参数子参数参数说明 output output_port_1 output为字典类型，output_port_1为pyspark中的D…

2023.05.16 99 0

概述词频统计是指统计一个字符串中，出现了多少个单词以及这些单词出现的次数。该算子一般接在分词算子后面，用以统计分词后各个单词的出现次数。输入参数子参数参数说明 inputs dataframe inputs为字典类型，datafr…

2023.05.16 92 0

概述该算子可以帮助我们自动确定 A R I M A ( p , d , q ) ( P , D , Q ) m。 Auto ARIMA选择过程 1. 执行差分测试决定差分d的大小（KPSS检测和ADF检测） 2. 拟合模型: 通过限制s…

2023.05.16 85 0

箱型图分桶统计相关性分析决策树分类特征重要性决策树回归特征重要性梯度提升树分类特征重要性梯度提升树回归特征重要性孤立森林百分位百分位统计直方图折线图饼形图散点图随机森林分类特征重要性随机森林回归特征重要性全表…

2023.05.16 103 0

概述 “连接”节点是关系数据库中常用的方法之一，用于以特定的方式将两个数据集联接在一起。输入参数子参数参数说明 inputs left_dataframe inputs为字典类型，left_dataframe为执行连接操作的左数据集…

2023.05.16 108 0

概述加权采样是一种数据采样算法，依据数据集中权重列进行数据采样，权重越大的样本被采样的概率越大。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFra…

2023.05.16 107 0

概述用线性模型计算训练数据的特征重要性。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFrame类型对象输出特征的重要性和特征在线性模型中的we…

2023.05.16 92 0

保存为DLI OBS表保存数据保存CSV数据到OBS 保存模型保存模型到OBS 保存parquet数据数据压缩父主题：输入输出同意关联代理商云淘科技，购买华为云产品更优惠（QQ 78315851）内容没看懂？不太想学习？想…

2023.05.16 109 0

概述混淆矩阵是机器学习中总结分类模型预测结果的情形分析表，以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总。其中矩阵的行表示真实值，矩阵的列表示预测值。 True Positive（TP）：真正类。样本的真…

2023.05.16 92 0

分类： AI开发平台ModelArts