概述 “替换”节点用于对数据中指定属性名满足条件的内容进行替换。 用户可以根据需要,从输入数据集中依据条件替换某一个或多个属性,可选的条件包括“=”、“!=”、“Like”、“Between”等。 输入 参数 子参数 参数说明 inputs…
概述 “FP-Growth”节点用于挖掘频繁模式,该算法使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快…
概述 读取格式化的数据,支持csv、json、parquet等。 输入 无 输出 数据集 参数说明 参数 参数说明 input_file_path 数据文件的绝对路径、相对路径、目录路径或者文件路径均可 format 文件格式,支持csv等…
概述 “决策树分类”节点用于产生二分类或多分类模型。 决策树是附加概率结果的一个树状的决策图,是直观的运用统计概率分析的图法,树中的每一个节点表示对象属性的判断条件,其分支表示符合节点条件的对象,树的叶子节点表示对象所属的预测结果。其通过基…
概述 根据输入的spark pipeline类型的模型,对数据集进行预测。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 pipel…
导航按钮 算链编排界面导航栏提供丰富的界面操作,包括运行、保存、清除、撤销、恢复等功能。 图1 算链编排界面导航栏 表1 导航栏功能说明 图标 操作名称 功能说明 运行算链 运行界面上的算链。 保存算链 保存算链。 清除算链 一键清除画布所…
执行ma-cli ma-job submit命令提交ModelArts训练作业。 ma-cli ma-job submit命令需要指定一个位置参数YAML_FILE表示作业的配置文件路径,如果不指定该参数,则表示配置文件为空。配置文件是一个…
前提条件 VS Code已连接到Notebook。 Step1上传本地代码到云端开发环境 在VS Code界面,单击“File > OpenFolder”打开云端路径。 图1 Open Folder 选择要打开的路径,单击“OK”。 …
概述 采用决策树回归算法计算数据集特征的特征重要性。 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和decision_tree_regressor_mode…
概述 “缺失值填充”节点用来将某些列出现的缺失值(如空值、指定的值)替换为均值或者中位数。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型…