概述 保存数据到用户的DLI外表(OBS表)。 保存为DLI外表时,对vector类型的数据转换为array类型,若无需保存vector数据,可在该算子前添加数据集选择列算子。 输入 参数 子参数 参数说明 inputs dataframe…
概述 “决策树回归”节点用于产生回归模型。 决策树算法是递归地构建决策树的过程,用平方误差最小准则,进行特征选择,生成二叉树。平方误差计算公式如下: 其中是样本类标的均值,yi 是样本的标签,N 是样本数量。 输入 参数 子参数 参数说明 …
本小节介绍了基于算法开发套件进行内容导出的相关参数。 公共参数 – type: 表示导出的平台,目前仅支持local模式导出。 – alg_type: 表示使用的算法类型,继承Global参数。 – ex…
使用ma-cli image df命令查询镜像构建缓存,仅支持在ModelArts Notebook里使用该命令。 $ ma-cli image df -h Usage: ma-cli image df [OPTIONS] Query di…
执行ma-cli dli-job get-queue命令查询DLI对列。 ma-cli dli-job get-queue -h Usage: ma-cli dli-job get-queue [OPTIONS] Get DLI queue…
在Notebook的JupyterLab中,支持通过远端文件地址下载文件。 要求:远端文件的URL粘贴在浏览器的输入框中时,可以直接下载该文件。 通过JupyterLab打开一个运行中的Notebook。 单击JupyterLab窗口上方导…
上传自定义算子 单击上传自定义算子图标,从本地上传新算子,如图1所示,当前版本仅支持上传使用Notebook编写的ipynb文件、python脚本。 图1 上传自定义算子 下载自定义算子 对算子单击右键,选择“下载”,即可将算子下载到本地,…
概述 对数据集画出对应的散点图。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 无 参数说明 参数 子参数 参数说明 star…
概述 根据过滤条件,对数据集按照行进行过滤。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 参数 子参数 参数说明 outpu…
概述 将csv格式的数据保存到OBS 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 无 参数说明 参数 子参数 参数说明 ou…