概述 “朴素贝叶斯”节点用于产生多分类模型,用户在使用时需要指定数据的“Role”字段,默认支持“Input”、“Target”、“Rejected”、“ID”四种类型,且只能选择其一种。 朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的…
本小节介绍了基于算法开发套件进行环境管控的相关参数。 adapter主要负责: 1) 对代码运行环境进行配置,目前支持的环境配置内容包括:conda环境切换、pip依赖安装。 2) 基于功能外壳进行无感远程作业的相关参数,可以自动完成启动前…
本小节介绍了基于算法开发套件进行算法的训练、测试和推理等阶段的相关参数。 其中,训练、测试支持单节点或多节点分布式运行,单节点分布式启动时只需给定local_size,即会在一个机器上启动多次算法脚本,从而实现单节点多进程;多节点分布式启动…
ma-cli image命令支持:查询用户已注册的镜像、查询/加载镜像构建模板、Dockerfile镜像构建、查询/清理镜像构建缓存、注册/取消注册镜像、调试镜像是否可以在Notebook中使用等。具体命令及功能可执行ma-cli imag…
执行ma-cli ma-job get-flavor命令查询ModelArts训练的资源规格。 $ ma-cli ma-job get-flavor -h Usage: ma-cli ma-job get-flavor [OPTIONS] …
当用户创建完成支持SSH的Notebook实例后,使用VS Code的开发者可以通过以下三种方式连接到开发环境中: VS Code一键连接Notebook(推荐) 该方式是指在开发环境Console控制台上提供VS Code按钮,通过该入口…
在Notebook的JupyterLab中,支持从GitHub开源仓库Clone文件。 通过JupyterLab打开一个运行中的Notebook。 单击JupyterLab窗口上方导航栏的ModelArts Upload Files按钮,打…
概述 对数据集的某些列,进行分桶,即直方图统计。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 统计结果数据集 参数说明 参数…
概述 对数据集指定的某些列做全表统计,包括元素总数、null值个数、nan值个数、最小值、最大值、方差、标准差等。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中…
概述 按照配置的比例参数,对数据集进行随机抽样。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数…