概述 根据输入数据集,选择一些列生成新的数据集。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数…
概述 主成分分析(Principal Components Analysis,PCA)是统计分析中简化数据集的一种算法,常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征。该算法主要通过对原始数据矩阵进行奇异值分解(Singula…
概述 从OBS(对象存储服务)中读取模型文件。 输入 无 输出 模型 参数说明 参数 参数说明 obs_model_path OBS中模型文件的绝对路径,模型文件必须是spark pipeline model文件 样例 params = {…
概述 “多层感知机分类”节点可用于建立一个基于前馈人工神经网络的分类模型。 前馈人工神经网络采用一种单向多层结构。其中每一层包含若干个神经元,同一层的神经元之间没有互相连接,层间信息的传送只沿一个方向进行。其中第一层称为输入层。最后一层为输…
# 根据flow config,一键运行所有任务 > python manage.py flow –cfg algorithms/ivgSegmentation/config/sample/config.py 父主题: 算法开发套件…
ma-cli提供了一些常用的镜像构建模板,模板中包含了在ModelArts Notebook上进行Dockerfile开发的牵引指导。 $ ma-cli image get-template -h Usage: ma-cli image g…
执行ma-cli ma-job get-flavor命令查询ModelArts训练的资源规格。 $ ma-cli ma-job get-flavor -h Usage: ma-cli ma-job get-flavor [OPTIONS] …
Notebook的JupyterLab中提供了多种方式上传文件。 上传文件要求 对于大小不超过100MB的文件直接上传,并展示文件大小、上传进度及速度等详细信息。 对于大小超过100MB不超过5GB的文件可以使用OBS中转,系统先将文件上传…
用户通过自定义算子功能,可以实现个性化的算子编写。 用户单击“新增自定义算子”图标,新建并打开一个模板算子,即一个算子编辑器(相当于Ipython Notebook的一个cell),输入自定义算子名称,即可以在新建的算子编辑器里面实现自定义…
概述 设置数据集的元数据信息。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数说明 col…