每个内置的算法资产内包含了算法套件、数据集、预训练模型,可以通过list命令查看内置的资产。 查询内置算法 python manage.py list algorithm 查询内置数据集 python manage.py list data…
使用ma-cli image unregister命令将注册的镜像从ModelArts中删除。 $ ma-cli image unregister -h Usage: ma-cli image unregister [OPTIONS] Un…
ma-cli dli-job upload命令支持将本地文件或OBS文件上传到DLI资源组。 $ ma-cli dli-job upload -h Usage: ma-cli dli-job upload [OPTIONS] PATHS…..
在AI开发过程中,如何将文件方便快速地上传到Notebook几乎是每个开发者都会遇到的问题。 ModelArts之前对文件直接上传到Notebook的大小限制是100MB,超过限制的文件无法直接上传;其次需要上传的文件并不都在本地,可能是G…
概述 对数据集的某些列,进行分桶,即直方图统计。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 统计结果数据集 参数说明 参数…
概述 对数据集指定的某些列做全表统计,包括元素总数、null值个数、nan值个数、最小值、最大值、方差、标准差等。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中…
概述 将数据集按照比例或阈值拆分为两个子数据集。 输入 参数 子参数 参数说明 inputs dataframe pyspark中DataFrame类型的对象 输出 参数 子参数 参数说明 output output_port_1 outp…
概述 “二值化”节点用于将数值型的字段转换成二值化形式。 例如:数据集中有一列整型数据属性为“Age”,取值为:“20-40”,设置阈值为30。二值化后当“Age”小于等于“30”时,“Age”这一列的取值就为“0”;当“Age”大于“30…
概述 保存parquet格式的数据到本地文件系统。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 无 参数说明 参数 子参数 …
概述 “K-均值”节点用于产生聚类模型,用户在使用时需要指定聚类个数。K-均值算法是基于距离的算法,将所有数据归类到其最邻近的中心。 输入 参数 子参数说明 参数说明 inputs dataframe inputs为字典类型,datafra…