不同存储的实现都不同,在性能、易用性、成本的权衡中可以有不同的选择,没有一个存储可以覆盖所有场景,了解下云上开发环境中各种存储使用场景说明,更能提高使用效率。 表1 云上开发环境中各种存储使用场景说明 存储类型 建议使用场景 优点 缺点 E…
自定义算子代码模板 新建自定义算子时,MLS Editor提供了代码模板,方便用户高效开发算子。 class MLSClassName: # init parameters def __init__(self, inputs, param_…
概述 采用随机森林回归算法计算数据集特征的特征重要性 输入 参数 子参数 参数说明 inputs dataframe 参数必选,表示输入的数据集;如果没有pipeline_model和random_forest_regressor_mode…
概述 按照配置的比例参数,对数据集进行随机抽样。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数…
概述 采用卡方检验来进行特征选择。 卡方检验(Chi-Squared Test或χ2 Test)的基本思想是通过特征变量与目标变量之间的偏差大小来选择相关性较大的特征变量。首先假设两个变量是独立的,然后观察实际值与理论值的偏差程度,该偏差程…
概述 将训练出来的spark标准pipeline类型的模型保存到OBS里面 输入 参数 子参数 参数说明 inputs pipeline_model inputs为字典类型,pipeline_model为pyspark中的PipelineM…
概述 二分k-means算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。 分层聚类的策略一般有两种: 聚合:这是一种自底向上的方法,每一个观察者初始化本身为一类,然后两两结合。 分裂:…
概述 “随机决策森林回归”节点用于产生回归模型。随机决策森林是用随机的方式建立一个森林模型,森林由很多的决策树组成,每棵决策树之间没有关联。当有一个新的样本输入时,该样本取值为所有决策树的预测值的平均值。 随机决策森林回归中的决策树算法是递…
每个内置的算法资产内包含了算法套件、数据集、预训练模型,可以通过list命令查看内置的资产。 查询内置算法 python manage.py list algorithm 查询内置数据集 python manage.py list data…
使用ma-cli image unregister命令将注册的镜像从ModelArts中删除。 $ ma-cli image unregister -h Usage: ma-cli image unregister [OPTIONS] Un…