概述 离散值特征分析通过每个离散特征的gini,entropy,gini gain,information gain,information gain ratio等和每个离散值对应的gini,entropy指标,方便对离散特征进行理解。 输…
决策树分类 梯度提升树分类 LightGBM分类 线性支持向量机分类 逻辑回归分类 多层感知机分类 朴素贝叶斯分类 随机森林分类 FM算法 GBDT PMML模型预测 多层感知机分类(pytorch) 多层感知机预测(PyTorch) 父主…
概述 LDA主题分析模型(Latent Dirichlet Allocation),由Blei等人于2003年提出的无监督学习算法,可以按照概率分布的形式给出文档集中每篇文档的主题,在文本挖掘领域,应用于文本主题识别、文本分类和文本相似度计…
上传文件至JupyterLab 从JupyterLab下载文件至本地 父主题: JupyterLab 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
修改列名 数据集列合并 数据集聚合 数据集行合并 数据集行过滤 数据集连接 数据集抽样 数据集拆分 数据集行去重 执行spark sql脚本 替换 缺失值填充 缺省值填充 修改列数据类型 数据集选择列 设置元数据 数据集按列排序 增加序列号…
二分类评估 聚类评估 模型应用 多分类评估 回归评估 混淆矩阵 父主题: 模型工程 同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851) 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
概述 对文本数据按照标点符号进行句子拆分。 该算法按照既定标点符号等进行句子拆分,并将标点符号保留在句末(给定标点符号不单独成行),一篇文章拆分成多行输出。 输入 参数 子参数 参数说明 inputs input_table 输入表表名 输…
使用ma-cli ma-job get-job命令可以查看训练作业列表或某个作业详情。 $ ma-cli ma-job get-job -h Usage: ma-cli ma-job get-job [OPTIONS] Get job de…
概述 抽取文本中的部分原句作为文本的摘要。 该算法按照既定标点符号等进行句子拆分,基于TextRank思想求出可代表该文档的句子作为其摘要。 输入 参数 子参数 参数说明 inputs input_table 输入表表名 输入参数说明 参数…
概述 提供的增加序号列组件。您可以在数据表的第一列追加ID列。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明…