华为云AI开发平台ModelArtsARIMA_云淘科技

概述

ARIMA全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average model),是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。

目前ARIMA算子只支持在Notebook环境运行,不支持DLI环境下运行。

输入

表1

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象,一般为分词后的结果

输出

表2

参数

子参数

参数说明

output

output_port_1

output为字典类型,output_port_1为pyspark中的DataFrame类型对象,为arima模型预测的结果。

参数说明

表3

参数

是否必选

描述

默认值

seq_col_name

时序列。仅用来对valueColName排序。

value_col_name

数值列。

group_col_names

分组列,多列用逗号分隔,例如col0,col1。每个分组会构建一个时间序列。

order

p、d和q分别表示自回归系数、差分、滑动回归系数。取值均为非负整数,范围为[0, 36]。

seasonal

sp、sd、sq分别表示季节因素的自回归,差分,移动平均系数,取值均为非负整数,范围为[0, 36]。

0,0,0

period

seasonal周期。数字类型,取值范围为(0, 100]。

12

predict_step

预测条数。数字类型,取值范围为(0, 365]。

12

confidence_level

预测置信水平。数字类型,取值范围为(0, 1)。

0.95

样例

数据样本

使用公开数据集AirPassengers.csv的前120行

数据示例

Month,Passengers
1949-01,112
1949-02,118
1949-03,132
1949-04,129
1949-05,121
1949-06,135
1949-07,148
1949-08,148
1949-09,136
1949-10,119
1949-11,104
1949-12,118
1950-01,115
1950-02,126
1950-03,141

配置流程

运行流程:

算法参数设置:

查看结果:

上图所示模型信息不输出到表格中,可在日志中查看。

父主题: 时间序列

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家