华为云AI开发平台ModelArtsARIMA_云淘科技
概述
ARIMA全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average model),是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。
目前ARIMA算子只支持在Notebook环境运行,不支持DLI环境下运行。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象,一般为分词后的结果 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
output |
output_port_1 |
output为字典类型,output_port_1为pyspark中的DataFrame类型对象,为arima模型预测的结果。 |
参数说明
表3
参数 |
是否必选 |
描述 |
默认值 |
---|---|---|---|
seq_col_name |
是 |
时序列。仅用来对valueColName排序。 |
无 |
value_col_name |
是 |
数值列。 |
无 |
group_col_names |
否 |
分组列,多列用逗号分隔,例如col0,col1。每个分组会构建一个时间序列。 |
无 |
order |
是 |
p、d和q分别表示自回归系数、差分、滑动回归系数。取值均为非负整数,范围为[0, 36]。 |
无 |
seasonal |
否 |
sp、sd、sq分别表示季节因素的自回归,差分,移动平均系数,取值均为非负整数,范围为[0, 36]。 |
0,0,0 |
period |
否 |
seasonal周期。数字类型,取值范围为(0, 100]。 |
12 |
predict_step |
否 |
预测条数。数字类型,取值范围为(0, 365]。 |
12 |
confidence_level |
否 |
预测置信水平。数字类型,取值范围为(0, 1)。 |
0.95 |
样例
数据样本
使用公开数据集AirPassengers.csv的前120行
数据示例
Month,Passengers 1949-01,112 1949-02,118 1949-03,132 1949-04,129 1949-05,121 1949-06,135 1949-07,148 1949-08,148 1949-09,136 1949-10,119 1949-11,104 1949-12,118 1950-01,115 1950-02,126 1950-03,141
配置流程
运行流程:
算法参数设置:
查看结果:
上图所示模型信息不输出到表格中,可在日志中查看。
父主题: 时间序列
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家