华为云AI开发平台ModelArts协同过滤-Item-based_云淘科技

概述

“协同过滤-Item-based”节点用于推荐场景,它通过用户和物品之间的关系计算物品之间的相似度。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象。里面存放的为用户和item之间的记录

输出

参数

子参数

参数说明

outputs

output_port_1

协同过滤的推荐结果

参数说明

参数

是否必选

参数说明

默认值

user_col

用户id所在的列名

“user”

item_col

项目id所在的列名

“item”

output_table_partition

数据的并行度

0.5

similarity_type

相似度计算公式,取值为cosine,jaccard

“cosine”

topn

最近的n个物品

200

min_user_behavior

最小的用户行为数量,取值为[0,+∞)

2

max_user_behavior

最多的用户行为数量,取值为[0,+∞)

500

item_delimiter

物品之间的分隔符

” “

kv_delimiter

物品内部的分隔符

“:”

样例

数据样本

输入数据:

user,item,click
1,1,1
1,2,1
1,5,1
1,7,1
2,2,1
2,6,1
2,9,1
3,4,1
3,5,1
3,7,1
3,9,1
4,2,1
5,3,1
6,6,1
6,8,1
6,9,1
7,4,1
7,5,1
8,1,1
8,3,1
8,4,1
9,5,1
9,8,1

配置流程

运行流程

算法参数设置

查看结果

item,similarity
7,5:0.7071067811865475 1:0.49999999999999994 2:0.49999999999999994 9:0.408248290463863 4:0.408248290463863
3,1:0.7071067811865475 4:0.5773502691896258
8,6:0.49999999999999994 9:0.408248290463863 5:0.35355339059327373
5,7:0.7071067811865475 4:0.5773502691896258 8:0.35355339059327373 1:0.35355339059327373 2:0.35355339059327373 9:0.2886751345948129
6,9:0.816496580927726 8:0.49999999999999994 2:0.49999999999999994
9,6:0.816496580927726 7:0.408248290463863 8:0.408248290463863 2:0.408248290463863 4:0.33333333333333337 5:0.2886751345948129
1,3:0.7071067811865475 7:0.49999999999999994 2:0.49999999999999994 4:0.408248290463863 5:0.35355339059327373
4,3:0.5773502691896258 5:0.5773502691896258 7:0.408248290463863 1:0.408248290463863 9:0.33333333333333337
2,7:0.49999999999999994 6:0.49999999999999994 1:0.49999999999999994 9:0.408248290463863 5:0.35355339059327373

父主题: 推荐

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家