华为云AI开发平台ModelArts协同过滤-Item-based_云淘科技
概述
“协同过滤-Item-based”节点用于推荐场景,它通过用户和物品之间的关系计算物品之间的相似度。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象。里面存放的为用户和item之间的记录 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
outputs |
output_port_1 |
协同过滤的推荐结果 |
参数说明
参数 |
是否必选 |
参数说明 |
默认值 |
---|---|---|---|
user_col |
是 |
用户id所在的列名 |
“user” |
item_col |
是 |
项目id所在的列名 |
“item” |
output_table_partition |
是 |
数据的并行度 |
0.5 |
similarity_type |
是 |
相似度计算公式,取值为cosine,jaccard |
“cosine” |
topn |
是 |
最近的n个物品 |
200 |
min_user_behavior |
是 |
最小的用户行为数量,取值为[0,+∞) |
2 |
max_user_behavior |
是 |
最多的用户行为数量,取值为[0,+∞) |
500 |
item_delimiter |
是 |
物品之间的分隔符 |
” “ |
kv_delimiter |
是 |
物品内部的分隔符 |
“:” |
样例
数据样本
输入数据:
user,item,click 1,1,1 1,2,1 1,5,1 1,7,1 2,2,1 2,6,1 2,9,1 3,4,1 3,5,1 3,7,1 3,9,1 4,2,1 5,3,1 6,6,1 6,8,1 6,9,1 7,4,1 7,5,1 8,1,1 8,3,1 8,4,1 9,5,1 9,8,1
配置流程
运行流程
算法参数设置
查看结果
item,similarity 7,5:0.7071067811865475 1:0.49999999999999994 2:0.49999999999999994 9:0.408248290463863 4:0.408248290463863 3,1:0.7071067811865475 4:0.5773502691896258 8,6:0.49999999999999994 9:0.408248290463863 5:0.35355339059327373 5,7:0.7071067811865475 4:0.5773502691896258 8:0.35355339059327373 1:0.35355339059327373 2:0.35355339059327373 9:0.2886751345948129 6,9:0.816496580927726 8:0.49999999999999994 2:0.49999999999999994 9,6:0.816496580927726 7:0.408248290463863 8:0.408248290463863 2:0.408248290463863 4:0.33333333333333337 5:0.2886751345948129 1,3:0.7071067811865475 7:0.49999999999999994 2:0.49999999999999994 4:0.408248290463863 5:0.35355339059327373 4,3:0.5773502691896258 5:0.5773502691896258 7:0.408248290463863 1:0.408248290463863 9:0.33333333333333337 2,7:0.49999999999999994 6:0.49999999999999994 1:0.49999999999999994 9:0.408248290463863 5:0.35355339059327373
父主题: 推荐
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家