华为云AI开发平台ModelArts数据集连接_云淘科技
概述
“连接”节点是关系数据库中常用的方法之一,用于以特定的方式将两个数据集联接在一起。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
left_dataframe |
inputs为字典类型,left_dataframe为执行连接操作的左数据集 |
right_dataframe |
inputs为字典类型,right_dataframe为执行连接操作的右数据集 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
outputs |
output_port_1 |
dataframe类型的数据集合并结果 |
参数说明
参数名称 |
是否必选 |
参数描述 |
默认值 |
---|---|---|---|
join_column_pairs_str |
是 |
关联条件,等式对之间以”;“分割,等式之间以”,”分割; eg. left_col1,right_col1;left_col2,right_col2; |
无 |
join_type |
是 |
支持左连接、右连接、内连接和全连接(left_join、right_join、inner_join和full join)。 |
left_join |
mapjoin |
否 |
是否进行mapjoin优化(将小表进行broadcoast广播)。 |
true |
output_left_cols |
否 |
左表输出字段列 |
若不选择,则默认为所有字段 |
output_right_cols |
否 |
右表输出字段列 |
若不选择,则默认为所有字段 |
样例
数据样本
“Persons” 表:
Id_P |
LastName |
FirstName |
Address |
City |
---|---|---|---|---|
1 |
Adams |
John |
Oxford Street |
London |
2 |
Bush |
George |
Fifth Avenue |
New York |
3 |
Carter |
Thomas |
Changan Street |
Beijing |
“Orders” 表:
Id_O |
OrderNo |
Id_P |
---|---|---|
1 |
77895 |
3 |
2 |
44678 |
3 |
3 |
22456 |
1 |
4 |
24562 |
1 |
5 |
34764 |
65 |
配置流程
运行流程
算法参数设置
查看结果
父主题: 数据处理
同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家