华为云AI开发平台ModelArts句子拆分_云淘科技

概述

对文本数据按照标点符号进行句子拆分。

该算法按照既定标点符号等进行句子拆分,并将标点符号保留在句末(给定标点符号不单独成行),一篇文章拆分成多行输出。

输入

参数

子参数

参数说明

inputs

input_table

输入表表名

输入参数说明

参数名称

参数描述

参数要求

doc_id_col

标识文章的id列

string类型;必填;仅支持一列

doc_content

用于句子拆分的列名

string类型;必填;仅支持一列

delimiter

用于拆分句子的标点符号

string类型;必填;默认为”,,。:“”??!!;;”

输出

参数

子参数

参数说明

output

output_port_1

输出表表名;标签为dataframe

输出表说明

列名

列名描述

备注

xx

非句子拆分列

保持原列名和内容

xx

句子拆分列

原列名和拆分后的单个句子

样例

数据输入

id

text

1

在周六的早晨,我喜欢煎个鸡蛋,煮一杯红底薏米粥,窝在榻榻米中慢慢苏醒。

2

在一九一三年的五月,这座边陲小镇迎来了带领他们走向未来一百年繁华的人,这一天注定不平凡。

配置流程

运行流程

输入参数

输出结果

id

text

1

在周六的早晨,

1

我喜欢煎个鸡蛋,

1

煮一杯红底薏米粥,

1

窝在榻榻米中慢慢苏醒。

2

在一九一三年的五月,

2

这座边陲小镇迎来了带领他们走向未来一百年繁华的人,

2

这一天注定不平凡。

父主题: 文本

同意关联代理商云淘科技,购买华为云产品更优惠(QQ 78315851)

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家