对接大数据组件 – 华为云河南代理-西数云-郑州云淘科技有限公司

华为云云存储

概述 DataX是一个数据同步框架，实现了包括MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。OBS在大数据场景中可以替代Hado…

2023.12.18 157 0

华为云云存储

华为云对象存储OBSPresto对接OBS_云淘科技

概述 Presto分为prestoSql（现更名为Trino）和PrestoDB两大分支或是发行版。 Presto on OBS仅支持prestoSql/Trino发行版，下述对接步骤以prestoSql-333版本为例（从prestoSq…

2023.12.18 111 0

华为云云存储

华为云对象存储OBSHadoop对接OBS_云淘科技

概述 Hadoop系统提供了分布式存储、计算和资源调度引擎，用于大规模数据处理和分析。OBS服务实现了Hadoop的HDFS协议，在大数据场景中可以替代Hadoop系统中的HDFS服务，实现Spark、MapReduce、Hive等大数据生…

2023.12.18 259 0

华为云云存储

华为云对象存储OBSDruid对接OBS_云淘科技

概述 Druid专为需要快速数据查询与摄入的工作流程而设计，在即时数据可见性、即席查询、运营分析以及高并发等方面表现非常出色。通过HDFS接口对接OBS，使用OBS提供的OBSA-HDFS工具，无需重新编译druid，将OBS配置为dee…

2023.12.07 117 0

华为云云存储

华为云对象存储OBSLogstash对接OBS_云淘科技

概述 Logstash能够从多个来源采集数据、转换数据并将数据发送到存储系统中，具体请参见Logstash。本文用于描述Logstash如何对接使用OBS。注意事项请使用较新版本的logstash，例如≥7.10.2的版本，避免使用较老…

2023.12.07 126 0

华为云云存储

华为云对象存储OBSFlume对接OBS_云淘科技

概述 Flume是一个分布式的、可靠的和高可用的服务，用于收集、聚合以及移动大量日志数据，具体请参见Apache Flume。OBS在大数据场景中可以替代Hadoop系统中的HDFS服务。注意事项多sink写同一文件 OBS和HDFS在…

2023.11.03 137 0

华为云云存储

华为云对象存储OBSFlink对接OBS_云淘科技

概述 Flink是一个分布式的数据处理引擎，用于处理有界和无界流式数据。Flink定义了文件系统抽象，OBS服务实现了Flink的文件系统抽象，使得OBS可以作为flink StateBackend和数据读写的载体。注意事项 flink-…

2023.11.03 161 0

华为云云存储

华为云对象存储OBSHive对接OBS_云淘科技

概述 Hive是一个数据仓库工具，可以对存储在分布式存储中的大规模数据进行数据提取、转化和加载，它提供了丰富的SQL查询方式来进行数据分析。前提条件已安装Hadoop，具体请参见Hadoop对接OBS。对接步骤以Hive 2.3.3…

2023.11.03 129 0

华为云云存储

华为云对象存储OBS对接大数据组件_云淘科技

支持的大数据组件简介 Hadoop对接OBS Hive对接OBS Spark对接OBS Presto对接OBS Flume对接OBS DataX对接OBS Druid对接OBS Flink对接OBS Logstash对接OBS 父主题：大…

2023.08.28 316 0

华为云云存储

华为云对象存储OBS支持的大数据组件简介_云淘科技

在华为云大数据存算分离方案中，OBS除了可以与大数据平台对接外，还可以直接与开源的大数据组件对接。当前支持的大数据组件如下： Hadoop Hive Spark Flume DataX Druid Flink logstash 父主题： …

2022.10.08 126 0

标签：对接大数据组件

分类

近期文章

近期评论

友情链接

分类目录

标签： 对接大数据组件

分类

近期文章

近期评论

友情链接

分类目录

标签：对接大数据组件