• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

MPP1&SeaSQL自动gpload典型配置

2019-12-04 发表
  • 0关注
  • 0收藏 1406浏览
粉丝:4人 关注:0人

组网及说明

DE E0107环境,Hbase作为主题库,MPP1(高可用)作为应用库,业务要求从主题库Hbase将数据根据业务规则抽取并加载到MPP1中。如直接配置表抽取-表加载任务,由于该方式加载使用insert动作,当MPP1目的表数据量大了后效率极低。而goload加载数据的效率很高,所以需要组合gpload工具和达梦的etl,达梦会根据前台页面的相关治理按钮生成etl任务,做到自动完成goload的动作,同时也支持增量加载。


配置步骤

1.    配置达梦etl服务到MPP1 Master的无密码登录信任关系

2.   表抽取。达梦etl工具根据前台调用将数据源表生成表抽取任务,将抽取数据以csv格式存放在指定的路径下

3.   文件同步。达梦etl工具配置文件同步任务,将抽取出来的csv文件同步到MPP1 Master服务器,并删除etl服务器本地的文件

4.    Master节点配置goload的yaml配置文件

如源目表字段数目和顺序一致,则可 省略columns部分定义,否则需要根据导出的数据文件字段排列顺序进行定义

配置文件中源数据文件和目的表需要根据情况定义

---

VERSION: 1.0.0.1

DATABASE: JCW

USER: gpadmin

HOST: 127.0.0.1

PORT: 5434

GPLOAD:

        INPUT:

            - SOURCE:

                LOCAL_HOSTNAME:

                    - 10.127.6.96

                PORT: 8088

                FILE:

                    - /home/gpadmin/t_215001016.csv

            - COLUMNS:

                - sjsjdccjmbbh: character varying(57)

                - yylx: character varying(7)

                - yhid: character varying(32)

                - zh: character varying(64)

                - qzid: character varying(128)

                - qzmc: character varying(128)

                - fszid: character varying(64)

                - fszzh: character varying(64)

                - fsznc: character varying(64)

                - jsxxnr: character varying(4000)

                - fssj: bigint

                - bddz: character varying(2)

                - ltjlid: character varying(32)

                - sczt: character varying(1)

                - scsj: bigint

                - fsxxlx: character varying(2)

                - zl_qzksjc: timestamp(6) without time zone

                - zl_dmq1001: character varying(36)

                - zl_hcksjc: timestamp(6) without time zone

                - zl_is_problem: character varying(50)

                - zl_label_datasource: character varying(32)

                - zl_label_catalog: character varying(32)

                - zl_label_item: character varying(32)

                - zl_label_position: character varying(32)

                - zl_label_content: character varying(32)

                - zl_label_whitelist: character varying(32)

                - zl_score_std: numeric(5,2)

                - zl_score: numeric(5,2)

                - zl_xzqh: character varying(6)

                - zl_ajbh: character varying(15)

                - zl_star: integer

                - zl_zhycxgsjc: timestamp(6) without time zone

            - FORMAT: csv

            - DELIMITER: ','

        OUTPUT:

            - TABLE: dzqz.qichengwentest

            - MODE: INSERT

5.    Master节点编写远程执行脚本test.sh,用于远程执行gpload并清除数据文件

#!/bin/bash

#

gpload -f gpload1.yaml

rm -rf ./t_215001016.csv

6.    etl服务器远端执行test.sh脚本完成数据加载


配置关键点

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作