本文将为您介绍如何使用Shell执行DataX任务。
前提条件
使用Shell执行DataX任务前,您需要进行以下准备工作:
操作步骤
- 登录DataWorks控制台,单击相应工作空间后的进入数据开发。
- 在数据开发页面,双击打开已经创建的Shell节点。在Shell节点编辑页面,输入下述代码。
shell_datax_home='/home/admin/shell_datax' mkdir -p ${shell_datax_home} shell_datax_config=${shell_datax_home}/${ALISA_TASK_ID} echo ''' { "job": { "setting": { "speed": { "channel": 1 }, "errorLimit": { "record": 0, "percentage": 0.02 } }, "content": [ { "reader": { "name": "streamreader", "parameter": { "column": [ { "value": "${bdp.system.bizdate}", "type": "string" }, { "value": "${bdp.system.cyctime}", "type": "string" }, { "value": "${params1}__${params2}", "type": "string" }, { "value": 19890427, "type": "long" }, { "value": "1989-06-04 00:00:00", "type": "date" }, { "value": true, "type": "bool" }, { "value": "test", "type": "bytes" } ], "sliceRecordCount": 10 } }, "writer": { "name": "streamwriter", "parameter": { "print": true, "encoding": "UTF-8" } } } ] } } ''' > ${shell_datax_config} params1=$1 params2=$2 datax_params='-p "-Dparams1=${params1} -Dparams2=${params2}"' echo "`date '+%Y-%m-%d %T'` shell datax config: ${shell_datax_config}" echo "`date '+%Y-%m-%d %T'` shell datax params: -p \"-Dparams1=${params1} -Dparams2=${params2}\"" /home/admin/datax3/bin/datax.py ${shell_datax_config} -p "-Dparams1=${params1} -Dparams2=${params2}" shell_datax_run_result=$? rm ${shell_datax_config} if [ ${shell_datax_run_result} -ne 0 ] then echo "`date '+%Y-%m-%d %T'` shell datax ended failed :(" exit -1 fi echo "`date '+%Y-%m-%d %T'` shell datax ended success~"
代码说明如下:
- 单击右侧的调度配置进行系统参数的配置,详情请参见调度配置模块的文档。
- 配置完成后,提交并发布Shell节点。
- 单击页面右上角的运维中心,进入运维中心页面。单击左侧导航栏中的周期运维任务 > 周期任务。
- 展开周期任务列表,单击相应节点后的更多 > 修改资源组。在修改资源组对话框中选择资源组,单击确定。
- 单击相应节点后的测试,并查看测试结果。
注明:本文为星速云原创版权所有,禁止转载,一经发现将追究版权责任!