导出数据
在 Sqoop 中,"导出" 概念指: 从大数据集群 (HDFS,HIVE,HBASE) 向非大数据集群 (RDBMS) 中传输数据, 叫做: 导出, 即使用 export 关键字.
HIVE/HDFS 到 RDBMS
- $ bin/sqoop export
- --connect jdbc:MySQL://hadoop102:3306/company
- --username root
- --password 000000
- --table staff
- --num-mappers 1
- --export-dir /user/hive/warehouse/staff_hive
- --input-fields-terminated-by "\t"
提示: MySQL 中如果表不存在, 不会自动创建
脚本打包
使用 opt 格式的文件打包 sqoop 命令, 然后执行
1) 创建一个. opt 文件
- $ mkdir opt
- $ touch opt/job_HDFS2RDBMS.opt
2) 编写 sqoop 脚本
- $ vi opt/job_HDFS2RDBMS.opt
- export
- --connect jdbc:MySQL://hadoop102:3306/company
- --username root
- --password 000000
- --table staff
- --num-mappers 1
- --export-dir /user/hive/warehouse/staff_hive
- --input-fields-terminated-by "\t"
3)执行该脚本
$ bin/sqoop --options-file opt/job_HDFS2RDBMS.opt
来源: http://www.bubuko.com/infodetail-3073181.html