成功解决DataX从Hive导出Oracle的数据乱码问题！

9月前作者：笑看风云路分类：Toy博客阅读(39) 违法举报

这篇具有很好参考价值的文章主要介绍了成功解决DataX从Hive导出Oracle的数据乱码问题！。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

大数据与 RDBMS 之间的数据导入和导出都是企业日常数据处理中常见的一环，该环节一般称为 e-t-l 即 extract-transform-load。市面上可用的 etl 工具和框架很多，如来自于传统数仓和 BI 圈的 kettle/informatica/datastage, 来自于 hadoop 生态圈的 sqoop/datax，抑或使用计算引擎 spark/presto/flink 直接编写代码完成 etl 作业。
在这里跟大家分享一次使用 datax 从 hive 导出数据到 oracle 的作业的时候，出现了两边数据的编码集不一致导致的乱码问题，希望对大家遇到相同的问题时有所帮忙。

问题背景

最近接到业务人员反馈导出 oracle 数据库中的数据和 hive 中的数据不一致，hive 中明明是 "• " ，但是导出到 Oracle 后却变成了 “？”，于是，当我看到这个问题的时候，我的头脑里也出现了很多问号？
思考片刻后，于是找到 DBA 询问 oracle 数据库的编码集是什么，回答是 ZHS16GBK ，而 hive 中的编码集是 UTF-8，这就很明了了，确定是编码集不一致导致的乱码问题了。
那么如何文章来源地址https://www.toymoban.com/news/detail-646941.html

到了这里，关于成功解决DataX从Hive导出Oracle的数据乱码问题！的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【DolphinScheduler】datax读取hive分区表时，空分区、分区无数据任务报错问题解决

最近在使用海豚调度DolphinScheduler的Datax组件时，遇到这么一个问题：之前给客户使用海豚做的离线数仓的分层搭建，一直都运行好好的，过了个元旦，这几天突然在数仓做任务时报错，具体报错信息如下： com.alibaba.datax.common.exception.DataXException: Code:[HdfsReader-08], Description:[您尝

2024年01月16日
浏览(70)
Sqoop（二）：Hive导出数据到Oracle

把Hive中的数据导入Oracle数据库。 1. 解释一下各行代码： 2. 案例： 3. 表多的话，把所有表名存放在文件下，循环跑批每个表参考： https://codeleading.com/article/51121246034/#google_vignette

2024年02月10日
浏览(43)
解决hive表中文乱码问题

使用的mysql版本：Server version: 5.7.31 现象描述：字段名称和字段描述等存储进如hivemetastore是中文，查询出来也是???等无法识别的中文乱码；中文乱码的情况分为两种情况：新建hive集群防止中文乱码已有的hive集群中文乱码的纠正在构建hive开发环境的时候，需要实现构建号

2024年02月09日
浏览(43)
解决hive建表中文乱码问题

一、解决hive建表中文乱码问题问题：关于中文乱码问题，我们可以从以下几个方面进行考虑：（1）判断hive表的存储格式是否是UTF-8：如果hive表的存储格式不是UTF-8，也会导致中文乱码。（2）判断输入的数据，其编码格式是否是中文字符集UTF-8： hive默认使用UTF-8编码，如

2024年02月14日
浏览(38)
Hive中处理中文乱码问题的解决方法

中文乱码是在处理大数据时经常遇到的问题之一，尤其是在使用Hive进行数据分析和查询时。本文将介绍一些解决Hive中文乱码问题的方法，并提供相应的源代码示例。设置Hive的字符集编码在Hive中，可以通过设置字符集编码来解决中文乱码问题。通过在Hive会话中设置\\\"client.

2024年02月04日
浏览(40)
解决Hive在DataGrip 中注释乱码问题

注释属于元数据的一部分，同样存储在mysql的metastore库中，如果metastore库的字符集不支持中文，就会导致中文显示乱码。不建议修改Hive元数据库的编码，此处我们在metastore中找存储注释的表，找到表中存储注释的字段，只改对应表对应字段的编码。如下两步修改，缺一不可

2024年01月19日
浏览(39)
sqoop（DataX）-MySQL导入HIVE时间格问题

用公司的大数据平台（DataX）导数，已经开发上线一个多月的一批报表，突然有同事说有个报表数据不准。出在时间字段上。分析: 1、先看了原数据MySQL字段类型为datetime,目标字段为timestamp类型； 2、经发现所有时间的差距都是8小时，怀疑是因为时区转换的原因； 3、对比其他

2024年02月02日
浏览(49)
Oracle数据库SQL*Plus命令行执行SQL语句时，中文乱码报错解决方法

🎉欢迎来到Java学习路线专栏~Oracle数据库SQL*Plus命令行执行SQL语句时，中文乱码报错解决方法 ☆* o(≧▽≦)o *☆嗨~我是IT·陈寒🍹 ✨博客主页：IT·陈寒的博客 🎈该系列文章专栏：Java学习路线 📜其他专栏：Java学习路线 Java面试技巧 Java实战项目 AIGC人工智能数据结构学习 🍹

2024年01月22日
浏览(57)
HttpURLConnection发起请求中文数据乱码问题解决

HttpURLConnection发送POST请求时，请求参数中有中文，且请求成功后，后端显示出现乱码 POST的form没有转码的问题，服务器数据将byte转成utf8，utf8编码是3个字节对应一个字符，但如果只读了一个字节或者不为3的倍数这样强转编码就会导致乱码出现在POST方法初始化StringEntity时指定

2024年02月11日
浏览(43)
【Java文件导出乱码】java导出文件中文名乱码或下划线或百分号解决方法（已解决）附源码

【写在前面】其实导出这个功能在业务需求中是很多的，今天我就先不重点介绍导出实现过程，主要给大家讲解一下导出文件时候，文件名是中文的情况下会出现乱码、下划线等现象该如何去解决，如何理性分析。涉及知识点：java文件导出，中文名乱码，URLEncoder，java下载

2024年02月04日
浏览(49)