Java使用UTF-8或GBK编码后还是乱码的问题

9月前作者：奋斗的阿杰分类：Toy博客阅读(40) 违法举报

这篇具有很好参考价值的文章主要介绍了Java使用UTF-8或GBK编码后还是乱码的问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

大家在开发中可能经常遇到将String字符串转为byte[]的场景，为了避免中文乱码，一般指定字符集为GBK或UTF-8来进行编码以及解码,但是如果使用不当，同样会造成字符集乱码问题。
主要原因是进行编码以及解码的字符集不一致导致
所以，在解决字符集乱码问题时一般情况下会显示指定编码和解码字符集。

// 编码
byte[] bytes = “中文”.getBytes(“UTF-8”);
// 解码
new String(bytes,“UTF-8”);

不显式指定时一般会使用默认字符集进行编码或解码，此时需要确保使用的获取默认字符集的方法一样。

// 编码获取默认字符集方法为：Charset.defaultCharset().name()
byte[] bytes =“中文”.getBytes();
// 解码获取默认字符集方法为：Charset.defaultCharset().name()
new String(bytes);

以下列出两种获取默认字符集的方法及区别：

Charset.defaultCharset().name();

System.getProperty("file.encoding")

两者的区别是：

**Charset.defaultCharset()**通过在JVM启动时通过-Dfile.encoding=UTF-8参数来进行设置。此方式只支持在jvm启动时设置一次，不支持在运行期修改。
System.getProperty(“file.encoding”) 获取的是操作系统的编码，可以通过System.setProperty("file.encoding","UTF-8")进行修改（此修改不会影响操作系统，重启jvm后丢失），支持在运行期修改。文章来源地址https://www.toymoban.com/news/detail-556408.html

到了这里，关于Java使用UTF-8或GBK编码后还是乱码的问题的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【错误记录】IntelliJ IDEA 中编译运行报错 ( 当前设置 GBK 编码 | 错误: 编码UTF-8的不可映射字�? )

当前的 IntelliJ IDEA 设置的编码为 GBK 编码 , 选择 \\\" 菜单栏 / File / Settings \\\" 选项 , 在 \\\" File Encodings \\\" 中 , 查看工程的编码 , 运行时报错 : 在中文注释的位置 , 编码报错 ; D:\\002_Project\\003_Java_WorkExsamplesrcmainjavaArrowCanvas.java:17 : 错误: 编码UTF-8的不可映射字�? // ��ֱ�� ^

2024年02月14日
浏览(48)
Python ZIpFile 解惑：GBK 编码与乱码现象

项目描述维基百科 ZIP 格式 Python 官方文档 zipfile - 使用ZIP存档搜索引擎 Google 、 Bing Zip 文件格式规范 APPNOTE.TXT 维基百科首页百度百科首页项目描述 Python 3.10.6 操作系统 Windows 10 专业版（x86-64) 压缩软件 360压缩（4.0.0.1460）本部分内容为铺垫内容，除 “乱码现象” 为必看

2024年02月01日
浏览(34)
UTF-8、GB2312、GBK、GB18030、ISO-8859-1（也称Latin-1）：兼容ASCII编码

ASCII码是单字节的，首位为0，后面表示的值就是Unicode码点，范围为0x00-0x7F，共表示128个字符。 UTF-8和ASCII兼容：因为对于单字节的符号，UTF-8 编码和 ASCII 码是相同的, 所以 UTF-8 能兼容 ASCII 编码。 GB2312和ASCII兼容：对于ASCII范围以内的字符，GB2312编码的机内码（不是区位码）

2024年02月16日
浏览(39)
Java 字符转码之UTF-8互转GBK

Java UTF-8转GBK详解 java跟python类似的做法，在java中字符串的编码是java修改过的一种Unicode编码，所以看到java中的字符串，心理要默念这个东西是java修改过的一种Unicode编码的编码。问题的关键是new String(xxx.getBytes(\\\"gbk\\\"), \\\"gbk\\\")这句话是什么意思，xxx.getBytes(\\\"gbk\\\")得到的数组编码是

2024年02月05日
浏览(34)
vscode默认gbk编码格式打开

每次打开vscode都是utf-8格式打开文件，然后满屏的中文乱码，自己手动换成gbk编码后中文显示正常，但是换多了很烦。 ctrl+shift+P 点首选项：打开用户设置加上这行在最后：然后重启就好了

2024年02月16日
浏览(32)
使用 C++ 方式实现 GBK 到 UTF-8 转码 (win / linux)

C++ 存在多种方式实现 GBK 到 UTF-8 的转码一般使用C++都会想到使用 Qt API QString 将 gbk 转为 utf-8 此种方式，可以转换 Windows 平台运行时的 gbk 编码的中文字符串为 utf-8 格式，linux 下需要使用 QTextCodec ，网上有很多，此处不做过多描述。由于项目需要去掉 Qt 依赖，或者无法使用

2024年02月09日
浏览(39)
UTF-8转GBK

参考链接：https://blog.csdn.net/yanchao7788/article/details/53196901 参考链接：你真的懂 Unicode 和 UTF-8 是什么关系吗？来看看这个就彻底懂了！_魔都飘雪的博客-CSDN博客_utf8和unicode的关系 UTF-8没办法直接转GBK，必须先转成unicode，再转成GBK 1.把UTF-8转成unicode，根据参考的链接，我做了实现

2024年02月11日
浏览(33)
使用sublime发现没有gbk编码

默认情况下，我们的 Sublime是没有 GBK编码格式设置了，为了我们的文件设置为 GBK，应当安装 GBK选项插件。安装ConvertToUTF8插件 ①首选项--package control--Install Package ②弹出新的输入框输入：ConvertToUTF8，会出现ConvertToUTF8选项，选中安装即可。 ③安装成功后，重启sublime ④比较一

2024年02月16日
浏览(47)
UTF-8、UTF-16、Unicode、GB2312、GBK、GB18030一次说清楚

1、关于存储编码和显示编码的区别。 Unicode是显示编码，UTF-8、UTF-16、GB2312、GBK、GB18030都是存储/传输方面使用，也叫做存储编码、处理编码，你在计算机上看见的所有文字都从存储编码转成显示编码后，显示出来，当你单机保存时又从显示编码转换为存储编码存储起来。 2、

2024年02月12日
浏览(47)
解决终Linux端中文乱码问题及设置UTF-8编码

简介当在终端中复制粘贴中文文本时出现乱码问题，可能是因为终端未正确设置 UTF-8 编码。本文将介绍如何通过设置语言环境和字符类型环境，以及选择正确的语言包，来解决这一问题。步骤： 1. 检查当前终端设置在终端中运行以下命令，检查当前终端的语言环境和字符

2024年02月05日
浏览(55)