Java Unicode和中文编码转换

这篇具有很好参考价值的文章主要介绍了Java Unicode和中文编码转换。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

java 中文转unicode,java,开发语言

        今天在开发项目的时候,第三方提供的接口返回的数据是经过Unicode编码的,我们使用的时候多有不便,所以经过代码将Unicode解码才能使用,故记录一下使用Java进行Unicode和中文的互转。通常我们在安全优先级不是特别高但是又不想使用明文的情况下就可以使用这中方式进行加密、解密。

加密:将中文字符转换成Unicode字符

	/**
	 * @Title: unicodeEncode
	 * @Description: 将中文字符转换成Unicode字符
	 * @param string
	 * @return
	 */
	public static String unicodeEncode(String string) {
		char[] utfBytes = string.toCharArray();
		String unicodeBytes = "";
		for (int i = 0; i < utfBytes.length; i++) {
			String hexB = Integer.toHexString(utfBytes[i]);
			if (hexB.length() <= 2) {
				hexB = "00" + hexB;
			}
			unicodeBytes = unicodeBytes + "\\u" + hexB;
		}
		return unicodeBytes;
	}

 解码:将Unicode的编码转换为中文da

/**
	 * @param string
	 * @return 转换之后的内容
	 * @Title: unicodeDecode
	 * @Description: 将Unicode的编码转换为中文
	 */
	public static String unicodeDecode(String string) {
		Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
		Matcher matcher = pattern.matcher(string);
		char ch;
		while (matcher.find()) {
			ch = (char) Integer.parseInt(matcher.group(2), 16);
			string = string.replace(matcher.group(1), ch + "");
		}
		return string;
	}

单元测试:可以看到只有中文会加密、解码。英文是不影响的。文章来源地址https://www.toymoban.com/news/detail-641820.html

public static void main(String[] args) {
   String str = "你好,hello word";
   // 加密 中文 -> Unicode
   String unicodeEncode = unicodeEncode(str);
   System.out.println(str + " ---> " + unicodeEncode);
   // 解码 Unicode -> 中文
   String zh_str = unicodeDecode(unicodeEncode);
   System.out.println(unicodeEncode + " ---> " + zh_str);
}

到了这里,关于Java Unicode和中文编码转换的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Unicode编码的魅力:跨语言交流的桥梁

    Unicode编码是一种用于表示世界上所有字符的标准编码方式。它解决了字符集兼容性和多语言文本处理的难题,成为实现全球化软件的关键技术。本文将深入探讨Unicode编码的优点与缺点,并介绍它在文本处理、多语言网站开发等方面的应用。 Unicode编码解码 | 一个覆盖广泛主题

    2024年02月19日
    浏览(34)
  • Unicode编码解码的全面介绍

    1. Unicode的起源和发展 Unicode是一个国际标准,旨在统一世界上所有文字的表示方式。它最初由Unicode协会创立,解决了不同字符集之间的兼容性问题。Unicode的发展经历了多个版本,每个版本都增加了新的字符和特性,以适应不断增长的全球化需求。 Unicode编码解码 | 一个覆盖广

    2024年04月08日
    浏览(32)
  • HTML,url,unicode编码

    HTML实体编码 实体表示: 以符号开始,后面跟着一个预定义的实体的名称,或是一个#符号以及字符的十进制数字。 例: urlcode编码 URL 是“统一资源定位符”(Uniform Resource Locator),表示各种资源的互联网地址。 URL 字符转义的方法是,字符的十六进制 ASCII 码前面加上百分号

    2024年02月14日
    浏览(38)
  • 编码类型 ASCII URLcode编码 Unicode编码 utf编码理解

    bin是二进制 oct是八进制 hex是16进制 Ord() 检测 ASCII 码, python3 也可查中文 phello/p !-- 等同于 -- 十进制 p # 104 ; #101;#108;#108;#111;/p !-- 等同于 --    2.  十六进制 p #x 68 ; #x65;#x6c;#x6c;#x6f;/p Cyberchef---实体编码转换工具 lt;scriptgt;   虽然前端页面可以识别这种编码但是不会执行语句功

    2024年02月16日
    浏览(46)
  • 【Python 中的 Unicode 编码解析与实践】

    【Python 中的 Unicode 编码解析与实践】 在 Python 中,Unicode 常常被用作编码方案,使得程序具备了更好的字符编码能力。本文将探讨 Python 中的 Unicode 编码相关知识,并提供实践案例演示。 Python 中的 Unicode 编码是一种全球范围内通用的字符编码,涵盖了几乎所有语言和符号。

    2024年02月12日
    浏览(37)
  • java http请求url有空格,通过unicode方法处理

    在Java中,可以通过Unicode编码来处理URL中的空格等特殊字符,将其转换为%xx的形式。下面是一个处理示例: 以上代码中,我们使用了URLEncoder.encode()方法将URL中的特殊字符进行编码,并将所有的+替换为%20,表示空格的编码。使用时,只需要传入需要编码的URL即可,例如: 输出

    2024年02月12日
    浏览(42)
  • 字符集与字符编码的区别与演进(ASCII、GBK、UNICODE)

    需要注意字符集和字符编码是不同的。比如当我们提到“数据库使用的是unicode字符集”,这样的说法是错误的,数据库中的数据一定要具体到某一种字符编码,只提到字符集是没有意义的,例如数据库使用UFT-8编码。 字符集:字符和字符码的映射关系,例如在ASCII中a的字符码

    2023年04月18日
    浏览(34)
  • idea properties配置文件中的中文显示为unicode转中文显示

    一、前言 如图所示,有时候我们项目里的properties配置文件中的中文显示为unicode编码格式如下图所示,无法查看其真正意思。有的人会找unicode转换工具查看,这样很麻烦,有一个好办法。 二、步骤 1、通过Settings显示成中文的,方法:File-Settings,在Settings搜索框上搜索File E

    2024年02月11日
    浏览(39)
  • 字符集与字符编码(理解ASCII、ANSI、UTF-8、Unicode,解决各种乱码问题)

    相信很多同学也像我一样,经常在工作和学习中遇到字符编码的疑惑或者受到乱码的困扰,每次遇到问题都需要去学习了解不同的名词含义甚至需要深入学习不同的编码机制,不胜烦恼,所以今天我将自己的学习心得记录下来,希望能简单明了地描述字符集和字符编码。 首先

    2024年02月03日
    浏览(44)
  • MySQL 8.0 Reference Manual(读书笔记37节-- 字符编码(4)-Unicode Support)

    The Unicode Standard includes characters from the Basic Multilingual Plane (BMP) and supplementary characters that lie outside the BMP. This section describes support for Unicode in MySQL. BMP characters have these characteristics: • Their code point values are between 0 and 65535 (or U+0000 and U+FFFF). • They can be encoded in a variable-length encodin

    2024年04月14日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包