算法加密与解密、字符编码与字符集

这篇具有很好参考价值的文章主要介绍了算法加密与解密、字符编码与字符集。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

加密算法

加密保证数据不会被窃取或者修改

不可逆加密算法

哈希算法

压缩映射:散列又称为哈希,是把任意长度的输入通过散列算法变换成固定长度的输出,该输出就是散列值。

哈希算法(Hash)又称摘要算法(Digest),哈希算法的目的就是为了验证原始数据是否被篡改。

主流的散列算法有MD5和SHA-1,其主要任务是验证数据的完整性

算法加密与解密、字符编码与字符集

散列算法特色算法

  1. 固定大小:散列函数能够接收任意大小数据,并输出固定大小散列值,MD5获得的散列值大小是128bit,SHA-1获得的散列值大小是160bit
  2. 雪崩效应:原始数据只要修改,计算获得的散列值将会发生巨大变化
  3. 单向:只可能从原始数据计算获得散列值,不可能从散列值恢复数据
  4. 冲突避免:几乎不能找到另一个数据和当前数据计算的散列值相同,所以散列函数能确保数据的惟一性

一个字节是8位: 

二进制8位:xxxxxxxx ,范围:00000000-11111111,表示0到255。

一位16进制数(0-F),用二进制表示是xxxx,范围:0000 - 1111,表示:0到16

1个字节=2个16进制字符


MD5算法

MD5编码工具:https://www.zxgj.cn/g/md5

Java 中,java.security.MessageDigest 中已经定义了 MD5 的计算,我们只需要简单地调用即可得到 MD5 的128 位整数,然后将此 128 位计 16 个字节转换成 16 进制表示即可。

public class Net {
    public static char hexDigits[]={'0','1','2','3','4','5','6','7','8','9',
            'A','B','C','D','E','F','G',
            'H','I','J','K','L','M','N',
            'O','P','Q','R','S','T',
            'U','V','W','X','Y','Z'};



    public static void main(String[] args) throws Exception {
        // 创建一个MessageDigest实例
        MessageDigest md = MessageDigest.getInstance("MD5");
        // 反复调用update输入数据
        md.update("心有猛虎,细嗅蔷薇".getBytes("UTF-8"));
        //MD5 的计算结果是一个128位的长整数
        byte[] result = md.digest();

//16进制字符串形式密文(方式一)----------------------------------------------------------
        System.out.println(new BigInteger(1, result).toString(16));

//16进制字符串形式密文(方式二)----------------------------------------------------------
        //把密文转换成16进制字符串的形式
        int j = result.length;
        char str[] = new char[j * 2];
        int k = 0;
        for (int i = 0; i < j; i++) {
            byte byte0 = result[i];
            str[k++] = hexDigits[byte0 >>> 4 & 0xf];
            str[k++] = hexDigits[byte0 & 0xf];
        }
        System.out.println(str);

//16进制字符串形式密文(方式三)----------------------------------------------------------
        //这时需要一个StringBuffer来存储转译后的加密字符
        StringBuffer sb = new StringBuffer();
        //加密通常使用十六进制字符加密
        char[] chars = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a',
                'b', 'c', 'd', 'e', 'f', };
        //转换为16进制字符串
        for(byte b:result){
            sb.append(chars[(b >> 4) & 15]);
            sb.append(chars[b & 15]);
        }
        System.out.println(sb.toString());
    }
}

运行结果

算法加密与解密、字符编码与字符集


加盐Salt加密

彩虹表:一个预先计算好的常用口令和它们的MD5的对照表

采取措施来抵御彩虹表攻击,方法是对每个口令额外添加随机数,这个方法称之为加盐(salt):

加盐的目的在于使黑客的彩虹表失效,即使用户使用常用口令,也无法从MD5反推原始口令

 加盐Salt加密

在原始密码密文的基础之上,再加入一个随机字符串,从而达到让用户的密码更复杂的效果。这个随机字符串,便是盐。

//3、密码加密
//生成盐
String salt = UUID.randomUUID().toString().substring(0,8);
//MD5加密相同的字符串加密后的结果一样 ,所以md5会结合加盐保证安全
String endcodePwd = DigestUtils.md5Hex(DigestUtils.md5Hex(password)+salt);
userEntity.setSalt(salt);
userEntity.setPassword(endcodePwd);
//初始化用户的默认值
byte[] encode = Base64.getEncoder().encode(("谷粉" + UUID.randomUUID().toString().substring(0, 8)).getBytes());
userEntity.setNickname(new String(encode));
userEntity.setCreateTime(new Date());
userEntity.setIntegration(0);
userEntity.setGrowth(0);
userEntity.setLevelId(1L);
userEntity.setStatus(1);
//4、保存到数据库
this.save(userEntity);

注意:salt我们也存储了 

算法加密与解密、字符编码与字符集


SHA-1算法

SHA算法实际上是一个系列,包括SHA-0(已废弃)、SHA-1、SHA-256、SHA-512等。在Java中使用SHA-1,和MD5完全一样,只需要把算法名称改为"SHA-1"

单向散列函数的安全性在于其产生散列值的操作过程具有较强的单向性。如果在输入序列中嵌入密码,那么任何人在不知道密码的情况下都不能产生正确的散列值,从而保证了其安全性

数字签名

通过散列算法可实现数字签名实现,数字签名的原理是将要传送的明文通过一种函数运算(Hash)转换成报文摘要(不同的明文对应不同的报文摘要),报文摘要加密后与明文一起传送给接受方,接受方将接受的明文产生新的报文摘要与发送方的发来报文摘要解密比较,比较结果一致表示明文未被改动,如果不一致表示明文已被篡改。

public class Net {
    public static char hexDigits[] = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
            'a', 'b', 'c', 'd', 'e', 'f'};


    public static void main(String[] args) throws Exception {
        // 创建一个MessageDigest实例
        MessageDigest md = MessageDigest.getInstance("SHA1");
        // 反复调用update输入数据
        md.update("helloworld".getBytes("UTF-8"));
        //MD5 的计算结果是一个128位的长整数
        byte[] result = md.digest();

//16进制字符串形式密文(方式一)----------------------------------------------------------
        //把密文转换成16进制字符串的形式
        int j = result.length;
        char str[] = new char[j * 2];
        int k = 0;
        for (int i = 0; i < j; i++) {
            byte byte0 = result[i];
            str[k++] = hexDigits[byte0 >>> 4 & 0xf];
            str[k++] = hexDigits[byte0 & 0xf];
        }
        System.out.println(str);

//16进制字符串形式密文(方式二)----------------------------------------------------------
        StringBuilder ret = new StringBuilder(result.length * 2);
        for (int i = 0; i < result.length; i++) {
            ret.append(hexDigits[(result[i] >> 4) & 0x0f]);
            ret.append(hexDigits[result[i] & 0x0f]);
        }
        System.out.println(ret.toString());

//16进制字符串形式密文(方式三)----------------------------------------------------------
        int i;
        StringBuffer buf = new StringBuffer("");
        for (int offset = 0; offset < result.length; offset++) {
            i = result[offset];
            if (i < 0)
                i += 256;
            if (i < 16)
                buf.append("0");
            buf.append(Integer.toHexString(i));
        }
        System.out.println(buf.toString());
    }
}

运行结果

算法加密与解密、字符编码与字符集


可逆加密算法

AES对称可逆加密

AES/DES加解密:http://www.fly63.com/tool/cipher/

AES支持三种长度的密钥:128位,192位,256位。AES128,AES192,AES256,实际上就是指的AES算法对不同长度密钥的使用。

密钥 是AES算法实现加密和解密的根本。对称加密算法之所以对称,是因为这类算法对明文的加密和解密需要使用同一个密钥。

三种填充模式

AES算法在对明文加密的时候,并不是把整个明文一股脑加密成一整段密文,而是把明文拆分成一个个独立的明文块,每一个明文块长度128bit。

NoPadding:不做任何填充,但是要求明文必须是16字节的整数倍。

PKCS5Padding(默认):如果明文块少于16个字节(128bit),在明文块末尾补足相应数量的字符,且每个字节的值等于缺少的字符数。

ISO10126Padding:如果明文块少于16个字节(128bit),在明文块末尾补足相应数量的字节,最后一个字符值等于缺少的字符数,其他字符填充随机数。

总之,AES是用来替代DES的新一代加密标准,具有128bit的分组长度,支持128、192和256比特的密钥长度

在AES中生成密钥的方法有两种:

从随机数生成

KeyGenerator类,定义一种用于生成大小为n(128、192和256)位的AES密钥的方法:

/**
 * 用于生成大小为n(128、192和256)位的AES密钥
 * @param n
 * @return
 * @throws NoSuchAlgorithmException
 */
public static SecretKey generateKey(int n) throws NoSuchAlgorithmException {
    KeyGenerator keyGenerator = KeyGenerator.getInstance("AES");
    keyGenerator.init(n);
    SecretKey key = keyGenerator.generateKey();
    return key;
}

从给定密码生成

基于密码的密钥派生功能从给定的密码派生AES秘密密钥


DES对称可逆加密

DES加密运算、解密运算使用的是同样的密钥,信息的发送者和信息的接收者必须共同持有该密钥

明文按64位进行分组密钥长64位(56 位的密钥以及附加的 8 位奇偶校验位)。

第一步:密钥的构建

/**
 * 密钥生成器
 *
 * @return
 * @throws Exception
 */
public static byte[] initKey() throws Exception {
    KeyGenerator keyGenerator = KeyGenerator.getInstance("DES");
    //初始化密钥生成器
    keyGenerator.init(56);
    //生成密钥
    SecretKey secretKey = keyGenerator.generateKey();
    //获得密钥得二进制编码形式
    return secretKey.getEncoded();
}

返回的二进制字节数组就是我们需要的秘密密钥,方便存储在文件或者以流的方式在网路传输。

-------------------------------

第二步,把二进制密钥转为SecretKey密钥对象

 /**
  * 转换密钥
  *
  * @param key
  * @return
  * @throws Exception
  */
 private static Key generateKey(byte[] key) throws Exception {
     //实例化DES密钥材料
     DESKeySpec dks = new DESKeySpec(key);
     //创建一个密匙工厂
     SecretKeyFactory keyFactory = SecretKeyFactory.getInstance("DES");
     //生成秘密密钥,并返回
     return keyFactory.generateSecret(dks);
 }

有了密钥就可以对数据加密和解密了

Cipher.getInstance("DES");可以设置为Cipher.getInstance("DES/CBC/PKCS5Padding");

分别指 "算法/工作模式/填充模式"

使用DES加密数据

/**
 * DES加密
 *
 * @param data 待加密数据
 * @param key  密钥
 * @return 加密后数据
 */
public static byte[] encrypt(byte[] data, byte[] key) throws Exception {
    //还原密钥
    Key secretKey = generateKey(key);
    //指定获取DES的Cipher对象
    Cipher cipher = Cipher.getInstance("DES");
    //初始化,设置加密模式
    cipher.init(Cipher.ENCRYPT_MODE,secretKey);
    //执行操作
    byte[] bytes = cipher.doFinal(data);
    return bytes;
}

------------------------------------------------------

使用DES解密数据

 /**
  * DES解密
  *
  * @param data 待解密数据
  * @param key  密钥
  * @return 解密后内容
  */
 public static byte[] decrypt(byte[] data, byte[] key) throws Exception {
     //还原密钥
     Key secretKey = generateKey(key);
     //实例化
     Cipher cipher = Cipher.getInstance("DES");
     //设置为解密模式
     cipher.init(Cipher.DECRYPT_MODE, secretKey);
     //执行操作
     byte[] bytes = cipher.doFinal(data);
     return bytes;
 }

测试

public static void main(String[] args) throws Exception {
    String password = "kfcKFC888888";
    byte[] key = DESUtil.initKey();//拿到密钥
    //对password加密
    byte[] encrypt = DESUtil.encrypt(password.getBytes(), key);
    System.out.println("加密后数据," +new String (encrypt,"UTF-8"));
    //对password解密
    byte[] decrypt = DESUtil.decrypt(encrypt, key);
    System.out.println("解密后数据," +new String (decrypt,"UTF-8"));
}

算法加密与解密、字符编码与字符集


RSA非对称可逆加密

RSA算法是一种非对称的加密算法(即:加密、解密的密钥不同) ,通常是生成两把密钥,分别是私钥公钥,其中私钥保密,公钥对外公开。

RSA加解密过程:使用公钥将数据加密,并通过私钥对加密信息进行解密。针对我们遇到的问题,公钥放在前端对用户名密码进行加密,私钥放在服务端对前端提交的加密数据进行解密,然后在做登陆的业务操作


字符集

字符集(Character Set):是指多个字符的集合。

不同的字符集包含的字符个数不一样、包含的字符不一样、对字符的编码方式也不一样。

ASCII字符集

编码、解码

计算机底层并没有文本文件、图片文件之分,它只是记录着每个文件的二进制序列。

字符集:包含着字符和二进制序列之间的对应关系,一个字符对应一个二进制序列。

乱码:编码、解码使用的字符集不一致导致

Windows中文本文件的默认字符集是GBK。

MySQL在8.0版本之前,默认字符集为latin1,8.0版本默认字符集为utf8mb4

ISO8859-1 字符集,也就是 Latin-1,是西欧常用字符,包括德法两国的字母。

ISO8859-2 字符集,也称为 Latin-2,收集了东欧字符。

ISO8859-3 字符集,也称为 Latin-3,收集了南欧字符。

ASCII字符集

ASCII编解码工具:https://www.matools.com/code-convert-ascii

字符编码是指一种映射规则,根据这个规则来将字符映射到相应的码点(数值)上面

ASCII字符集

ASCII字符集只包含了128字符,这个字符集收录的主要字符是英文字母、阿拉伯字母和一些简单的控制字符

ASCII 编码方式是一种固定长度的编码方式,每个字符都使用 7 位二进制编码来表示。长度为1个字节, 有符号字符型数


ASCII码对照表

在线ASCII码对照表:http://www.fly63.com/tool/ascii/

ASCII码中,

第0~32号及第127号是控制字符,常用的有LF(换行)、CR(回车);

第33~126号是字符,

其中第48~57号为0~9十个阿拉伯数字;

65~90号为26个大写英文字母,

97~122号为26个小写英文字母,

其余的是一些标点符号、运算符号等

ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字符
0 NUT 32 (space) 64 @ 96
1 SOH 33 ! 65 A 97 a
2 STX 34 " 66 B 98 b
3 ETX 35 # 67 C 99 c
4 EOT 36 $ 68 D 100 d
5 ENQ 37 % 69 E 101 e
6 ACK 38 & 70 F 102 f
7 BEL 39 , 71 G 103 g
8 BS 40 ( 72 H 104 h
9 HT 41 ) 73 I 105 i
10 LF 42 * 74 J 106 j
11 VT 43 + 75 K 107 k
12 FF 44 , 76 L 108 l
13 CR 45 - 77 M 109 m
14 SO 46 . 78 N 110 n
15 SI 47 / 79 O 111 o
16 DLE 48 0 80 P 112 p
17 DCI 49 1 81 Q 113 q
18 DC2 50 2 82 R 114 r
19 DC3 51 3 83 S 115 s
20 DC4 52 4 84 T 116 t
21 NAK 53 5 85 U 117 u
22 SYN 54 6 86 V 118 v
23 TB 55 7 87 W 119 w
24 CAN 56 8 88 X 120 x
25 EM 57 9 89 Y 121 y
26 SUB 58 : 90 Z 122 z
27 ESC 59 ; 91 [ 123 {
28 FS 60 < 92 / 124 |
29 GS 61 = 93 ] 125 }
30 RS 62 > 94 ^ 126 `
31 US 63 ? 95 _ 127 DEL
特殊字符解释
NUL空 VT 垂直制表 SYN 空转同步
STX 正文开始 CR 回车 CAN 作废
ETX 正文结束 SO 移位输出 EM 纸尽
EOY 传输结束 SI 移位输入 SUB 换置
ENQ 询问字符 DLE 空格 ESC 换码
ACK 承认 DC1 设备控制1 FS 文字分隔符
BEL 报警 DC2 设备控制2 GS 组分隔符
BS 退一格 DC3 设备控制3 RS 记录分隔符
HT 横向列表 DC4 设备控制4 US 单元分隔符
LF 换行 NAK 否定 DEL 删除

Unicode字符集

Unicode字符集

Unicode 标准始终使用十六进制数字标识唯一的码点(code point),码点用于表示该字符在字符集中的位置

Unicode字符集是一个很大的字符集合,包含了世界上几乎所有的字符,
用于表示人类语言、符号和表情等各种信息

为了在计算机中存储和传输 Unicode 字符集中的字符,需要使用一种编码方式。

UTF-8、UTF-16 和 UTF-32 都是 Unicode 字符集的编码方式,
用于将 Unicode 字符集中的字符转换成字节序列,以便于存储和传输。

UTF-8、UTF-16 和 UTF-32 : 差别在于使用的字节长度不同。只有 UTF-8 兼容 ASCII,UTF-32 和 UTF-16 都不兼容 ASCII,因为它们没有单字节编码


UTF-8编码

UTF-8编解码工具:https://www.zxgj.cn/g/utf8

UTF-8就是在互联网上使用最广的一种Unicode的实现方式。UTF-8编码是Unicode的实现方式之一。

UTF-8最大的一个特点,就是它是一种可变长度的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度

UTF-8 是一种可变长度的编码方式
  1. 对于 ASCII 字符(码点范围为 0x00~0x7F ),使用一个字节表示
  2. 对于其他 Unicode 字符,使用两个、三个或四个字节表示

常规来看,中文汉字在utf-8中,一般是占3个字节

通常 ⼀个字节=两个16进制数
过程解析:1个16进制数 = 4个⼆进制数位,2个16进制数 = 8个⼆进制数位 = 1字节

一位16进制数(用二进制表示是xxxx)最多只表示到15(即对应16进制的F)

算法加密与解密、字符编码与字符集


UTF-8 字节数

UTF-8 使用 1 个字节表示 ASCII 字符
UTF-8 使用 2 个字节表示带有附加符号的拉丁文、希腊文等;
UTF-8 使用 3 个字节表示其他基本多文种平面(BMP)中的字符(包含了大部分常用字,如大部分的汉字);
UTF-8 使用 4 个字节表示 Unicode 辅助平面的字符。

UTF-8 编码的规则:

在 ASCII 码范围内的代码点,UTF-8 使用 1 个字节表示。


大于 ASCII 码范围的代码点,UTF-8 使用多个字节表示。UTF-8 使用第一个字节的前几位表示该 Unicode 字符的字节长度(第一个字节的开头 1 的数目就是该 Unicode 字符的字节长度),其余字节的前两位固定为 10,作为标记


如果第一个字节的前两位为 1,第三位为 0(110xxxxx),则表示 UTF-8 使用 2 个字节表示该 Unicode 字符;
如果第一个字节的前三位为 1,第四位为 0(1110xxxx),则表示 UTF-8 使用 3 个字节表示该 Unicode 字符;
依此类推;
如果第一个字节的前四位为 1,第五位为 0(11110xxx),则表示 UTF-8 使用 4 个字节表示该 Unicode 字符;

算法加密与解密、字符编码与字符集


UTF-16编码和UTF-32 编码

UTF-16 是一种固定长度的编码方式。使用 2 个或者 4 个字节来存储
对于 Unicode 编号范围在 0 ~ FFFF 之间的字符,UTF-16 使用两个字节存储,并且直接存储 Unicode 编号,不用进行编码转换,这跟 UTF-32 非常类似。
对于 Unicode 编号范围在 10000~10FFFF 之间的字符,UTF-16 使用四个字节存储,
UTF-32 是一种固定长度的编码方式,对于所有 Unicode 字符,使用四个字节表示

GBK相关字符集

GB2312字符集

GB2312 :《信息交换用汉字编码字符集》

GB2312 是一个较为简单的字符集,只包含了常用的汉字和符号,因此对于一些较为罕见的汉字和生僻字, GB2312 不能满足需求,现在已经逐渐被 GBK GB18030 等字符集所取代
GB2312和GBK都是在 ASCII 的基础上发展起来的,它们都兼容 ASCII,

以 GB2312 为例,该字符集收录的字符较少,所以使用 1~2 个字节编码。

  • 对于 ASCII 字符,使用一个字节存储,并且该字节的最高位是 0;
  • 对于中国的字符,使用两个字节存储,并且规定每个字节的最高位都是 1。

GB2312汉字编码规则

GB2312 把每个汉字都编码成两个字节,第一个字节是高位字节,第二个字节是低位字节


GBK 字符集

GBK:《汉字内码扩展规范》

GBK 包含了 GB2312 字符集中的字符,同时还扩展了许多其他汉字字符和符号,共收录了 21,913 个字符。

GBK 编码是一种变长的编码方式,
1、对于 ASCII 字符(码位范围为 0x00 到 0x7F),使用一个字节表示
2、对于其他字符,使用两个字节表示

GB18030 字符集

GB18030 全称《信息技术 中文编码字符集》 ,共收录七万多个汉字和字符, 它在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符,完全兼容 GB2312,基本兼容 GBK

算法加密与解密、字符编码与字符集

编码方式 

浏览器百分号编码

URL编解码工具:http://tool.chinaz.com/tools/urlencode.aspx?jdfwkey=lbixz1

算法加密与解密、字符编码与字符集

URL 只能使用 ASCII 字符集来通过因特网进行发送。由于 URL 常常会包含 ASCII 集合之外的字符,URL 必须转换为有效的 ASCII 格式。

转化格式为:URL 编码使用 "%" 其后跟随两位的十六进制数来替换非 ASCII 字符

浏览器提交数据时默认会使用UrlEcode对内容进行编码,tomcat服务器默认会使用UrlDecode对内容进行解码,来解决中文乱码问题

测试一:

UrlEncode编码,对acsII码表中的大部分内容不会处理

//测试UrlEncode编码:
//1、编码:对acs码表中的大部分内容不会处理
String s ="abc123456.";
String encode = URLEncoder.encode(s, "UTF-8");
System.out.println("编码后: "+encode);
//2、解码
String decode = URLDecoder.decode(encode, "UTF-8");
System.out.println("解码后: "+decode);

算法加密与解密、字符编码与字符集

测试二:使用UrlEcode解决中文乱码

//测试UrlEncode编码:
//1、编码:UTF-8的中文会转为三个%组成的字符串
String s ="http://localhost:8080?keyword=华为手机";
String encode = URLEncoder.encode(s, "UTF-8");
System.out.println("编码后: "+encode);
//2、解码
String decode = URLDecoder.decode(encode, "UTF-8");
System.out.println("解码后: "+decode);

算法加密与解密、字符编码与字符集


Base64编码

BASE64编解码工具:https://base64.supfree.net/

jwt: jwt将载荷头 签名 使用Base64的算法处理后得到一个可读的字符串

base64:提供了64个字符
    a~z  A~Z   0~9   /  +       = 保留字符 不解析
    以后需要base64处理的字符串,每个字符只要可以转为64个字符的某一个就没有乱码
 
base64将数据转为字节数组,每3个字节重新分为一组,如果一组不足三个使用=补齐
再将三个字节拆分为4个字节,并在高位补充0

//1 byte = 8bit
         [ 1010 0101 ]  [ 1110 0101 ]  [ 0010 0101 ]
拆分后    [ 00 1010 01 ]  [ 00 01 1110  ]  [ 00 0101 00 ] [00 10 0101]

处理后每个字节最大是00 1111 11    取值范围一共有64种可能,每一个值对应base64提供的码表中的一个字符 a~z  A~Z   0~9   /  +

String s = "金三银四?";
byte[] encode = Base64.getEncoder().encode(s.getBytes("UTF-8"));
String s1 = new String(encode);
System.out.println("base64编码后:"+s1);
byte[] decode = Base64.getDecoder().decode(s1);
String s2 = new String(decode);
System.out.println("解码后: "+s2);

算法加密与解密、字符编码与字符集

如果把字符串改为:

String s = "金三银四a";

算法加密与解密、字符编码与字符集

如果把字符串改为:

String s = "金三银四ab";

算法加密与解密、字符编码与字符集文章来源地址https://www.toymoban.com/news/detail-437267.html

到了这里,关于算法加密与解密、字符编码与字符集的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 字符集与字符编码的区别与演进(ASCII、GBK、UNICODE)

    需要注意字符集和字符编码是不同的。比如当我们提到“数据库使用的是unicode字符集”,这样的说法是错误的,数据库中的数据一定要具体到某一种字符编码,只提到字符集是没有意义的,例如数据库使用UFT-8编码。 字符集:字符和字符码的映射关系,例如在ASCII中a的字符码

    2023年04月18日
    浏览(32)
  • Redis如何把字符集的编码格式设置为UTF-8

    一、问题复现(编码错乱)         刚安装好的redis在使用的过程中,若使用到了汉字,则在显示的时候,汉字是不能够正常显示的,因为redis在解析的过程中,会将汉字转换成其他编码的格式,如下图: 二、Redis支持哪些类型的编码?         Redis是一款开源的内存数据

    2024年02月02日
    浏览(41)
  • 字符集与字符编码(理解ASCII、ANSI、UTF-8、Unicode,解决各种乱码问题)

    相信很多同学也像我一样,经常在工作和学习中遇到字符编码的疑惑或者受到乱码的困扰,每次遇到问题都需要去学习了解不同的名词含义甚至需要深入学习不同的编码机制,不胜烦恼,所以今天我将自己的学习心得记录下来,希望能简单明了地描述字符集和字符编码。 首先

    2024年02月03日
    浏览(43)
  • 达梦数据库支持GB18030-2022中文编码字符集证明方法

    既然是证明就要做到有图有真相。 证明途径1:系统概览法 查看达梦数据库“管理工具”-“对象导航”-“管理服务器”-“系统概览”-“字符集编码”-”GB18030”. 看见”GB18030”字样就是证据之一。如果你没有看见这个字样,而是UTF8等其他字样,请重新安装产品吧,安装向导

    2023年04月18日
    浏览(57)
  • 如何配置达梦数据库使其支持GB18030-2022中文编码字符集

    达梦版本要求,要求使用2023年4月及之后的达梦月度版版本,补丁版、临时版等不可以。 正确安装windows操作系统,windows10以下的版本未做过测试,可能系统不支持导致各种显示错误,建议用windows10及以上版本,本人亲测过window10和windows11支持. 安装一个字体覆盖全的字库,w

    2024年02月09日
    浏览(60)
  • 有限字符集的字符串压缩算法

    在开发中,经常有上报线上堆栈来分析处理线上问题的场景,所以,对堆栈的压缩和加密也是必不可少的。加密:可以使用AES对称加密算法,压缩:可以在上传时利用protobuf天生的压缩性对字符串进行压缩。 不过,出于对流量的节省和传输效率的提升,可以通过在堆栈上传前

    2024年02月11日
    浏览(62)
  • linux修改locale字符集编码为UTF-8/GBK,修改语言区域为zh-CN(中文-中国)

    linux系统的语言、区域、字符集编码由`locale’ [loʊˈkæl] 决定。 对应配置文件路径: centos7 /etc/locale.conf centos6 /etc/sysconfig/i18n 以下以centos&为例 LANG= LC_CTYPE=“POSIX” LC_NUMERIC=“POSIX” LC_TIME=“POSIX” LC_COLLATE=“POSIX” LC_MONETARY=“POSIX” LC_MESSAGES=“POSIX” LC_PAPER=“POSIX” LC_NAME=“

    2024年02月13日
    浏览(75)
  • MySQL 字符集概念与原理及如何配置字符集 - 超详细图文详解

    目录 一、字符集概念 1、字符(Character) 2、字符编码 3、字符集(Character set) 二、字符集原理 1、ASCII字符集 2、GB2312 3、GBK 4、GB18030 5、BIG5 6、Unicode 编码 三、字符序 四、MySQL字符集 字符序 1、mysql 字符集 2、mysql 字符序 3、字符集与字符序的关系 五、MySQL 数据存储字符集

    2024年02月04日
    浏览(52)
  • (三) MySQL字符集

    MySQL字符集包括 基字符集 (CHARACTER)与 校对规则 (COLLATION)这两个概念: latin1支持西欧字符、希腊字符等 gbk支持中文简体字符 big5支持中文繁体字符 utf8几乎支持世界所有国家的字符 utf8mb4是真正意义上的utf-8 查看当前数据库默认的字符集: SHOW VARIABLES like \\\'character%\\\'; MySQL在

    2024年01月24日
    浏览(58)
  • 字符集详解

    计算机底层不可以直接存储字符的。 计算机中底层只能存储二进制(0、1) 。 二进制是可以转换成十进制的。 结论:计算机底层可以表示成十进制编号。计算机可以给人类字符进行编号存储,这套编号规则就是字符集。 ASCII(American Standard Code for Information Interchange,美国信息交

    2024年02月07日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包