【Java】计算机如何存储字符&&常用编码介绍

这篇具有很好参考价值的文章主要介绍了【Java】计算机如何存储字符&&常用编码介绍。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.计算机存储字符的本质原理

计算机存储字符型数据的本质:将字符转为对应码值,然后将码值转换为二进制,最后存到计算机中。

2. 常用编码介绍

2.1 概括

采用不同的编码方式,则字符对应的码值就不同。目前常见的编码方式有:

1. ASCII码。固定使用1个字节来表示字符,可以表示128个字符。
2. Unicode码。固定使用2个字节来表示字符(字母和汉字都是)。
3. utf-8。字母用1个字节表示,汉字用3个字节表示。
4. GBK。字母用1个字节表示,汉字用2个字节表示。

2.2 ASCII编码

ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码。

【优点】只用1个字节表示字符。
【缺点】最多只表示127个字符,表示字符数量有限。
【Java】计算机如何存储字符&&常用编码介绍

2.3 Unicode编码

Unicode,统一码,又叫万国码。
是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

【优点】不会出现乱码现象。
【缺点】固定使用2个字节表示一个字符(包括字母、汉字),比较占用存储空间。

【注】Unicode码向下兼容ASCII码的

字符'a'的ASCII码值是97,对应的Unicode码值是0x0061(十进制表示就是97

2.4 UTF-8编码

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。(可以理解为是对Unicode编码的改进)

它可以用来表示Unicode编码中的任何字符,而且其编码中的第一个字节仍与ASCII相容(即同样向下兼容ASCII编码),使得原来处理ASCII字符的软件无须或只进行少部分修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

【特点】字母用1个字节表示,汉字用3个字节。文章来源地址https://www.toymoban.com/news/detail-404316.html

到了这里,关于【Java】计算机如何存储字符&&常用编码介绍的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 计算机数字编码入门篇(下)

    本文旨在为初学者提供有关计算机数字编码的基础知识,以帮助他们初步理解计算机中数字编码的概念。鉴于我个人知识的限制,如有不准确之处,欢迎指正并提供建议。 文中部分内容参考ChatGPT,在此感谢ppword的大力支持。 定点数,其关键地方就在“定”和“点”这两个字

    2024年02月08日
    浏览(35)
  • 计算机图像编码入门篇(上)

    本文旨在为初学者提供有关计算机图像编码的基础知识,以帮助他们初步理解计算机中图像编码的概念。鉴于我个人知识的限制,如有不准确之处,欢迎指正并提供建议。 文中部分内容参考ChatGPT,在此感谢ppword的支持。 我们先来看一张图片: 如果我们把它用ps打开,再放大

    2024年02月08日
    浏览(43)
  • 计算机图像编码入门篇(下)

    本文旨在为初学者提供有关计算机图像编码的基础知识,以帮助他们初步理解计算机中图像编码的概念。鉴于我个人知识的限制,如有不准确之处,欢迎指正并提供建议。 文中部分内容参考ChatGPT,在此感谢ppword的支持。 YUV是编译true-color颜色空间的种类,Y表示明亮度,U和

    2024年02月08日
    浏览(42)
  • 计算机基础--计算机存储单位

    计算机中表示文件大小、数据载体的存储容量或进程的数据消耗的信息单位。在计算机内部,信息都是釆用二进制的形式进行存储、运算、处理和传输的。信息存储单位有位、字节和字等几种。各种存储设备存储容量单位有KB、MB、GB和TB等几种。 位(bit):二进制数中的一个

    2024年02月03日
    浏览(83)
  • ASCII编码:计算机文本通信的基石

    ASCII(美国信息交换标准代码)编码是一种将字符与数字相互映射的编码系统,它为现代计算机文本通信奠定了基础。本文将从多个方面介绍ASCII编码的原理、发展历程、应用及其在现实场景中的优势,帮助您深入了解这一重要的编码技术。 Ascii编码解码 | 一个覆盖广泛主题工

    2024年02月02日
    浏览(41)
  • 计算机毕业设计 基于SSM+Vue的物资存储系统(以消防物资为例)的设计与实现 Java实战项目 附源码+文档+视频讲解

    博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇🏻 不然下次找不到哟 ——————————

    2024年02月07日
    浏览(72)
  • 计算机存储原理.2

    3.1位扩展         数据总线的利用成分是不充分的(单块只能读写一位),为了解决这个问题所以引出了位扩展。 使用多块存储芯片解决这个问题。  3.2字扩展  因为存储器买的是8k*8位的,数据总线已经被使用充分了。但是地址总线,没有被完全使用,这样就会使我们CPU的

    2024年04月27日
    浏览(44)
  • 计算机组成原理实验logisim(三)之偶校验编码与检错

    实验三的前两个实验: 国标码转区位码 汉字GB2312编码 在很多地方都找得到,我就不多说。 附上我使用过的连接:https://blog.csdn.net/gemingshun/article/details/106784595 其中我们老师提供的关于汉字字符集编码查询;中文字符集编码:GB2312、BIG5、GBK、GB18030、Unicode  的网址:https://w

    2024年04月13日
    浏览(57)
  • 计算机组成2——存储系统

    基本构成为DRAMSRAM+ROM, 工作原理为串行访问 特点是采用多体交叉提高读取速度 SRAM的读写过程如下: WE控制读写; CS为片选信号; VCC为接地端; GND为接地端。 tRC表示连续读周期的间隔; tA表示从地址有效到输出有效; tCO表示从片选有效到输出有效; 写周期也类似 tWC为wr

    2024年02月16日
    浏览(40)
  • 【计算机组成原理】存储系统

    🎄欢迎来到@边境矢梦°的csdn博文🎄 🎄本文主要梳理计算机组成原理中 存储系统的知识点和值得注意的地方 🎄 🌈我是边境矢梦°,一个正在为秋招和算法竞赛做准备的学生🌈 🎆喜欢的朋友可以关注一下🫰🫰🫰,下次更新不迷路🎆 目录 存储器的分类 半导体随机读写存

    2024年02月05日
    浏览(59)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包