9:中文乱码处理-Java Web

这篇具有很好参考价值的文章主要介绍了9:中文乱码处理-Java Web。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

9.1 常见字符集

常见字符集包括:

  • ASCII(American Standard Code for Information Interchange):美国标准信息交换代码,主要用于英语字符的编码,包含128个字符。

  • ISO-8859系列:国际标准化组织制定的一系列单字节编码方案,如ISO-8859-1(Latin-1),支持西欧语言字符;ISO-8859-6用于阿拉伯语等。

  • GB2312/GBK:中国国家标准字符集,主要用于简体中文字符。GB2312是基本集,GBK是其扩展版本,包含了更多的汉字和符号。

  • Unicode(UTF-8、UTF-16)

    • UTF-8:可变长度的多字节编码,广泛应用于网页和文件存储,能表示全世界几乎所有的字符,兼容ASCII。
    • UTF-16:固定或可变长度的编码方式,每个字符使用2个或4个字节来表示,常用于内部程序处理,尤其是Java平台。
  • Big5:主要针对繁体中文字符的一种编码方式。

  • EUC-KR:韩国字符集,用于韩文编码。

  • Shift_JIS:日本字符集,用于日文编码。

9.2 乱码原因

Java语言内部采用Unicode字符集来表示字符,一旦与外界的程序打交道就会存在一个字符转换的过程。

对于Java Web应用程序,客户端浏览器采用默认的字符集(通常是GBK),而Web容器对POST提交的数据采用ISO-8859-1的编码方式,数据在这些系统中穿梭很可能就会出现乱码的问题。

乱码出现的原因通常有以下几点:

  1. 编码不一致:数据在创建、传输或存储过程中使用的字符集不一致,例如源文本用UTF-8编码,但接收端按照GBK进行解码。

  2. 默认字符集设置错误:Web服务器、数据库、浏览器或操作系统对默认字符集的设定与实际数据的编码格式不符。

  3. 未正确指定字符集:在HTTP响应头中没有明确指定Content-Type以及charset参数,导致客户端无法准确解析内容。

  4. 文件读写时字符集转换不当:在读取或写入文件时,没有正确转换字符集或者没有指定正确的编码方式。

9.3 解决乱码

解决乱码问题的方法:

  1. 统一字符集:确保在整个数据流转过程中,各个环节(如页面、数据库、服务器配置)均采用相同的字符集。

  2. 指定字符集

在HTML文档中通过<meta>标签声明网页字符集:

     <meta http-equiv="Content-Type" content="text/html; charset=utf-8">

在HTTP响应头部指定字符集:

     Content-Type: text/html; charset=utf-8

在Java编程中,解决服务器返回页面中文乱码问题:

   response.setContentType("text/html;charset=UTF-8");

解决post方式请求表单参数中文乱码问题:

 request.setCharacterEncoding("UTF-8");//注意此语句一定要设置在取参数的语句之前

解决get方式请求中文参数乱码问题:

//修改server.xml
<Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000"
  redirectPort="8443" URIEncoding="UTF-8"/>
  1. 数据库层面

    • 确保数据库连接时设置正确的字符集,如MySQL中的useUnicode=true&characterEncoding=utf8
    • 数据库表结构本身也需设置为合适的字符集。
  2. 文件操作

    • 使用Java的InputStreamReaderOutputStreamWriter时,传入正确的字符集名称。
  3. 系统环境设置

    • 检查并调整服务器、操作系统和IDE等相关软件工具的全局或局部字符集设置。

解决乱码问题的关键在于理解整个数据流程中各个阶段的字符集处理,并确保它们保持一致。对于现代Web开发,推荐使用UTF-8作为通用字符集,以最大程度减少跨平台和国际化场景下的乱码问题。文章来源地址https://www.toymoban.com/news/detail-456703.html

到了这里,关于9:中文乱码处理-Java Web的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GBASE南大通用数据库GBase 8s常见问题讲堂 -- 字符集的设置

    本文摘自GBASE南大通用社区,by:wty,原文请点击:GBase 8s常见问题 -- 字符集相关问题|GBASE社区|天津南大通用数据技术股份有限公司|GBASE-致力于成为用户最信赖的数据库产品供应商 23103   Code-set conversion function failed due to an illegal sequence or invalid value. 字符集转换失败,字符串中

    2024年01月24日
    浏览(61)
  • 高阶JAVA篇-深入了解字符集

    🔥博客主页:  小扳_-CSDN博客 ❤感谢大家点赞👍收藏⭐评论✍     文章目录        1.0 字符集的说明         1.1 ASCII  字符集         1.2 GBK 字符集         1.3 UTF-8字符集         2.0 字符集的编码与解码         2.1 编码提供了常见的方法         2.2 解码提供了常

    2024年02月06日
    浏览(43)
  • linux修改locale字符集编码为UTF-8/GBK,修改语言区域为zh-CN(中文-中国)

    linux系统的语言、区域、字符集编码由`locale’ [loʊˈkæl] 决定。 对应配置文件路径: centos7 /etc/locale.conf centos6 /etc/sysconfig/i18n 以下以centos&为例 LANG= LC_CTYPE=“POSIX” LC_NUMERIC=“POSIX” LC_TIME=“POSIX” LC_COLLATE=“POSIX” LC_MONETARY=“POSIX” LC_MESSAGES=“POSIX” LC_PAPER=“POSIX” LC_NAME=“

    2024年02月13日
    浏览(77)
  • Java基础——IO流之字符集

    (1)IO前置内容:字符集 1.字符集基础知识: 计算机底层不可以直接存储字符,只能存储二进制(0,1)。 二进制可以转换成十进制。 计算机底层可以表示十进制编号。计算机可给人类字符进行编号存储,这套编号规则就是字符集。 2.ASCII字符集:(1字节) ASCII(American S

    2023年04月17日
    浏览(45)
  • java中http请求,记得加字符集 UTF-8,StringEntity

    http请求经常会遇到一些奇怪的问题,例如发送请求失败,或者response出现问题,或者参数中带了url调接口失败,调用微信接口失败,调用nginx转发失败,等等。 但用postman调用不会有问题。 这说明参数本身没有问题,服务器也没有问题,是客户端的问题。在你的代码里面,客

    2024年02月07日
    浏览(53)
  • 华为OD机试之全量和已占用字符集(Java源码)

    题目描述 给定两个字符集合,一个是全量字符集,一个是已占用字符集,已占用字符集中的字符不能再使用。 输入描述 输入一个字符串 一定包含@,@前为全量字符集 @后的为已占用字符集 已占用字符集中的字符一定是全量字符集中的字符 字符集中的字符跟字符之间使用英文

    2024年02月07日
    浏览(55)
  • 【华为OD机试】全量和已占用字符集(python, java, c++, js)

    前言 :本专栏将持续更新华为OD机试题目,并进行详细的分析与解答,包含完整的代码实现,希望可以帮助到正在努力的你。关于OD机试流程、面经、面试指导等,如有任何疑问,欢迎联系我,wechat:steven_moda;email:nansun0903@163.com;备注:CSDN。 给定两个字符集合,一个为全

    2024年02月11日
    浏览(46)
  • 【华为OD机考 统一考试机试C卷】 全量和已占用字符集 、字符串统计(C++ Java JavaScript Python)

    2023年11月份,华为官方已经将 华为OD机考:OD统一考试(A卷 / B卷)切换到 OD统一考试(C卷)和 OD统一考试(D卷) 。根据考友反馈:目前抽到的试卷为B卷或C卷/D卷,其中C卷居多 ,按照之前的经验C卷部分考题会复用A卷,B卷题,博主正积极从考过的同学收集C卷和D卷真题。

    2024年02月05日
    浏览(38)
  • 9:中文乱码处理-Java Web

    常见字符集包括: ASCII(American Standard Code for Information Interchange) :美国标准信息交换代码,主要用于英语字符的编码,包含128个字符。 ISO-8859系列 :国际标准化组织制定的一系列单字节编码方案,如ISO-8859-1(Latin-1),支持西欧语言字符;ISO-8859-6用于阿拉伯语等。 GB2312/

    2024年02月06日
    浏览(39)
  • MySQL 字符集概念与原理及如何配置字符集 - 超详细图文详解

    目录 一、字符集概念 1、字符(Character) 2、字符编码 3、字符集(Character set) 二、字符集原理 1、ASCII字符集 2、GB2312 3、GBK 4、GB18030 5、BIG5 6、Unicode 编码 三、字符序 四、MySQL字符集 字符序 1、mysql 字符集 2、mysql 字符序 3、字符集与字符序的关系 五、MySQL 数据存储字符集

    2024年02月04日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包