如何批量修改文件编码,utf-8与gbk互相批量切换?

问题:如何批量修改文件编码,例如,现有大量 utf-8 文件需要转化 gbk 编码,或者 gbk 转化为 utf-8,应该如何处理?


我们通常使用编辑器一个文件一个文件去修改,但是这样子速度太慢,我们可以使用 ide编辑器批量处理,这样子可以节省我们大量的时间。


文章来源地址https://www.toymoban.com/diary/share/192.html


准备工具


1、文本编辑器,Notepad++ 点击下载

2、插件,convertToCharset.py 这里附带说明  点击下载

import os;
import sys;
filePathSrc="D:\\www\\wwwroot\\demo\\" # 批量修改编码的文件夹
for root, dirs, files in os.walk(filePathSrc):
    for fn in files: 
        if fn[-5:] == '.html' or fn[-4:] == '.htm' or fn[-4:] == '.php': # 修改编码的文件,多个请用 or 分开,[-5:]表示后面输起来5个字符
            notepad.open(root + "\\" + fn)      
            notepad.runMenuCommand("Encoding", "Convert to Utf-8") # 修改的编码,如过是 GBK,请填入 ANSI
            notepad.save()
            notepad.close()



开始操作


1、默认安装编辑器  Notepad++


2、打开编辑器 -> 插件管理 -> 安装插件 PythonScript

image.png

image.png


3、打开插件文件夹 -> PythonScript -> scripts

把文件 convertToCharset.py 复制进去

image.png


4、重新打开编辑器,点击这里就可以运行插件,自动执行转码。重要:(请看注意事项)

image.png




注意事项


1、路径不能出现中文

2、请在英文界面下运行,不然,可能会失效。

image.png





到此这篇关于如何批量修改文件编码,utf-8与gbk互相批量切换?的文章就介绍到这了,更多相关内容可以在右上角搜索或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

原文地址:https://www.toymoban.com/diary/share/192.html

如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请联系站长进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用
未经允许不得转载:Toy模板网 » 如何批量修改文件编码,utf-8与gbk互相批量切换?
上一篇 2023年08月19日 16:45
下一篇 2023年08月19日 16:45

相关文章

  • 织梦GBK/GB2312转utf-8编码操作步骤(全站修改方法)

    目前MIP对编码是有严格要求,必须是UTF-8,那么对于大部分GBK或者GB2312的用户只能先将网站整体进行编码转换,才能进行MIP改造,不然改造后的页面是乱码一大片。 为什么MIP只支持utf-8?目前部分手机自带浏览器仅支持UTF-8,打开GBK的网站会出现乱码,所以为了手机的兼容性,

    2023年04月24日
    浏览(42)
  • 用Python把csv文件批量修改编码为UTF-8格式并转为Excel格式

    有时候用excel打开一个csv文件,中文全部显示乱码。然后手动用notepad++打开,修改编码为utf-8并保存后,再用excel打开显示正常。 使用Python通过很少代码就能将上面过程自动化。 导入3个模块 chardet 模块用于得到文件的编码格式,pandas 按照这个格式读取,然后保存为xlsx格式。

    2024年02月07日
    浏览(46)
  • python,Pandas读取csv文件gbk编码和utf-8编码都报错

    用Pandas读取csv文件,read_csv(),使用默认的 encoding = ‘utf-8’ 和 encoding = ‘gbk’ 都报错,如下图。最终通过 统一编码方式 解决了,操作很简单,但是问题解决的探索过程并不是特别顺利,所以记录一下,给朋友们参考~ 统一编码方式,将csv文件的编码格式改为utf-8。 具体操作

    2024年01月16日
    浏览(51)
  • 简单shell批量文件转换gbk转为utf8编码

    matlab打包成exe时发现中文乱码,查找发现是gbk编码问题,找半天没找到合适的批量转换编码工具,就搞了个简单的shell来实现 windows上有安装git bash命令行的话可以直接跑sh脚本,没有的话下一个很快。linux可以直接运行 方式一 将以上代码复制到记事本里 更改代码中目录和文件后

    2024年02月13日
    浏览(32)
  • Java使用UTF-8或GBK编码后还是乱码的问题

    大家在开发中可能经常遇到将String字符串转为byte[]的场景,为了避免中文乱码,一般指定字符集为GBK或UTF-8来进行编码以及解码,但是如果使用不当,同样会造成字符集乱码问题。 主要原因是进行编码以及解码的字符集不一致导致 所以,在解决字符集乱码问题时一般情况下会

    2024年02月15日
    浏览(32)
  • 【错误记录】IntelliJ IDEA 中编译运行报错 ( 当前设置 GBK 编码 | 错误: 编码UTF-8的不可映射字�? )

    当前的 IntelliJ IDEA 设置的编码为 GBK 编码 , 选择 \\\" 菜单栏 / File / Settings \\\" 选项 , 在 \\\" File Encodings \\\" 中 , 查看 工程的编码 , 运行时报错 : 在中文注释的位置 , 编码报错 ; D:\\002_Project\\003_Java_WorkExsamplesrcmainjavaArrowCanvas.java:17 : 错误: 编码UTF-8的不可映射字�? // ����ֱ�� ^

    2024年02月14日
    浏览(37)
  • 一篇文章彻底搞懂Python字符编码方式(中文编码,UTF-8,unicode,gb,gbk,中文乱码,爬虫中文乱码)

    目录 前言 一、字符编码方式的来龙去脉。 1.字符集的含义。 2.编码方式演化过程 1.ASCII 2.GB2312、GBK 3.Unicode 4.UTF-8 二、Python的字符编码及相关操作 1.window系统的字符编码 2.Python的字符编码 1.Python中str与bytes的区别和联系 2.Python encode()方法【对str进行编码】 3.Python decode()方法【对

    2024年01月17日
    浏览(43)
  • UTF-8、GB2312、GBK、GB18030、ISO-8859-1(也称Latin-1):兼容ASCII编码

    ASCII码是单字节的,首位为0,后面表示的值就是Unicode码点,范围为0x00-0x7F,共表示128个字符。 UTF-8和ASCII兼容 :因为对于单字节的符号,UTF-8 编码和 ASCII 码是相同的, 所以 UTF-8 能兼容 ASCII 编码。 GB2312和ASCII兼容 :对于ASCII范围以内的字符,GB2312编码的机内码(不是区位码)

    2024年02月16日
    浏览(30)
  • VS2017修改代码编码格式为utf-8

    对于国内用户来说,大多设置Windows操作系统语言为简体中文(编码为GBK或GB2312),由此导致Visual Studio2017默认采用GBK/GB2312编码格式,其创建的项目文件(.cpp,.h等)都采用GBK/GB2312编码,可能会给代码的移植性带来一点阻碍(主要是中文乱码),笔者就经常用VS运行github等的项目然后

    2023年04月15日
    浏览(34)
  • linux修改locale字符集编码为UTF-8/GBK,修改语言区域为zh-CN(中文-中国)

    linux系统的语言、区域、字符集编码由`locale’ [loʊˈkæl] 决定。 对应配置文件路径: centos7 /etc/locale.conf centos6 /etc/sysconfig/i18n 以下以centos&为例 LANG= LC_CTYPE=“POSIX” LC_NUMERIC=“POSIX” LC_TIME=“POSIX” LC_COLLATE=“POSIX” LC_MONETARY=“POSIX” LC_MESSAGES=“POSIX” LC_PAPER=“POSIX” LC_NAME=“

    2024年02月13日
    浏览(66)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包