Python 程序设计入门(024)—— Python 的文件操作

这篇具有很好参考价值的文章主要介绍了Python 程序设计入门(024)—— Python 的文件操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Python 程序设计入门(024)—— Python 的文件操作

为了能够长期保存程序中的数据,需要将其保存到磁盘文件中。Python 提供了内置的文件对象和对文件、目录进行操作的内置模块。

一、文件对象

Python 中内置了文件(file)对象,使用文件对象时,需要先通过内置的 open() 函数创建一个文件对象,然后通过该对象提供的方法进行操作。

使用 open() 函数一定要保证关闭文件对象,即调用 close() 函数。open() 函数的语法格式如下:

file = open(filename, mode = "r", buffering = -1, encoding = None)

说明:

(1)filename:要创建或打开的文件名(必须),使用单引号或双引号括起来。如果要打开的文件和当前文件在同一目录下,可以不带路径,否则需要指定完整路径。

(2)mode:指定文件的打开模式(可选),默认的打开模式为只读(r),mode 的取值如下表所示:

取值 含义 说明
t 文本模式(默认)
r 以只读模式打开文件。文件的指针将会放在文件的开头。 文件必须存在
rb 以二进制格式打开文件,并且采用只读模式。文件的指针将会放在文件的开头。 文件必须存在
r+ 打开文件后,可以读取文件内容,也可以写入新的内容覆盖原有内容(不清空原文件,从第一个字符开始逐步替换)。
比如文件中原有内容为:123456789,写入abc,则文件内容为:abc456789
文件必须存在
rb+ 以二进制格式打开文件,并且采用读写模式,文件的指针将会放在文件的开头。 文件必须存在
w 以只写模式打开文件 如果文件已存在,则将其覆盖,否则创建新文件
wb 以二进制格式打开文件,并且采用只写模式。一般用于非文本文件,如图片、声音等。 如果文件已存在,则将其覆盖,否则创建新文件
w+ 打开文件后,先清空原有内容,使其变为一个空文件,对这个空文件有读写权限。 如果文件已存在,则将其覆盖,否则创建新文件
wb+ 以二进制格式打开文件,并且采用读写模式。一般用于非文本文件,如图片、声音等。 如果文件已存在,则将其覆盖,否则创建新文件
a 以追加模式打开文件。如果该文件已存在,文件指针放在文件的末尾(新内容会被写到已有内容之后)。否则,创建新文件用于写入。 如果文件已存在,则将新内容追加到原文件结尾,否则创建新文件并写入新内容
ab 以二进制格式打开文件,并且采用追加模式。如果该文件已存在,文件指针将放在文件末尾(新内容会被写到已有内容之后)。否则,创建新文件用于写入。 如果文件已存在,则将新内容追加到原文件结尾,否则创建新文件并写入新内容
a+ 以读写模式打开文件。如果该文件已存在,文件指针将放到文件的末尾(新内容会被写到已有内容之后)。否则,创建新文件用于读写。 如果文件已存在,则将新内容追加到原文件结尾,否则创建新文件并写入新内容
ab+ 以二进制格式打开文件,并且采用追加模式。如果该文件已存在,文件指针将放到文件末尾(新内容会被写到已有内容之后)。否则,创建新文件用于读写。 如果文件已存在,则将新内容追加到原文件结尾,否则创建新文件并写入新内容

mode 参数的用法如下:

常用的 mode 取值组合如下:
(1)r 或 rt:默认模式,文本模式、只读模式
(2)rb:二进制模式
(3)w 或 wt:文本模式、只写模式,打开之前文件被清空
(4)wb:二进制模式、写模式,打开之前文件被清空
(5)a:追加模式,只能写在文件末尾
(6)a+:可读写模式,写操作只能写在文件末尾
(7)w+:可读写模式,与 a+ 的区别就是写之前先清空文件内容
(8)r+:可读写模式,写之前先清空文件内容

说明:
(1)r(只读模式)、w(只写模式)、a(追加模式)为打开文件的基本模式。
(2)b(二进制模式)、t(文本模式)、+(读写模式) 与以上三个模式可以混合使用。
(3)r、rb、r+,rb+ 模式要求文件必须存在。r 与 rb 表示只读模式。r+ 与 rb+ 表示可读写,写入的新内容会替换文件中的原有内容。
(4)w、wb、w+、wb+ 模式下,如果文件已创建,则覆盖原文件,如果文件不存在,则创建新文件。w 与 wb 表示只能写入,不能读取。w+ 与 wb+ 表示可读写,但写入的内容会替换文件中的原有内容。
(5)a、ab、a+、ab+ 模式下,如果文件已创建,则将新内容追加到原文件的结尾,如果文件不存在,则创建新文件并写入新内容。a 和 ab 表示以追加模式打开文件,无法读取文件内容。a+ 和 ab+ 表示以读写方式打开文件。

(3)buffering:用于指定读写文件的缓冲模式(可选),取值为 0 时表示不缓存;取值为 1 时表示缓存;如果取值大于 1,则表示缓冲区的大小。如果取负值,缓冲区的大小则为系统默认。默认值为 -1。

(4)encoding:编码方式。Windows 系统默认是 gbk 编码,所以桌面生成的 TXT 之类的文件都是gbk 编码的。

例如:

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

二、读取文件内容的方法

读取文件内容通常使用 file 对象的 3 个方法:(1)使用 read() 方法读取全部或部分内容;(2)使用 readline() 方法逐行读取文件内容;(3)使用 readlines() 方法读取所有内容。

也可以使用 for 循环读取文件内容。

1、read() 方法

read() 方法用于读取文件的全部或部分内容。read() 方法的语法格式如下:

file.read([size]) 

说明:

(1)size 为可选参数,用于指定要读取文件内容的字符数(所有字符 size 均为 1,包括汉字)。如果省略,则返回文件的所有内容。

(2)使用 read() 方法读取文件内容时,如果文件大于可用内存,则不能实现对文件的读取,返回空字符串。

例如:

(1)读取文件的全部内容

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

(2)读取 25 个字符

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read(25))
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,
2、readline() 方法

readline() 方法用于每次读取一行数据。readline() 方法的语法格式如下:

file.readline() 

例如:

(1)读取一行数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.readline())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号

(2)读取 5 行数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
for i in range(5):
    print(file1.readline(),end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654

(3)读取全部数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
while True:
    line = file1.readline()
    if line == "":
        break
    print(line,end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415
3、readlines() 方法

readlines() 方法返回一个列表,列表中每个元素为文件中的行数据。readlines() 方法的语法格式如下:

file.readlines()

例如:

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
list1 = file1.readlines()
print("类型",type(list1))
print("列表长度:",len(list1))
print("列表内容如下:")
print(list1)
print("遍历列表内容:")
for item in list1:
    print(item,end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
类型 <class 'list'>
列表长度: 13
列表内容如下:
['姓名,性别,出生日期,院系,班级,手机号\n', '张平,女,2002-12-5,经济与管理学院,信管201班,13603735216\n', '刘涛,男,2002-10-15,经济与管理学院,信管201班,13603733334\n', '张静静,女,2003-8-6,经济与管理学院,信管212班,13603734243\n', '王强,男,2003-6-25,经济与管理学院,信管212班,13603736654\n', '张海洋,男,2002-7-9,机电学院,机制211班,13603737778\n', '刘思雨,女,2001-8-30,机电学院,机制211班,13603736538\n', '王彦强,男,2002-7-31,机电学院,机制212班,13603736528\n', '刘朝辉,男,2001-7-6,机电学院,机制201班,13603736235\n', '王鹏,男,2002-9-27,机电学院,机制201班,13603734215\n', '刘燕燕,女,2001-8-22,文法学院,法学201班,13603733685\n', '王芸,女,2002-6-30,文法学院,法学201班,13603733322\n', '刘云飞,男,2002-9-21,文法学院,法学201班,13603733415']
遍历列表内容:
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415
4、使用 for 循环读取文件内容

使用 for 循环读取文件内容格式如下:

file1 = open(filename, mode)
for line in file:
    print(line)

或:
file1 = open(filename, mode)
for line in file.readlines():
    print(line)

例如:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = 'utf-8') as file1:
        for line in file1:
            print(line,end="")
else:
    print("要打开的文件不存在!")
    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

或者:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = 'utf-8') as file1:
        for line in file1.readlines():
            print(line,end="")
else:
    print("要打开的文件不存在!")
        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

三、文件指针的操作

除了文件读取操作,有时还需要进行获取或移动指针位置的操作。

1、tell() 方法

tell() 方法返回一个整数,表示文件指针的当前位置,即在二进制模式下距离文件头的字节数。tell() 方法的语法格式如下:

file.tell()
说明:使用 tell() 方法返回的位置与 read() 中 size 参数不同。read() 方法中的 size 参数为字符数,tell() 方法返回的是字节数。汉字所占的字节数和字符编码有关,如果采用 GBK 编码,一个汉字占 2 个字节,如果采用 UTF-8 编码,一个汉字占 3 个字节。

修改放表称为单链表。

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
file1.readlines()
print("readlines()方法把指针移动到文件结尾:",file1.tell())
file1.seek(0)  # 把指针移动到文件头
file1.readline()
print("readline()方法把指针移动到下一行的开头:",file1.tell())
file1.seek(0)  # 把指针移动到文件头
file1.read(25)
print("read(25)方法把指针移动到第25个字符:",file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
readlines()方法把指针移动到文件结尾: 825
readline()方法把指针移动到下一行的开头: 52
read(25)方法把指针移动到第25个字符: 62
2、seek() 方法

seek() 方法用于将文件的指针移动到新的位置,位置通过字节数指定。这里的数值与 tell() 方法返回的数值计算方法一致。seek() 方法的语法格式如下:

file.seek(offset [,whence])
说明:
(1)offset:用于指定移动的字节数。具体位置与 whence 参数有关。
(2)whence:指定从什么位置开始计算。值为 0 表示从文件头开始计算(默认),为 1 表示从当前位置开始计算,为 2 表示从文件尾开始计算。默认值为 0

例如:

file1 = open("d:\stu.txt",mode = "rb")
file1.seek(0)  # 把指针移动到文件头
print(file1.tell())

file1.seek(10)  # 把指针移动到离文件头10个字节的位置
print(file1.tell())

file1.seek(20,1)  # 再向后移动20个自节
print(file1.tell())

file1.seek(0,2)  # 把指针移动到文件尾
print(file1.tell())

file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
0
10
30
825

四、文件的写入操作

利用文件对象的 write() 方法,可以向文件中写入内容。write() 方法的语法格式如下:

file.write(string)

对于一个文件来说,能不能写入数据、数据的写入方式与打开文件的模式有关。

(1)如果一个文件以只读方式(r)打开,则无法写入

代码如下:

file1 = open("d:\stu.txt",mode = "r")
file1.write("新增一条记录:")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 2, in <module>
    file1.write("新增一条记录:")
io.UnsupportedOperation: not writable

(2)如果一个文件以只写方式打开,则无法读取内容

代码如下:

file1 = open("d:\stu.txt",mode = "w")
file1.readlines()
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 2, in <module>
    file1.readlines()
io.UnsupportedOperation: not readable

(3)文件以只写方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "w")
file1.write("Hello Python!")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
>>> 

(4)文件以可读写(r+)方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r+")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
4
New!o Python!    # r+ 模式在写入时,并不清空文件,而是从第一个字符开始替换原有的内容
13

(5)文件以可读写(w+)方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "w+")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
4
New!    # w+ 模式在写入时,先清空原有文件,再写入新内容
4

(6)文件以追加方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "a")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
>>> 
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
17
Hello Python!New!
17

五、使用 with 语句处理文件

文件使用完要及时关闭。如果忘记关闭文件,可能出现一些意想不到的结果。另外,如果在打开文件时出现了异常,将导致文件不能被及时关闭。为了避免这些问题的产生,可以使用 with 语句实现在处理文件时,无论是否抛出异常,都能保证 with 语句执行完后关闭已经打开的文件。

with 语句的语法格式如下:

with expression as target:
    with-body

说明:

(1)expression:指定一个表达式,可以是打开文件的 open() 函数。

(2)with-body:指定 with 语句体,其中可以是执行 with 语句后相关的一些操作。如果不想执行任何操作,可以用 pass 语句代替。

例如:

with open("d:\\stu.txt", mode = "r" ,encoding = "utf-8") as file1:
    while True:
        line = file1.readline()
        if line == "":
            break
        print(line,end="")
        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

六、打开文件之前先判断文件是否存在

使用 open() 函数打开文件时,如果要打开的文件不存在,则会出现异常。可以使用 os.path 模块提供的 exists() 函数判断文件是否存在。

例如:

(1)以只读(r)方式打开一个不存在的文件时出现异常

代码如下:

with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
    while True:
        line = file1.readline()
        if line == "":
            break
        print(line,end="")
                
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 1, in <module>
    with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
FileNotFoundError: [Errno 2] No such file or directory: 'd:\\stu001.txt'

(2)打开之前先判断文件是否存在

代码如下:

import os
if os.path.exists("d:\\stu001.txt"):
    with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
要打开的文件不存在!

七、文件的编码问题

由于文件保存格式不同,在读取文件时如果格式不正确,将会出现乱码或抛出异常。

例如:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 5, in <module>
    line = file1.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 36: illegal multibyte sequence

可以使用如下三种方法解决文件的编码格式问题:

1、打开文件时指定文件的编码格式

例如,在打开文件时,指定编码格式为 【utf-8】,代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = "utf-8") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                            
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415
2、以二进制方式打开文件,然后对读取的内容进行编码

读取文件时如果出现字符编码错误,用二进制方式打开文件就不会出现错误了,但需要在读取文件时进行编码。先使用 isinstance() 函数判断读取的内容是否为 str 类型,如果是,则直接读取文件内容。如果不是,则使用异常处理程序尝试使用 utf-8 方式解码,否则使用 GBK 解码。

代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        for line in file1.readlines():
            if isinstance(line,str):
                print(new,end="")
            else:
                try:
                    new = line.decode("utf-8")
                    print(new,end="")
                except:
                    try:
                        new = line.decode("GBK")
                        print(new,end="")
                    except:
                        pass
else:
    print("要打开的文件不存在!")
                                
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415
3、强制以某种模式读取文件,忽略编码错误

例如:以二进制方式读取文件的内容,然后用 GBK 编码强制读取该文件。

代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        text = file1.read()
        new = text.decode("GBK",errors = "ignore")
        print(new)
else:
    print("要打开的文件不存在!")
                                    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
濮撳悕,鎬у埆,鍑虹敓鏃ユ湡,闄㈢郴,鐝绾,鎵嬫満鍙
寮犲钩,,2002-12-5,缁忔祹涓庣$悊瀛﹂櫌,淇$201,13603735216
鍒樻稕,,2002-10-15,缁忔祹涓庣$悊瀛﹂櫌,淇$201,13603733334
寮犻潤闈,,2003-8-6,缁忔祹涓庣$悊瀛﹂櫌,淇$212,13603734243
鐜嬪己,,2003-6-25,缁忔祹涓庣$悊瀛﹂櫌,淇$212,13603736654
寮犳捣娲,,2002-7-9,鏈虹數瀛﹂櫌,鏈哄埗211,13603737778
鍒樻濋洦,,2001-8-30,鏈虹數瀛﹂櫌,鏈哄埗211,13603736538
鐜嬪溅寮,,2002-7-31,鏈虹數瀛﹂櫌,鏈哄埗212,13603736528
鍒樻湞杈,,2001-7-6,鏈虹數瀛﹂櫌,鏈哄埗201,13603736235
鐜嬮箯,,2002-9-27,鏈虹數瀛﹂櫌,鏈哄埗201,13603734215
鍒樼嚂鐕,,2001-8-22,鏂囨硶瀛﹂櫌,娉曞201,13603733685
鐜嬭姼,,2002-6-30,鏂囨硶瀛﹂櫌,娉曞201,13603733322
鍒樹簯椋,,2002-9-21,鏂囨硶瀛﹂櫌,娉曞201,13603733415

以二进制方式读取文件的内容,然后用 utf-8 编码强制读取该文件。文章来源地址https://www.toymoban.com/news/detail-730981.html

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        text = file1.read()
        new = text.decode("utf-8",errors = "ignore")
        print(new)
else:
    print("要打开的文件不存在!")
                                        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

到了这里,关于Python 程序设计入门(024)—— Python 的文件操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python 程序设计入门(023)—— Python 的自定义函数

    在 Python 中,函数的应用非常广泛。比如:input()、print()、str()、range()、len() 等,这些称为 Python 的内置函数,可以直接使用。Python 支持自定义函数,即将一段有规律的、可重复使用的代码定义为函数,达到一次编写,多次使用的目的。 自定义函数使用 def 实现,语法格

    2024年02月12日
    浏览(55)
  • 【Python 程序设计】包和数据人员入门【01/8】

            一个坚实的Python项目的基础是掌握模块,包和导入。 以下文章是有关 Python 数据工程系列文章的一部分,旨在帮助数据工程师、数据科学家、数据分析师、机器学习工程师或其他刚接触 Python 的人掌握基础知识。         迄今为止,本初学者指南包括: 第 1 部

    2024年02月09日
    浏览(38)
  • Python 程序设计入门(018)—— format() 函数的用法详解

    format() 函数可以对数据进行格式化处理,将值转换为由 format_spec 控制的【格式化】表示形式。format() 函数的语法格式如下: 说明: (1)value:要转换的数据。 (2)format_spec:格式化解释,取决于值参数的类型; (3)默认情况下,format_spec 是一个空字符串,通常与调用 st

    2024年02月03日
    浏览(41)
  • Linux程序设计:文件操作

    系统调用 write read 重定向,输入重定向,管道功能 open close lseek ❑ SEEK_SET: offset is an absolute position ❑ SEEK_CUR: offset is relative to the current position ❑ SEEK_END: offset is relative to the end of the file fstat, stat, and lstat dup fopen (库函数) ❑ “r” or “rb”: Open for reading only ❑ “w” or “wb”

    2024年02月05日
    浏览(36)
  • 05应用程序设计和文件操作

    比如: 在qt中,如果想要使用菜单栏功能,那么界面的基类要选择QMainWindow,不能选择QWidget QDialog 实现菜单栏步骤如下: 第一步:在UI设计师,直接双击菜单栏 第二步:在UI设计师,修改文本内容和其他设置 进行设置 设置的效果图如下: 给菜单选项,增加图片资源 让用户比

    2024年02月12日
    浏览(41)
  • 成都理工大学_Python程序设计_Python程序设计期末模拟试题

    ‌下列变量名中,哪一项不符合正确的变量命名规则?( ) 2_year ‍Python不支持的数据类型有( )。 char ​从键盘输入一个整数赋值给number,下面哪一句是正确的?( ) number = int(input(‘请输入一个整数:’)) 令list = [1, 2, 3],则分别执行命令del list[1]和list.remove(1)后的list为(

    2024年02月08日
    浏览(47)
  • 用python做一个小程序,python设计一个小程序

    大家好,本文将围绕用python做一个小程序展开说明,python设计一个小程序是一个很多人都想弄明白的事情,想搞清楚python编写一个小程序需要先了解以下几个事情。 这是一个简单的 PyQt5 小程序,该程序将创建一个窗口,并在其中放置一个按钮和一个文本输入框。当用户点击

    2024年02月02日
    浏览(38)
  • Python 程序设计-系统登录页面设计

    系统要有管理员登录、普通用户登录和退出三个选项可供选择 系统要能够实现登入出错提示,比如账户密码错误等,用户信息保存在user目录下的文件夹中,存储在user.csv中 系统要能够进行欢迎界面显示,登录成功后显示该页面。 系统要能够有写入信息功能,当用户或管理员

    2024年02月09日
    浏览(44)
  • Python程序设计期末作品完整版|代码和程序设计文档

    python程序设计作品,希望对您有帮助,希望您的一键三连! 1.爬取数据的意义 富豪榜的出现,体现了人们思想的变化:由保守藏富向正向面对财富的转变;由保守向文明开放(–说明了大众媒体的进步与教育的普及等思想工具的极大地提高);标志着人们对财富对经济正在走向新纪

    2024年02月11日
    浏览(47)
  • Python程序设计——列表

    关键点:一个列表可以存储任意大小的数据集合。         程序一般都需要存储大量的数值。假设,举个例子,需要读取100个数字,计算出它们的平均值,然后找出多少个数字是高于这个平均值的。程序首先读取100个数字并计算它们的平均值,然后把每个数字和平均值进

    2024年02月12日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包