5.1统计英文文件中的单词数python

这篇具有很好参考价值的文章主要介绍了5.1统计英文文件中的单词数python。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本关任务：编写一个能统计文件中单词数量的小程序，用replace替换文本内的标点

代码如下：

# 补充你的代码
a = input()
import string
with open(f'/data/bigfiles/{a}', 'r', encoding='utf-8') as text:  # 打开文件a.txt，创建文件对象
    txt = text.read()  # 读文件为字符串
    for i in ",.!\'":
        txt = txt.replace(i, " ")
    x1 = txt.split()
    print('共有'+str(len(x1))+"个单词")

（整体思路，先将文本中的标点符号用空格替换，然后用空格分隔单词，最后用len（）

统计文本中单词的数量）

相关知识

为了完成本关任务，你需要掌握：

1.获取文件内容 2.字符串方法的使用

1.读取文件

open(filename)函数可以打开诸如txt，csv等格式的文件。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

例如：

with open('a.txt', 'r', encoding='utf-8') as text: # 打开文件a.txt，创建文件对象
txt = text.read() # 读文件为字符串
print(txt) # 输出字符串

2.字符串方法

为了方便编程，Python 为我们提供了许多方法这里我们将学习其中的两个字符串方法。

2.1替换

str.replace(oldvalue, newvalue, count)

方法是在字符串str中，用另一个newvalue字符串替换oldvalue字符串count次。

参数值：文章来源地址https://www.toymoban.com/news/detail-483351.html

序号	参数	描述
1	oldvalue	必需。要检索的字符串。
2	newvalue	必需。替换旧值的字符串。
3	count	可选。数字，指定要替换的旧值出现次数。默认为替换所有出现的检索字符串。

示例如下：

txt = "I like bananas. She likes bananas too. "

x1 = txt.replace("bananas", "apples") # 替换所有
print(x1) # I like apples. She likes apples too.

x2 = txt.replace("bananas", "apples", 1) # 只替换一次
print(x2) # I like apples. She likes bananas too.

2.2切分

str.split(sep=None, maxsplit=- 1)

将字符串拆分成一个列表，其中每个单词都是一个列表项。可以指定分隔符，默认分隔符是空白字符(包括空格、制表\t、换行\n、回车\r、进纸\f和纵向制表符\v)。

参数值：

序号	参数	描述
1	sep	可选。规定分割字符串时要使用的分隔符。默认值为空白字符。
2	maxsplit	可选。规定要执行的拆分数。默认值为 -1，即“所有出现次数”。