本关任务:编写一个能统计文件中单词数量的小程序,用replace替换文本内的标点
代码如下:
# 补充你的代码
a = input()
import string
with open(f'/data/bigfiles/{a}', 'r', encoding='utf-8') as text: # 打开文件a.txt,创建文件对象
txt = text.read() # 读文件为字符串
for i in ",.!\'":
txt = txt.replace(i, " ")
x1 = txt.split()
print('共有'+str(len(x1))+"个单词")
( 整体思路,先将文本中的标点符号用空格替换,然后用空格分隔单词,最后用len()
统计文本中单词的数量 )
相关知识
为了完成本关任务,你需要掌握:
1.获取文件内容 2.字符串方法的使用
1.读取文件
open(filename)
函数可以打开诸如txt
,csv
等格式的文件。
例如:
with open('a.txt', 'r', encoding='utf-8') as text: # 打开文件a.txt,创建文件对象
txt = text.read() # 读文件为字符串
print(txt) # 输出字符串
2.字符串方法
为了方便编程,Python
为我们提供了许多方法这里我们将学习其中的两个字符串方法。
2.1替换
str.replace(oldvalue, newvalue, count)
方法是在字符串str中,用另一个newvalue字符串替换oldvalue字符串count次。
参数值:文章来源地址https://www.toymoban.com/news/detail-483351.html
序号 | 参数 | 描述 |
---|---|---|
1 | oldvalue | 必需。要检索的字符串。 |
2 | newvalue | 必需。替换旧值的字符串。 |
3 | count | 可选。数字,指定要替换的旧值出现次数。默认为替换所有出现的检索字符串。 |
示例如下:
txt = "I like bananas. She likes bananas too. "
x1 = txt.replace("bananas", "apples") # 替换所有
print(x1) # I like apples. She likes apples too.
x2 = txt.replace("bananas", "apples", 1) # 只替换一次
print(x2) # I like apples. She likes bananas too.
2.2切分
str.split(sep=None, maxsplit=- 1)
将字符串拆分成一个列表,其中每个单词都是一个列表项。可以指定分隔符,默认分隔符是空白字符(包括空格、制表\t、换行\n、回车\r、进纸\f和纵向制表符\v)。文章来源:https://www.toymoban.com/news/detail-483351.html
参数值:
序号 | 参数 | 描述 |
---|---|---|
1 | sep | 可选。规定分割字符串时要使用的分隔符。默认值为空白字符。 |
2 | maxsplit | 可选。规定要执行的拆分数。默认值为 -1,即“所有出现次数”。 |
到了这里,关于5.1统计英文文件中的单词数python的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!