5.1统计英文文件中的单词数python

这篇具有很好参考价值的文章主要介绍了5.1统计英文文件中的单词数python。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 本关任务:编写一个能统计文件中单词数量的小程序,用replace替换文本内的标点

代码如下:

# 补充你的代码
a = input()
import string
with open(f'/data/bigfiles/{a}', 'r', encoding='utf-8') as text:  # 打开文件a.txt,创建文件对象
    txt = text.read()  # 读文件为字符串
    for i in ",.!\'":
        txt = txt.replace(i, " ")
    x1 = txt.split()
    print('共有'+str(len(x1))+"个单词")




( 整体思路,先将文本中的标点符号用空格替换,然后用空格分隔单词,最后用len()

统计文本中单词的数量 )

相关知识

为了完成本关任务,你需要掌握:

1.获取文件内容 2.字符串方法的使用

1.读取文件

open(filename)函数可以打开诸如txtcsv等格式的文件。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

例如:

with open('a.txt', 'r', encoding='utf-8') as text: # 打开文件a.txt,创建文件对象
txt = text.read() # 读文件为字符串
print(txt) # 输出字符串

2.字符串方法

为了方便编程,Python 为我们提供了许多方法这里我们将学习其中的两个字符串方法。

2.1替换

str.replace(oldvalue, newvalue, count)

方法是在字符串str中,用另一个newvalue字符串替换oldvalue字符串count次。

参数值:文章来源地址https://www.toymoban.com/news/detail-483351.html

序号 参数 描述
1 oldvalue 必需。要检索的字符串。
2 newvalue 必需。替换旧值的字符串。
3 count 可选。数字,指定要替换的旧值出现次数。默认为替换所有出现的检索字符串。

示例如下:

txt = "I like bananas. She likes bananas too. "

x1 = txt.replace("bananas", "apples") # 替换所有
print(x1) # I like apples. She likes apples too.

x2 = txt.replace("bananas", "apples", 1) # 只替换一次
print(x2) # I like apples. She likes bananas too.

2.2切分

str.split(sep=None, maxsplit=- 1)

将字符串拆分成一个列表,其中每个单词都是一个列表项。可以指定分隔符,默认分隔符是空白字符(包括空格、制表\t、换行\n、回车\r、进纸\f和纵向制表符\v)。

参数值:

序号 参数 描述
1 sep 可选。规定分割字符串时要使用的分隔符。默认值为空白字符。
2 maxsplit 可选。规定要执行的拆分数。默认值为 -1,即“所有出现次数”。

到了这里,关于5.1统计英文文件中的单词数python的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包