统计文本中的数字出现频次

这篇具有很好参考价值的文章主要介绍了统计文本中的数字出现频次。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

统计文本中的数字出现频次:磁盘上有多个文本文件,统计数据写入excel。


  (本笔记适合初通 Python 的 coder 翻阅)


【学习的细节是欢悦的历程】

  • Python 官网:https://www.python.org/

  • Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单……
    地址:https://lqpybook.readthedocs.io/


  自学并不是什么神秘的东西,一个人一辈子自学的时间总是比在学校学习的时间长,没有老师的时候总是比有老师的时候多。
            —— 华罗庚


  • My CSDN主页、My HOT博、My Python 学习个人备忘录
  • 好文力荐、 老齐教室
统计文本中的数字出现频次,算法,练习,python,算法


磁盘上有多个文本文件
统计文本中的数字出现频次
(统计数据写入excel)


本文质量分:

96
本文地址: https://blog.csdn.net/m0_57158496/article/details/131508571

CSDN质量分查询入口:http://www.csdn.net/qc


目 录

◆ 统计文本中的数字出现频次


1、题目描述


题目来源于 CSDN 问答社区提问“统计多个文本中的数字出现频次


  遍历多个*.txt文本列表,依次统计数字出现频次,将统计以*.txt为标签追加写入目标文本文件。由于我的python 环境没有成功pip pandas ,就把统计结果写入csv文本文件了。

回页目录

2、解题思路


2.1 数据文本准备


  没有文本数据操练代码?祭出python 的“随机大法器”random,用choice()方法随机在给定范围选数100写入文本,连写10文本,搞定操练数据!😋


  • 随机生成十个数字文本
    统计文本中的数字出现频次,算法,练习,python,算法
    统计文本中的数字出现频次,算法,练习,python,算法

  • python 代码

#!/sur/bin/nve python
# coding: utf-8
from random import choice


mypath = '/sdcard/001/num001/'

def write_numfile(filename):
    ''' 随机写入100个整数 '''
    nums = range(5001)
    
    with open(filename, 'w') as f:
        
        for i in range(100):
            f.write(f"{choice(nums)}\n") 


def main():
    
    for i in range(1, 11): # 生成10随机文本文件。
        write_numfile(f"{mypath}{i:0>3}.txt")



if __name__ == '__main__':
    main()



回页目录

2.2 遍历轮询统计文本中的数字出现频次


  遍历轮询统计文本文件中的数字出现频次:依次遍历每个文件中的各个数据以数字为key,出现频次为value 的字典统计,不停的累加出现的数字,直到遍历完整个文本中的数字。列表解析字典的统计数据,按出现频次排降序,依次写入csv文本。(我的这python 环境没有pip成功写操作excel文件的库,所以仅用csv格式写入文本)


  • 循环遍历轮询文本文件,统计数字生成的tsv文本文件
    统计文本中的数字出现频次,算法,练习,python,算法

  • tsv文本内容
    统计文本中的数字出现频次,算法,练习,python,算法

  • python 代码


def count_num(filename):
    ''' 统计文本中的数字 '''
    
    with open(filename) as f: # 读取文本。
        text = f.read()[:-1]

    count_dict = {} # 数字统计字典。
    for i in text.split('\n'): # 遍历轮询文本数字统计出现频次。
        count_dict[i] = count_dict.get(i, 0) + 1
    
    count = [(num, count) for num,count in count_dict.items()] # 列表解析统计字典数据。
    count.sort(reverse=True, key=lambda x: x[1])
    
    with open(f"{filename[:-4]}_count.txt", 'w') as f:
        f.write(f"数字,出现频次")
        
        for num,k in count:
            f.write(f"\n{num},{k}")

def main():
    
    for i in range(1, 11): # 生成10随机文本文件。
        write_numfile(f"{mypath}{i:0>3}.txt")

    for i in range(1, 11): # 生成10随机文本文件。
        count_num(f"{mypath}{i:0>3}.txt")


if __name__ == '__main__':
    main()




回页目录

3、完整源码

(源码较长,点此跳过源码)

#!/sur/bin/nve python
# coding: utf-8
from random import choice


mypath = '/sdcard/001/num001/'

def write_numfile(filename):
    ''' 随机写入100个整数 '''
    nums = range(201)
    
    with open(filename, 'w') as f:
        
        for i in range(100):
            f.write(f"{choice(nums)}\n")


def count_num(filename):
    ''' 统计文本中的数字 '''
    
    with open(filename) as f: # 读取文本。
        text = f.read()[:-1]

    count_dict = {} # 数字统计字典。
    for i in text.split('\n'): # 遍历轮询文本数字统计出现频次。
        count_dict[i] = count_dict.get(i, 0) + 1
    
    count = [(num, count) for num,count in count_dict.items()] # 列表解析统计字典数据。
    count.sort(reverse=True, key=lambda x: x[1])
    
    with open(f"{filename[:-4]}_count.txt", 'w') as f:
        f.write(f"数字,出现频次")
        
        for num,k in count:
            f.write(f"\n{num},{k}")


def main():
    
    for i in range(1, 11): # 生成10随机文本文件。
        write_numfile(f"{mypath}{i:0>3}.txt")

    for i in range(1, 11): # 生成10随机文本文件。
        count_num(f"{mypath}{i:0>3}.txt")


if __name__ == '__main__':
    main()


回页首

上一篇:  学号编码:TooY0ung的学院(结构体)(根据6+6十二位编码规则,用城市代码和出生年编制学号)
下一篇: 

我的HOT博:

  本次共计收集 220 篇博文笔记信息,总阅读量 31.17w,平均阅读量 1416。已生成 21 篇阅读量不小于 3000 的博文笔记索引链接。数据采集于 2023-07-02 22:58:06 完成,用时 5 分 26.73 秒。


  1. 让QQ群昵称色变的神奇代码
    ( 56405 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122566500
    点赞:24   踩 :0  收藏:81  打赏:0  评论:17
    本篇博文笔记于 2022-01-18 19:15:08 首发,最晚于 2022-01-20 07:56:47 修改。
  2. pandas 数据类型之 DataFrame
    ( 8763 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/124525814
    点赞:6   踩 :0  收藏:31  打赏:0  评论:0
    本篇博文笔记于 2022-05-01 13:20:17 首发,最晚于 2022-05-08 08:46:13 修改。
  3. 个人信息提取(字符串)
    ( 6928 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/124244618
    点赞:1   踩 :0  收藏:12  打赏:0  评论:0
    本篇博文笔记于 2022-04-18 11:07:12 首发,最晚于 2022-04-20 13:17:54 修改。
  4. 罗马数字转换器|罗马数字生成器
    ( 6657 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122592047
    点赞:0   踩 :0  收藏:1  打赏:0  评论:0
    本篇博文笔记于 2022-01-19 23:26:42 首发,最晚于 2022-01-21 18:37:46 修改。
  5. Python字符串居中显示
    ( 6573 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122163023
    点赞:1   踩 :0  收藏:6  打赏:0  评论:1
    本篇博文笔记于 2021-12-26 23:35:29 发布。
  6. Python列表(list)反序(降序)的7种实现方式
    ( 5617 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/128271700
    点赞:4   踩 :0  收藏:18  打赏:0  评论:8
    本篇博文笔记于 2022-12-11 23:54:15 首发,最晚于 2023-03-20 18:13:55 修改。
  7. 斐波那契数列的递归实现和for实现
    ( 5382 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122355295
    点赞:4   踩 :0  收藏:2  打赏:0  评论:8
    本篇博文笔记于 2022-01-06 23:27:40 发布。
  8. 练习:字符串统计(坑:f‘string‘报错)
    ( 4965 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/121723096
    点赞:0   踩 :0  收藏:1  打赏:0  评论:0
    本篇博文笔记于 2021-12-04 22:54:29 发布。
  9. 练习:尼姆游戏(聪明版/傻瓜式•人机对战)
    ( 4722 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/121645399
    点赞:14   踩 :0  收藏:42  打赏:0  评论:0
    本篇博文笔记于 2021-11-30 23:43:17 发布。
  10. python清屏
    ( 4695 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/120762101
    点赞:0   踩 :0  收藏:5  打赏:0  评论:0
    本篇博文笔记于 2021-10-14 13:47:21 发布。
  11. 回车符、换行符和回车换行符
    ( 4645 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/123109488
    点赞:1   踩 :0  收藏:2  打赏:0  评论:0
    本篇博文笔记于 2022-02-24 13:10:02 首发,最晚于 2022-02-25 20:07:40 修改。
  12. 练习:生成100个随机正整数
    ( 4051 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122558220
    点赞:1   踩 :0  收藏:6  打赏:0  评论:0
    本篇博文笔记于 2022-01-18 13:31:36 首发,最晚于 2022-01-20 07:58:12 修改。
  13. 密码强度检测器
    ( 4042 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/121739694
    点赞:1   踩 :0  收藏:4  打赏:0  评论:0
    本篇博文笔记于 2021-12-06 09:08:25 首发,最晚于 2022-11-27 09:39:39 修改。
  14. 罗马数字转换器(用罗马数字构造元素的值取模实现)
    ( 3925 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/122608526
    点赞:0   踩 :0  收藏:0  打赏:0  评论:0
    本篇博文笔记于 2022-01-20 19:38:12 首发,最晚于 2022-01-21 18:32:02 修改。
  15. 练习:班里有人和我同生日难吗?(概率probability、蒙特卡洛随机模拟法)
    ( 3725 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/124424935
    点赞:1   踩 :0  收藏:3  打赏:0  评论:0
    本篇博文笔记于 2022-04-26 12:46:25 首发,最晚于 2022-04-27 21:22:07 修改。
  16. 我的 Python.color() (Python 色彩打印控制)
    ( 3701 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/123194259
    点赞:2   踩 :0  收藏:7  打赏:0  评论:0
    本篇博文笔记于 2022-02-28 22:46:21 首发,最晚于 2022-03-03 10:30:03 修改。
  17. 练习:仿真模拟福彩双色球——中500w巨奖到底有多难?跑跑代码就晓得了。
    ( 3432 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/125415626
    点赞:3   踩 :0  收藏:4  打赏:0  评论:3
    本篇博文笔记于 2022-06-22 19:54:20 首发,最晚于 2022-06-23 22:41:33 修改。
  18. random.sample()将在python 3.9x后续版本中被弃用
    ( 3265 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/120657230
    点赞:0   踩 :0  收藏:0  打赏:0  评论:0
    本篇博文笔记于 2021-10-08 18:35:09 发布。
  19. 聊天消息敏感词屏蔽系统(字符串替换 str.replace(str1, *) )
    ( 3253 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/124539589
    点赞:3   踩 :0  收藏:2  打赏:0  评论:3
    本篇博文笔记于 2022-05-02 13:02:39 首发,最晚于 2022-05-21 06:10:42 修改。
  20. Linux 脚本文件第一行的特殊注释符(井号和感叹号组合)的含义
    ( 3230 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/123087606
    点赞:0   踩 :0  收藏:4  打赏:0  评论:3
    本篇博文笔记于 2022-02-23 13:08:07 首发,最晚于 2022-04-04 23:52:38 修改。
  21. 练习:求列表(整数列表)平衡点
    ( 3104 阅读)
    博文地址:https://blog.csdn.net/m0_57158496/article/details/121737612
    点赞:0   踩 :0  收藏:0  打赏:0  评论:0
    本篇博文笔记于 2021-12-05 23:28:10 发布。
推荐条件 阅读量突破三千
(更多热博,请点击蓝色文字跳转翻阅)

回页首


统计文本中的数字出现频次,算法,练习,python,算法

精品文章:

  • 好文力荐:齐伟书稿 《python 完全自学教程》 Free连载(已完稿并集结成书,还有PDF版本百度网盘永久分享,点击跳转免费🆓下载。)
  • OPP三大特性:封装中的property
  • 通过内置对象理解python'
  • 正则表达式
  • python中“*”的作用
  • Python 完全自学手册
  • 海象运算符
  • Python中的 `!=`与`is not`不同
  • 学习编程的正确方法

来源:老齐教室


回页首

◆ Python 入门指南【Python 3.6.3】


好文力荐:

  • 全栈领域优质创作者——[寒佬](还是国内某高校学生)博文“非技术文—关于英语和如何正确的提问”,“英语”和“会提问”是编程学习的两大利器。
  • 【8大编程语言的适用领域】先别着急选语言学编程,先看它们能干嘛
  • 靠谱程序员的好习惯
  • 大佬帅地的优质好文“函数功能、结束条件、函数等价式”三大要素让您认清递归

CSDN实用技巧博文:文章来源地址https://www.toymoban.com/news/detail-516857.html

  • 8个好用到爆的Python实用技巧
  • python忽略警告
  • Python代码编写规范
  • Python的docstring规范(说明文档的规范写法)

到了这里,关于统计文本中的数字出现频次的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 手撕前端面试题【javascript~ 总成绩排名、子字符串频次统计、继承、判断斐波那契数组等】

    html页面的骨架,相当于人的骨头,只有骨头是不是看着有点瘆人,只有HTML也是如此。 css,相当于把骨架修饰起来,相当于人的皮肉。 js(javascripts),动起来,相当于人的血液,大脑等一切能使人动起来的器官或者其他的。 在刷题之前先介绍一下牛客。Leetcode有的刷题牛客都有,

    2024年01月15日
    浏览(45)
  • 根据标签出现的频次渲染不同大小的圆和文字,圆随机摆放且相互之间不重叠

    效果图: 按每个标签出现的频次大小渲染出不同比例大小的圆,渲染的圆的宽度区间为 [40, 160] ,其中的文字的大小区间为 [12, 30] ,圆的位置 随机摆放且不重叠 。 根据已知条件可得出,标签中频次最高的对应圆的宽度(直径)为160px、字号为30px,频次最低的圆的宽度(直径)

    2024年03月12日
    浏览(41)
  • 统计文本词频的几种方法(Python)

    目录 1. 单句的词频统计 2. 文章的词频统计 方法一:运用集合去重方法 方法二:运用字典统计 方法三:使用计数器 词频统计是自然语言处理的基本任务,针对一段句子、一篇文章或一组文章,统计文章中每个单词出现的次数,在此基础上发现文章的主题词、热词。 思路:首

    2024年02月04日
    浏览(46)
  • 文本分析-使用Python做词频统计分析

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 前言 前面我们已经介绍了文本分析中的中文分词和去除停用词,这篇文章将详细介绍分词后

    2024年02月10日
    浏览(47)
  • python统计每个单词出现的次数

    编程要求 请按照函数的注释,补充程序中缺失部分语句,按要求实现如下程序功能:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ word_frequency() 函数统计并以字典类型返回每个

    2024年02月11日
    浏览(46)
  • 算法练习-替换数字(思路+流程图+代码)

            难度:简单         分类:字符串         难度与分类由我所参与的培训课程提供,但需要注意的是,难度与分类仅供参考。以下内容均为个人笔记,旨在督促自己认真学习。         给定一个字符串S,它包含小写字母和数字字符,请编写一个函数,将字符串

    2024年02月20日
    浏览(48)
  • chatgpt赋能python:Python怎么统计字符出现次数

    在Python编程中,统计字符出现次数是一项常见的任务。通过统计字符出现次数,我们可以更好地了解文本数据,并从中获取有用信息。Python提供了多种统计字符出现次数的方法和工具,本文将介绍常用的几种方法,并分析其优缺点。 Counter函数是Python内置的统计器函数,可以

    2024年02月13日
    浏览(49)
  • 【Python】 -- 实现统计《红楼梦》人物名称出现次数

    前面文章已经具体讲解了对统计《三国演义》人物名称出现次数的操作和实现思路,如有需要可以浏览。  为什么说是初级代码?因为可以数据更加严谨统计,我们都知道人物名称在文章中不可能都只出现一次,还可能有别称,如贾宝玉可能有“宝二爷”的别称,因此可以将

    2024年02月11日
    浏览(57)
  • python练习(猜数字,99乘法表)

    可以有十次输入猜数字的机会,猜对了脱离循环

    2024年02月07日
    浏览(38)
  • 【免费题库】华为OD机试 - 文本统计分析(Java & JS & Python & C & C++)

    哈喽,本题库完全免费,收费是为了防止被爬,大家订阅专栏后可以私信联系退款。感谢支持 有一个文件,包含以一定规则写作的文本,请统计文件中包含的文本数量。 规则如下: 文本以 “;” 分隔,最后一条可以没有 “;” ,但空文本不能算语句,比如 COMMAND A; ; 只能算

    2024年04月10日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包