python切分文本到Excel,以包含指定字符串 为标识符(txt)切分txt文本)

这篇具有很好参考价值的文章主要介绍了python切分文本到Excel,以包含指定字符串 为标识符(txt)切分txt文本)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

V1.0_(批量处理有待完善,目前只能一个一个来)

代码如下:文章来源地址https://www.toymoban.com/news/detail-732888.html

import re
import openpyxl

def extract_and_save_dialogues_with_headers_to_excel(input_file, output_file):
    # 创建一个新的Excel工作簿
    workbook = openpyxl.Workbook()
    sheet = workbook.active

    # 添加行标题
    sheet.append(["说话人", "数字", "时间", "文本"])

    # 使用正则表达式来匹配说话人、数字和时间的模式
    pattern = r'说话人 (\d+) (\d+:\d+)'

    # 初始化变量以跟踪当前说话人、数字和对话文本
    current_speaker = None
    current_number = None
    current_time = None
    dialogue = []

    # 打开并读取文本文件
    with open(input_file, 'r', encoding='utf-8') as file:
        for line in file:
            match = re.match(pattern, line)
            if match:
                # 如果找到新的说话人,则保存之前的对话文本和相关信息并开始新的对话
                if current_speaker:
                    sheet.append([current_speaker, current_number, current_time, '\n'.join(dialogue)])
                    dialogue = []

                current_speaker = match.group(1)
                current_number = match.group(1)
                current_time = match.group(2)
            else:
                # 如果不是匹配到的行,则将文本行添加到当前对话中
                if current_speaker:
                    dialogue.append(line.strip())

    # 处理最后一个对话
    if current_speaker:
        sheet.append([current_speaker, current_number, current_time, '\n'.join(dialogue)])

    # 保存Excel文件
    workbook.save(output_file)

    print(f"提取并保存对话、说话人、数字、时间和文本到 {output_file} 完成")

# 使用示例
extract_and_save_dialogues_with_headers_to_excel("xu.txt", "2.xlsx")

到了这里,关于python切分文本到Excel,以包含指定字符串 为标识符(txt)切分txt文本)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python如何判断列表中是否包含字符串?

    Python如何判断列表中是否包含字符串? 在Python编程中,我们经常需要对列表进行操作,其中一个常见的问题是如何判断列表中是否包含特定的字符串。本文将为您介绍几种实现方法。 方法一:使用in操作符 Python中可以使用in操作符快速判断一个列表是否包含某个字符串。示例

    2024年02月08日
    浏览(75)
  • chatgpt赋能python:Python字符串截取指南:如何截取指定位置字符串

    在Python中,字符串截取是一项非常常见的操作。当我们需要从一个字符串中提取特定位置的字符或子串时,我们可以使用Python内置的截取函数和切片操作来实现。在本文中,我们将介绍如何在Python中截取指定位置字符串,并提供一些有用的技巧和示例来帮助你更好地理解这一

    2024年02月08日
    浏览(62)
  • Linux :: 内容过滤指令【3】:grep 指令【详解】:在指定文件中过滤搜索信息、(模糊)查找包含指定字符串的内容!(如:系统故障时,查看操作日志信息等情景)

    前言:本篇是 Linux 基本操作篇章的内容! 笔者使用的环境是基于腾讯云服务器:CentOS 7.6 64bit。 学习集: C++ 入门到入土!!!学习合集 Linux 从命令到网络再到内核!学习合集 注:find 指令常与 grep 指令在面试中被提及,需让你回答异同! 目录索引: 1. 基本语法、功能及使

    2024年02月09日
    浏览(57)
  • python去掉字符串中的指定字符的方法

      我们在使用 Python处理字符串的时候,经常会遇到一些字符串中出现了指定字符,比如以下代码: 上面代码中的#就是一个指定字符,在 python中,如果使用#替换为指定字符,那么就会报错。当我们对需要处理的字符进行替换的时候,我们都会使用两个函数: 其中第一个是

    2024年02月02日
    浏览(41)
  • Python 中检查字符串是否包含列表中的元素

    使用 any() 函数检查字符串是否包含列表中的元素。 如果字符串至少包含列表中的一个元素, any() 函数将返回 True,否则返回 False。 如果需要检查列表中的任何元素是否包含字符串,可以看以下方式: 检查列表中的任何元素是否包含字符串 我们使用生成器表达式来迭代字符

    2024年02月09日
    浏览(76)
  • python判断字符串是否包含子串的五种方法

    要判断某一个字符串是否包含某一个子串,方法之一是可以利用python内置的字符串方法find()来查找,如果查找到,就返回子串第一个字符在原字符串中的索引位置,如果找不到,则返回-1,实例代码如下: count()也是python内置的字符串方法之一,可以用于统计参数指定的子串在

    2024年02月11日
    浏览(58)
  • Python 中的字符串匹配识别文本中的相似性

    更多Python学习内容:ipengtao.com 字符串匹配是自然语言处理(NLP)和文本处理中的一个重要任务,它可以识别文本之间的相似性、找到相同或相似的模式,以及进行文本分类和信息检索等应用。本文将深入探讨Python中的字符串匹配技术,包括基本的字符串比较方法、正则表达式

    2024年01月18日
    浏览(53)
  • LeetCode - 1371 每个元音包含偶数次的最长子字符串(Java & JS & Python & C)

    题目来源 1371. 每个元音包含偶数次的最长子字符串 - 力扣(LeetCode) 题目描述 给你一个字符串  s  ,请你返回满足以下条件的最长子字符串的长度:每个元音字母,即 \\\'a\\\',\\\'e\\\',\\\'i\\\',\\\'o\\\',\\\'u\\\' ,在子字符串中都恰好出现了偶数次。 示例 示例 1 输入:s = \\\"eleetminicoworoep\\\" 输出:

    2024年01月25日
    浏览(43)
  • Lua判断字符串包含另一个字符串

    1. string.find(\\\"原字符串\\\",\\\"目标字符串\\\")  返回这个子串的起始索引和结束索引,否则就会返回 nil 2. string.match(\\\"原字符串\\\",\\\"目标字符串\\\")

    2024年02月17日
    浏览(65)
  • Python高频面试题——如何在字符串中删除指定字符,掌握strip()、replace()和re.sub ()正确使用方法!

    关于python删除字符串是面试python测试开发工程师的一个经典问题。问题很简单,但是一下子就能测试出来被面试者是否能够熟练的进行python相关编码工作! 对于有些临时抱佛脚的同学来讲,一看删除,很自然就说用remove 、del相关方法,听到这里,就知道面试者根本不知道这

    2024年02月08日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包