在 Python 中拆分具有多个分隔符的字符串

这篇具有很好参考价值的文章主要介绍了在 Python 中拆分具有多个分隔符的字符串。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

要使用多个定界符拆分字符串:

  1. 使用 re.split() 方法,例如 re.split(r',|-', my_str)
  2. re.split() 方法将拆分所有出现的分隔符之一的字符串。
import re

# 👇️ 用 2 个分隔符拆分字符串

my_str = 'fql,jiyik-dot,com'

my_list = re.split(r',|-', my_str)  # 👈️ 以逗号或连字符分隔

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

re.split 方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。

管道 | 字符是一个或。 匹配 A 或 B。

该示例使用 2 个分隔符(逗号和连字符)拆分字符串。

# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'

my_list = re.split(r',|-|:', my_str)  # 👈️ comma, hyphen or colon

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

下面是一个使用 3 个分隔符(逗号、连字符和冒号)拆分字符串的示例。

我们可以使用尽可能多的 | 正则表达式中必要的字符。


使用方括号 [] 根据多个定界符拆分字符串

或者,我们可以使用方括号 [] 来指示一组字符。

import re

my_str = 'fql,jiyik-dot,com'

my_list = re.split(r'[,-]', my_str)

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

python按分隔符进行分割,编程,Python,python,正则表达式,开发语言

确保在方括号之间添加所有分隔符。

import re

# 👇️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'

my_list = re.split(r'[,-:]', my_str) # 以逗号、连字符、冒号分割

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

如果字符串以其中一个定界符开头或结尾,我们可能会在输出列表中得到空字符串值。


处理前导或尾随定界符

我们可以使用列表理解从列表中删除任何空字符串。

import re

# 👇️ 用 3 个分隔符拆分字符串
my_str = ',fql,jiyik-dot:com:'

my_list = [
    item for item in re.split(r'[,-:]', my_str)
    if item
]

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

列表推导负责从列表中删除空字符串。

列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。

另一种方法是使用 str.replace() 方法。


使用 str.replace() 拆分具有多个定界符的字符串

要使用多个定界符拆分字符串:

  1. 使用 str.replace() 方法将第一个分隔符替换为第二个分隔符。
  2. 使用 str.split() 方法按第二个分隔符拆分字符串。
my_str = 'fql_jiyik!dot_com'

my_list = my_str.replace('_', '!').split('!')

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com']

这种方法仅在您想要拆分的分隔符很少时才方便,例如 2.

首先,我们用第二个分隔符替换每个出现的第一个分隔符,然后我们拆分第二个分隔符。

str.replace 方法返回字符串的副本,其中所有出现的子字符串都被提供的替换项替换。

该方法采用以下参数:

  • old 字符串中我们要替换的子串
  • new 替换每次出现的 old
  • count 仅替换第一个 count 出现(可选)

请注意 ,该方法不会更改原始字符串。 字符串在 Python 中是不可变的。

这是另一个例子。

my_str = 'fql jiyik, dot # com. abc'


my_list = my_str.replace(
    ',', '').replace(
    '#', '').replace('.', '').split()

print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

我们使用 str.replace() 方法在拆分空白字符的字符串之前删除标点符号。

我们使用空字符串进行替换,因为我们要删除指定的字符。

我们可以根据需要将尽可能多的调用链接到 str.replace() 方法。

最后一步是使用 str.split() 方法将字符串拆分为单词列表。

str.split() 方法使用定界符将字符串拆分为子字符串列表。

该方法采用以下 2 个参数:

  • separator 在每次出现分隔符时将字符串拆分为子字符串
  • maxsplit 最多完成 maxsplit 拆分(可选)

当没有分隔符传递给 str.split() 方法时,它会将输入字符串拆分为一个或多个空白字符。

my_str = 'fql jiyik com'

print(my_str.split())  # 👉️ ['fql', 'jiyik', 'com']

如果在字符串中找不到分隔符,则返回仅包含 1 个元素的列表。


使用可重用函数根据多个定界符拆分字符串

如果我们需要经常根据多个分隔符拆分字符串,请定义一个可重用的函数。

import re


def split_multiple(string, delimiters):
    pattern = '|'.join(map(re.escape, delimiters))

    return re.split(pattern, string)


my_str = 'fql,jiyik-dot:com'

print(split_multiple(my_str, [',', '-', ':']))

split_multiple 函数接受一个字符串和一个分隔符列表,并根据分隔符拆分字符串。

str.join() 方法用于将分隔符与管道 | 连接起来。 分隔器。

# 👇️ ,|-|:
print('|'.join([',', '-', ':']))

这将创建一个正则表达式模式,我们可以使用该模式根据指定的分隔符拆分字符串。

如果我们需要将一个字符串拆分为多个分隔符的单词列表,我们还可以使用 re.findall() 方法。

使用 re.findall() 将字符串拆分为单词列表

使用 re.findall() 方法将字符串拆分为具有多个分隔符的单词列表。

re.findall() 方法将在每次出现单词时拆分字符串,并返回包含单词的列表。

import re

# ✅ 将字符串拆分为具有多个分隔符的单词列表
my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

re.findall 方法将一个模式和一个字符串作为参数,并返回一个字符串列表,其中包含字符串中该模式的所有非重叠匹配项。

我们传递给 re.findall() 方法的第一个参数是一个正则表达式。

import re

my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # 👉️ ['fql', 'jiyik', 'dot', 'com', 'abc']

方括号 [] 用于表示一组字符。

\w 字符与 Unicode 单词字符匹配,并且包括可以作为任何语言的单词一部分的大多数字符。

加号 + 使正则表达式匹配前面字符(Unicode 字符)的 1 次或多次重复。

re.findall() 方法返回一个包含字符串中单词的列表。

如果大家想了解关于正则表达式的知识,可以参考 正则表达式教程。

该页面包含所有特殊字符的列表以及许多有用的示例。文章来源地址https://www.toymoban.com/news/detail-617942.html

到了这里,关于在 Python 中拆分具有多个分隔符的字符串的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • leetcode-2788按分隔符拆分字符串

    题目链接 2788. 按分隔符拆分字符串 - 力扣(LeetCode) 解题思路

    2024年01月21日
    浏览(47)
  • 【LeetCode每日一题】2788. 按分隔符拆分字符串

    2024-1-20 2788. 按分隔符拆分字符串 思路: 对于每个单词,使用一个可变字符串 StringBuilder 来构建拆分后的单词。初始时,可变字符串为空。 遍历每个单词的每个字符,如果遇到指定的分隔符,就将可变字符串中的字符构成一个新的单词,并将其添加到结果列表中。然后清空可

    2024年01月21日
    浏览(52)
  • LeetCode 2788.按分隔符拆分字符串:模拟(字符串处理)

    力扣题目链接:https://leetcode.cn/problems/split-strings-by-separator/ 给你一个字符串数组 words 和一个字符 separator ,请你按 separator 拆分 words 中的每个字符串。 返回一个由拆分后的新字符串组成的字符串数组, 不包括空字符串 。 注意 separator 用于决定拆分发生的位置,但它不包含在

    2024年01月21日
    浏览(58)
  • 最优字符串分隔符:零宽度空格和字符

    在文本处理和格式化中,选择合适的分隔符是至关重要的。 本文将在介绍两个不常见但功能强大的分隔符:零宽度空格和𐀀字符。 零宽度空格是Unicode字符集中的一个特殊字符,其Unicode编码为U+200B。 零宽度空格在文本中不占据任何宽度,因此是一个不可见的分隔符。 主要应

    2024年02月21日
    浏览(47)
  • 按分隔符分割字符串(DB2/mysql/hive/Oracle)

    1、DB2 --substr+locate/instr DB2没有自己按分隔符分割字符串的函数,只能结合使用 或者在DB2里还可以自己写一个split分割字符串的函数 附:instr函数用法--用来查找指定字符在字符串中出现的位置 DB2中的locate 函数可实现同样的功能,用法同 instr ,只是源字符串和目标字符串的位

    2024年02月13日
    浏览(56)
  • seatunnel hive source 未设置分隔符导致多个字段合并成一个的问题定位解决

    seatunnel hive source 未设置分隔符导致多个字段没有切分全保存在一个字段中了,翻看源码发现分隔符是是通过delimiter设置的,只要设置这个delimiter=\\\",\\\"就可以了。 设置这个属性 delimiter=“,” 他的默认值是u0001,如果没有设置delimiter属性则会根据文件类型判断,如果是csv则使用”,”

    2024年02月16日
    浏览(51)
  • 【Hive】分隔符 『 单字节分隔符 | 多字节分隔符』

    在创建表时,可以使用 row format ... 指定分隔符形式。比如: 但是,根据原始数据分隔符的复杂程度,需要指定不同的分隔形式。比如: 情况一:分隔符为单字节 分隔符为多字节 字段中包含了分隔符 方法:使用delimited 加上 delimited ,即使用 row format delimited :用

    2024年02月13日
    浏览(49)
  • Python Pandas:DataFrame 一列切分成多列、分隔符切分选字段

    创建一个复杂又简单的数据集 split expand:这个参数直接将分列后的结果转换成 DataFrame drop axis 是指处哪一个轴 columns 是指某一列或者多列 inplaces 是否替换原来的 dataframe

    2024年02月12日
    浏览(67)
  • hive 分隔符

    在 Hive 中,分隔符用于指定数据文件中字段之间的分隔符。当你创建外部表或加载数据文件时,你可以指定分隔符,以便 Hive 正确地解析文件中的数据。 1. 创建外部表时指定分隔符: 当你创建外部表时,可以使用 ROW FORMAT 子句来指定数据文件中字段的分隔符。例如,如果你

    2024年02月09日
    浏览(45)
  • Hive建表时,指定分隔符

     一.建表语句 二.语句分析 ROW FORMAT DELIMITED FIELDS TERMINATED BY \\\',\\\' : 这个子句表明Hive将使用 \\\',\\\' 字符作为列分隔符,即分隔字段。 ROW FORMAT DELIMITED COLLECTION items terminated BY \\\'_\\\'  :这个子句表明Hive将使用 \\\'_\\\' 作为集合元素间的分隔符。 ROW FORMAT DELIMITED MAP KEYS TERMINATED BY \\\':\\\' :这个

    2024年02月11日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包