【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取

这篇具有很好参考价值的文章主要介绍了【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、前言

  语言是一种使用具有共同处理规则的沟通指令的广义概念,这些指令可以通过视觉、声音或触觉等方式传递。语言可以分为自然语言、动物语言和计算机语言。
  自然语言是人类发展过程中形成的一种信息交流方式,它包括口语和书面语,并且反映了人类的思想。自然语言是通过语言习得和文化影响逐渐形成的,并且会随着时间的推移而自然地演化。人类使用自然语言进行沟通和表达时,利用语言中的词汇、语法和语义等元素来传递指令。通过自然语言,人们可以交流思想、传递信息、表达感情和进行社交互动。自然语言具有多样性和灵活性,不同的语言有着不同的特点和表达方式,这也反映了不同文化背景和社会环境对语言的影响。
  自然语言处理(Natural Language Processing,NLP) 是一门研究通过建立形式化计算模型来分析、理解和生成自然语言的学科。它的终极目标是让计算机能够具备与人类进行自然语言交流的能力。NLP包含两大问题:

  • 自然语言理解:指让计算机能够理解和解释人类使用的自然语言。这包括对文本或语音进行语法分析、语义分析和语境推断等,从而能够理解句子的含义、语义以及上下文关系。
  • 自然语言生成:指让计算机能够生成符合语法和语义规则的自然语言文本或语音。这包括根据特定的输入或需求,将计算机所处理的信息转化为可读性高、呈现方式自然的自然语言表达形式。

  在自然语言处理领域,研究者们通过设计和开发各种算法、模型和技术,来实现自动处理自然语言的能力。这些技术可以应用于各种领域,比如机器翻译、情感分析、问题回答系统、语音识别和自动摘要等。

  自然语言处理涉及字符串构造、截取与格式化输出等基础操作,本文将介绍使用引号构造字符串、字符串索引、切片操作等。

二、正则表达式与Python中的实现

前文:【深度学习】 Python 和 NumPy 系列教程(二):Python基本数据类型:3、字符串(索引、切片、运算、格式化)

1. 字符串构造

  在Python中字符串的构造,主要通过两种方法来实现,一是使用str函数,二是用单引号、双引号或三引号。在Python中,使用引号是一种非常便捷的构造字符串方式。

a. 使用str函数

str()函数是Python内置的函数,用于将其他类型的数据转换为字符串类型。例如:

num = 123
str1 = str(num)
print(str1)  # 输出:'123'

b. 单引号或双引号构造字符串

  • 在用单引号或双引号构造字符串时,要求引号成对出现
    • 如:‘Python World!’、‘ABC’、“what is your name?”,都是构造字符串的方法。
    • 'string"在Python中不是一个合法的字符串。
str2 = 'Python World!'
str3 = "ABC"
str_error = 'string"

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp
【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

c. 单双引号构造字符串的特殊用法

  • 如果代码中的字符串包含了单引号,且不用转义字符,那么整个字符串就要用双引号来构造,否则就会出错。
  • 如果代码中的字符串包含了双引号,且不用转义字符,那么整个字符串要用单引号来构造
"Let's go!"
print("Let's go!")
'Let's go!'
'" Hello world! ",he said. '
print('" Hello world!",he said. ') 

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

d. 三重引号字符串

  • 三重引号字符串是一种特殊的用法。三重引号将保留所有字符串的格式信息。 如字符串跨越多行,行与行之间的回车符、引号、制表符或者其他任何信息, 都将保存下来。在三重引号中可以自由的使用单引号和双引号

PS:打三次单引号就会自动识别出三引号

print('''"What's your name?""My name is Jone"''')
print('''"What's your name?"
"My name is Jone"''')

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

e. 典例

  编写程序,分别用双引号、单引号和三引号作为字符串边界符,实现语句 Let's say:"Hello World!" 的正确输出:

  • 程序代码
print("Let's say:\"Hello World!\"")
print('Let\'s say:"Hello World!"')
print('''Let's say:"Hello World!"''')
  • 运行结果

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

2. 字符串截取

  字符串的截取就是取出字符串中的子串。截取有两种方法:一种是索引str[index]取出单个 字符;另一种是切片str[[start]:[end]:[step]]取出一片字符。

  • 字符串的索引和切片方式与列表类似,索引从0开始,可以使用正向索引和反向索引:
    【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

a. 索引

  通过索引可以获取字符串中指定位置的单个字符。

s = 'student'
print(s[0])    # 输出: 's',获取第一个字符
print(s[-1])   # 输出: 't',获取倒数第一个字符

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

b. 切片

  切片用于获取字符串中一段连续的子串:

  • 模式:<字符串>[begin: end: step]
    • 左闭右开:以step为步长,取begin到end-1处的全部元素
    • step的正负性代表了方向:当step为负时,需要反向输出
    • 缺省值:begin=0;end=len(<字符串>);step=1
print(s[1:3])
  • 输出: tu,获取位置为1到位置为2的子串,不包括位置3的字符
print(s[:3])
  • 输出: stu,从头开始取到位置为2的子串
print(s[-2:])
  • 输出: nt,从倒数第二个位置开始取到结尾
print(s[:])
  • 输出: student,取出全部字符
print(s[::2])
  • 输出: suet,步长为2,每隔一个字符取一个

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp

c. 注意事项

  • 字符串的切片操作不会修改原始字符串,而是返回一个新的字符串。
  • 字符串是不可变的数据类型,因此不能通过索引或切片的方式修改字符串的某个字符或子串,否则会抛出TypeError异常。
s[0] = 'e'
s[1:3] = 'ut'
TypeError: 'str' object does not support item assignment

【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取,自然语言处理,正则表达式,python,开发语言,字符串构造,字符串截取,自然语言处理,nlp文章来源地址https://www.toymoban.com/news/detail-838758.html

到了这里,关于【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 自然语言处理NLP介绍——NLP简介

    2024年02月15日
    浏览(63)
  • 自然语言处理(NLP)技术

            自然语言处理技术是一种人工智能技术,它的目标是使计算机能够理解、分析、处理和生成自然语言(人类使用的语言)。NLP技术包括文本分类、情感分析、机器翻译、语音识别、语音合成、信息检索、信息抽取、问答系统等。NLP技术的应用非常广泛,例如智能客

    2024年02月14日
    浏览(51)
  • 聊聊自然语言处理NLP

    自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。 NLP工具的实现一般是基于机器学习与深度学习、其它

    2024年02月14日
    浏览(60)
  • NLP自然语言处理介绍

    自然语言处理(NLP,Natural Language Processing)是一门涉及计算机与人类语言之间交互的学科。它的目标是使计算机能够理解和生成人类语言,从而更好地处理和解析大量的文本数据。NLP不仅是人工智能领域中一个重要的分支,也是当今社会应用广泛的领域之一。 在NLP中,一个基

    2024年01月21日
    浏览(57)
  • 自然语言处理2-NLP

    目录 自然语言处理2-NLP 如何把词转换为向量 如何让向量具有语义信息 在CBOW中 在Skip-gram中 skip-gram比CBOW效果更好 CBOW和Skip-gram的算法实现 Skip-gram的理想实现 Skip-gram的实际实现 在自然语言处理任务中, 词向量(Word Embedding)是表示自然语言里单词的一种方法 ,即把每个词都表

    2024年02月11日
    浏览(60)
  • 自然语言处理NLP:一文了解NLP自然语言处理技术,NLP在生活中的应用,图导加深了解,NLP语料库,NLP开源工具

    目录 1.自然语言处理NLP 1.1 NLP中英对照(双份) 1.2 相关文章  2.NLP语料库

    2024年02月09日
    浏览(56)
  • 自然语言处理(NLP) —— 心理语言学

            认知科学和心理语言学是两个密切相关的领域,它们研究 认知过程和语言使用是如何相互作用的。         在历史上,这两个领域的发展经历了几个重要的阶段: 1.1.1 19世纪晚期(内省法)         Wundt 和其他德国心理学家使用一种叫做 内省法 的研究方

    2024年02月21日
    浏览(47)
  • 自然语言处理(NLP)是什么?

    您有没有和聊天机器人互动过?或者您是否向虚拟助手,例如 Siri、Alexa 或您车上的车载娱乐系统发出过某些请求?您使用过在线翻译吗?我们大多数人都曾与这些人工智能 (AI) 互动过,我们也从未停止过思考如何便捷地表达我们的需求并获得适当的回应。如果我和Siri说:“

    2024年02月10日
    浏览(57)
  • NLP(自然语言处理)是什么?

    NLP基本概念: 自然语言处理( Natural Language Processing, NLP)是以语言为对象,利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括

    2024年02月12日
    浏览(37)
  • 自然语言处理(NLP)技术的例子

    以下是几个自然语言处理(NLP)技术的例子: 机器翻译:机器翻译是将一种自然语言的文本转换成另一种语言的文本的过程。这种技术应用于在线翻译器、多语言聊天机器人、多语言搜索引擎等地方。 文本分类:文本分类将文本分成不同的类别,它可以被应用到垃圾邮件过

    2024年02月10日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包