牛逼的python库-使用FuzzyWuzzy库进行模糊字符串匹配

这篇具有很好参考价值的文章主要介绍了牛逼的python库-使用FuzzyWuzzy库进行模糊字符串匹配。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

FuzzyWuzzy是一个Python库,用于模糊字符串匹配和字符串相似度计算。它基于Levenshtein距离算法,用于比较两个字符串之间的差异。

下面是FuzzyWuzzy库的一些常见用法:

  • 导入库和模块:

    from fuzzywuzzy import fuzz
    from fuzzywuzzy import process
    
  • 使用fuzz.ratio计算两个字符串之间的相似度:

    similarity = fuzz.ratio("apple", "aple")
    

    这会计算出两个字符串之间的相似度百分比。

  • 使用fuzz.partial_ratio计算两个部分字符串之间的相似度:

    similarity = fuzz.partial_ratio("apple", "aple")
    

    这会计算出两个字符串的部分字符串之间的相似度。

  • 使用fuzz.token_sort_ratio计算排序后的字符串之间的相似度:

    similarity = fuzz.token_sort_ratio("apple pie", "pie apple")
    

    这会计算出对两个字符串进行排序后的相似度。

  • 使用fuzz.token_set_ratio计算集合中的字符串之间的相似度:

    similarity = fuzz.token_set_ratio("apple pie is delicious", "delicious apple is pie")
    

    这会计算出集合中的字符串之间的相似度。

  • 使用process.extract函数获取一个字符串与一组候选字符串的相似度最高的匹配项:

    choices = ["apple", "banana", "orange"]
    best_match = process.extractOne("aple", choices)
    print(best_match)
    

    输出结果为:('apple', 90),表示"aple"与"apple"的相似度为90。

  • 使用process.extract函数获取一个字符串与一组候选字符串所有可能匹配项的相似度列表:

    choices = ["apple", "banana", "orange"]
    matches = process.extract("aple", choices)
    print(matches)
    

    输出结果为:[('apple', 90), ('banana', 29), ('orange', 22)],表示"aple"与每个候选字符串的相似度。

  • 使用fuzz.WRatio计算两个字符串之间的相似度,它对字符串的字符大小写不敏感:

    similarity = fuzz.WRatio("apple", "aPpLe")
    print(similarity)
    

    输出结果为:100,表示"apple"与"aPpLe"的相似度为100。

  • 使用fuzz.partial_token_sort_ratio计算排序后的部分字符串之间的相似度:

    similarity = fuzz.partial_token_sort_ratio("apple pie", "pie is delicious")
    print(similarity)
    

    输出结果为:67,表示排序后的"apple pie"与"pie is delicious"的部分字符串之间的相似度为67。文章来源地址https://www.toymoban.com/news/detail-522537.html

到了这里,关于牛逼的python库-使用FuzzyWuzzy库进行模糊字符串匹配的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • StableStudio,比Midjourney还牛逼的绘画平台,免费!

    大家好,我是鸟哥。 之前给大家推荐过Midjourney和Bluewillow两个AI绘画平台:简直了!比Midjourney更刺激,还免费!Midjourney功能超级强大,但比较傲娇,很贵,是否让用户免费体验要看心情;Bluewillow免费,但质量稍微差了一点。 今天呢,再给大家推荐一个AI绘图平台——StableS

    2024年02月09日
    浏览(49)
  • vscode 配置 copilot(最牛逼的AI智能提示)

    https://link.zhihu.com/?target=https%3A//github.com/features/copilot/signup 因为拓展程序默认下载的是最新的 会不匹配 提示报错你 更新最新版的拓展 或者手动下载别的版本拓展 具体原因是因为 github 没有被墙 但是亚洲区域 cdn 被墙了 需要自己手动指定最新的 host ip 地址 查询动态 IP 地址

    2024年02月02日
    浏览(52)
  • 这五款牛逼的 IDEA 插件,堪称代码质量检查利器!

    随着业务的发展,系统会越来越庞大,原本简单稳定的功能,可能在不断迭代后复杂度上升,潜在的风险也随之暴露,导致最终服务不稳定,造成业务价值的损失。而为了减少这种情况,其中一种比较好的方式就是提高代码质量,比如通过代码审查,从而降低错误风险,但是

    2024年04月16日
    浏览(57)
  • 【 一个比 ping 更强大、更牛逼的命令行工具!】

    遇到网络故障的时候,你一般会最先使用哪条命令进行排障? 除了Ping,还有Traceroute、Show、Telnet又或是Clear、Debug等等。 今天安排的,是Traceroute命令详解,还有经典排障案例哈。 Traceroute 原理和功能 traceroute是一个常用的Linux网络诊断命令,用于追踪数据包从源主机到目标主

    2024年02月06日
    浏览(51)
  • 这是我见过最牛逼的滑动加载前端框架

    在手机端实现下拉刷新和下拉加载是最常见不过的需求了。今天大师兄就给大家分享一个非常精致的js框架:mescroll. 提示:以下是本篇文章正文内容,下面案例可供参考 mescroll.js 是在 H5端 运行的下拉刷新和上拉加载插件。1.4.1以上版本,还能配置图片懒加载效果。 mescroll.j

    2024年01月21日
    浏览(46)
  • 膜拜!用最少的代码却实现了最牛逼的滚动动画!

    大家好,我是 程序视点 的小二哥!今天小二哥带领大家学习如何使用最少的代码创建令人叹为观止的滚动动画~ 在聊 ScrollTrigger 插件之前我们先简单了解下 GSAP 。 GreenSock 动画平台 (GSAP) 可为 JavaScript 可以操作的任何内容(CSS 属性、SVG、React、画布、通用对象等)动画化,并

    2024年02月14日
    浏览(43)
  • 教你成为比卡卡西还牛逼的全能忍者,全拷贝与分割函数

     如何成为一个集雷切,写轮眼侦查和拷贝与一身的卡卡西,下面教你! 目录  第一式——雷切!  strtok 第二式——写轮眼侦查! strerror函数 第三式——写轮眼拷贝! memcpy  模拟实现memcpy函数   😎博客昵称:陈大大陈 😊座右铭:所谓觉悟,就是在漆黑的荒野上开辟出一条

    2024年01月19日
    浏览(41)
  • python字符串模糊匹配,并计算匹配分数

    thefuzz包以前叫fuzzywuzzy,0.19版本开始改名为thefuzz,github地址: GitHub - seatgeek/thefuzz: Fuzzy String Matching in Python 可以通过命令pip install thefuzz安装此包。用法还是比较简单的: 上面两个字符串的相似度为89%。 我们先看看这个包下面的源码,来查看thefuzz是怎么实现模糊匹配的。the

    2023年04月23日
    浏览(108)
  • fuzzywuzzy,一个好用的 Python 库!

    目录 前言 安装 基本功能  1. 字符串相似度比较  2. 模糊匹配与排序 实际应用场景  1. 数据清洗  2. 文本匹配与搜索  3. 搜索引擎优化 总结 大家好,今天为大家分享一个好用的 Python 库 - fuzzywuzzy Github地址:https://github.com/seatgeek/fuzzywuzzy Python的fuzzywuzzy库是一个强大的模糊字

    2024年04月08日
    浏览(36)
  • python中redis进行模糊查询(keys()、scan()、scan_iter())

    python中使用redis进行模糊查询,可以使用scan()命令模糊匹配key。 keys命令 :简单粗暴,但是由于Redis是单线程,keys命令是以阻塞的方式执行的,keys是以遍历的方式实现的复杂度是 O(n),Redis库中的key越多,查找实现代价越大,产生的阻塞时间越长。 scan命令 : 以非阻塞的方式

    2024年02月07日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包