KMP算法的及其原理-Toy模板网

这篇具有很好参考价值的文章主要介绍了KMP算法的及其原理。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

KMP算法

首先我们先了解一下 KMP算法的作用 str1 和str2 字符串如果str1中包含str2 那么返回头位置

如果不包含返回-1

首先我们先加入一个概念: 有一个next数组 next[i]的值为 str2 中以i-1位置为结尾的字符串中最长相同前缀后缀为多长(相同前缀后缀不是对称 aba 中相等的后缀为a 而非ab ba(这个是对称) 且不要让前缀\后缀长度等于字符串因为对于任何一个字符串来说它本身的最长前缀/后缀都是它本身肯定相等)

举个例子 a b a b f f位置的next值为2 0 1 位置的next值恒为-1

好来开下流程 str2先匹配str1 两个指针齐头并进到达第一个不满足的位置它位置的next值为5 那么直接从str2的5位置接着匹配下去

KMP算法的及其原理,算法,java,开发语言

就是从这个X Y为不同的地方然后str2 Z和str1 Y继续匹配如果再不相同呢就找到Z 的next答案然后从答案位置匹配... 如果一直next到0了都没匹配成功那就让str1的指针++ 也就是说从Y+1为开头继续匹配

解释一下原因

KMP算法的及其原理,算法,java,开发语言

首先我们知道Z和Y匹配本质上是看以N开头的字符串和整个str2匹配但是为什么N到Y之间的那段不用看了呢首先对于str2来说因为X位置的答案为5 那么str2的前五个(0-4)和后五个一定相等对吧然后因为我们str1和str2 X Y之前的部分已经判断完相等了对吧所以str2的0-4 等于 (x-5)~(x-1) 然鸡皮N~Y-1 又和 (x-5)~(x-1)一一对应所以0-4和N~Y-1 就一定相等

那为什么不能是本质上N+1和0位置上匹配呢额因为X Y位置不同了所以他到这一定会断掉

哎是不是感觉还有哪不对是的这只能解释 N到Y-1的部分不用判断但是解释不了为什么N之前的不用判断

好我们假设N之前有匹配的字符串

KMP算法的及其原理,算法,java,开发语言

对吧假设S位置就可以匹配上了那str2的前八个字符肯定和这个S开始的八个字符相同再因为Y前的字符和X前的字符一一相等所以 S到Y-1 一定和下面str2中X-8到X-1的字符一一对应那也可以推出对于str2来说0~7和X-8到X-1相同那X位置的next值应该是8啊怎么能是5呢这就冲突了对不对

所以基于这两个原理 str2可以直接和N进行比较

然后看做一个递归过程如果我Z和Y没匹配上那是不是又是一个同样的问题哎再去找Z的答案一直找找到str2开头0位置了还没找到那就说明真配不上这整个一块都不行你就把Y往下走吧

快速求next数组

反正跳出的时候 cn一定是当前位置的值那到下一个循环的时候 cn就一定是上一个位置的结果那str[cn]对应的是什么呢就是要判断的位置啊
因为next的值是前缀后缀相同的长度如果这个位置的值是2 好那我们就要判断第三个元素相不相同如果相同那就是值就是2+1 其实本来应该是前缀长度+1的位置的但是正好数组是从0开始的都省了

那如果这个位置不同呢? 那就说明衔接不上那我们再往前推一段

假如说a b a s a b a t g 这个数组它对应位置的值为(是相等不是对称)

-1 0 0 1 0 1 2 3

我们求g g位置本质是求t结尾的前缀后缀相同最大长度 a结尾的最大相同长度为3 哎如果我这个t正好和第四个位置相同是不是就直接套上了可惜不同那没办法但是呢也不一定直接为0 还要看我们3位置的值因为你不能接在这个后面的话那更短的位置呢

假如这种情况 abagababs 我们求s位置的值也就是以前一个字符结尾的那个值虽然部门不能接到aba后面让最大相等长度为4 但是我们可以去看更前面它和ab还是组成了前缀后缀相同的

画个图直观理解一下

KMP算法的及其原理,算法,java,开发语言

Y位置的结果就是以Y-1结尾的最长相等前缀后缀假如说已经求出来了这两个方块区间代表前缀和后缀我们求Y+1的结果那就是以Y结尾的最长相等前缀后缀这两块区间肯定相等的如果Y和X相等那是最好的我们直接上一个位置的值+1 就出结果了但是不同呢?难道直接归零去比对吗不还可以优化

假如说x位置有值这个值就代表着前缀a 前缀b是相等的那么在x的另一侧就有对应的 c 和d 相等

因为根据Y知道 x的左右两个大区间肯定是相等的

所以可以推出a和c相等 b和d相等

有了这几个条件我们就知道了 a和d相等所以Y如果和a的下一个字符配上了那它的结果就等于x结果加1

KMP算法的及其原理,算法,java,开发语言

那一直干到最开始都没匹配上那就说明没有了呗

OK我们开始coding文章来源地址https://www.toymoban.com/news/detail-609772.html

 public static int KMP(String str,String match) {
		char [] str1 = str.toCharArray();
		char [] str2 = match.toCharArray();
		int x = 0;
		int y = 0;
		int [] next = getnext(str2);
		while(x<str1.length&&y<str2.length) {
			if(str1[x]==str2[y]) {
				x++;
				y++;
			}else if(next[y]==-1){
				x++
			}else {
				y = next[y];
			}
		}
		return y == str2.length ? x - y : -1;//y走到头了 说明匹配出来了(y要比实际位置+1 走出while循环都这样) x走到头了说明没有
	}
    public static int [] getnext(char [] str) {
		int [] next = new int [str.length];
		next[0] = -1;
		next[1] = 0;
		int index = 2;
		int cn = 0;
		while(index<str.length) {
			if(str[index-1]==str[cn]) {
				next[index++] = ++cn;
			}else if(cn>0) {
				cn = next[cn];
			}else {
				next[index++] = 0;
			}
		}
		return next;
	}

到了这里，关于KMP算法的及其原理的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！