图像特征描述和人脸识别

这篇具有很好参考价值的文章主要介绍了图像特征描述和人脸识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

特征检测

使用HOG实现行人检测

HOG方向梯度直方图

实现过程:

  1. 灰度化(为了去掉颜色、光照对形状的影响);
  2. 采用Gamma校正法对输入图像进行颜色空间的标准化(使得图像输入更符合肉眼看上去更加柔和的状态);
  3. 计算每个像素的梯度,包括方向和大小;
  4. 将图像划分成小cells;
  5. 统计每个cell的梯度直方图,得到cell的描述子;
  6. 将每几个cell组成一个block,得到block的描述子;
  7. 将图像image内的所有block的HOG特征descriptor串联起来就可以得到HOG特征,该特征向量就是用来目标检测或分类的特征。
import cv2
import numpy as np
# 判断矩形i是否完全包含在矩形o中
def is_inside(o, i):
 ox, oy, ow, oh = 0
 ix, iy, iw, ih = i
 return ox > ix and oy > iy and ox+ow < ix+iw and oy+oh < iy+ih

# 对人体绘制颜色框
def draw_person(image, person):
	x, y, w, h = person
	cv2.rectangle(image, (x,y), (x+w, y+h), (0,0,255), 1)
img = cv2.imread("person.png")
hog = cv2.HOGDescriptor() # 启动检测器对象
hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector()) # 指定检测器类型为人体
found, w = hog.detectMultiScale(img, 0.1, (1,1)) # 加载并检测对象
print(found)

# 丢弃某些完全被其它矩形包含在内的矩形,即其他都加入队列里
found_filtered = []
for ri, r in enumerate(found):
	for qi, q in enumerate(found):
		if ri != qi and is_inside(r, q):
			break
		else:
			found_filtered.append(r)
			print(found_filtered)
# 对其他有效矩形进行框定
for person in person_filtered:
	draw_person(img, person)
cv2.imshow("person detection", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

行人检测结果:
图像特征描述和人脸识别,计算机视觉基础,计算机视觉
换了其他图片,发现这是效果最好的一张☝️

学习材料如有侵权请联系笔者删除

Harris角点检测

实现过程:

  1. 计算图像在x和y方向的梯度
  2. 计算图像两个方向的梯度的乘积
  3. 使用高斯函数对三者进行高斯加权,生成矩阵M的A, B, C
  4. 计算每个像素的Harris响应值R,并对小于某一阈值t的R置为零
  5. 在3x3或5x5的邻域内进行非最大值抑制,局部最大值点即为图像的角点
import cv2
import numpy as np
img = cv2.imread("img.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = np.float32(gray) # 转换成numpy矩阵

# 输入图像必须是float32,blockSize,kernelsize,最后一个自由参数
#(经验取值在0.03~0.06之间)
dst = cv2.cornerHarris(gray, 2, 3, 0.03)

# 设定角点阈值,不同图像阈值不同
# 将角点用红色标注
img[dst>0.01*dst.max()]=[0, 0, 255]
# print(dst.max()) # 533091900.0
cv2.imshow("dst_img",img)
cv2.waitKey(0)
cv2.destryAllWindows()

角点检测:
图像特征描述和人脸识别,计算机视觉基础,计算机视觉在原图上进行角点标注:
图像特征描述和人脸识别,计算机视觉基础,计算机视觉
可以对角点进行膨胀,看得更清楚:

dst = cv2.dilate(dst,None)

图像特征描述和人脸识别,计算机视觉基础,计算机视觉
单纯使用Harris的话,稍微复杂一点检测效果不佳
图像特征描述和人脸识别,计算机视觉基础,计算机视觉

关键特征检测SIFT

Scale-invariant feature transform, 尺度不变特征变换算法
实现过程:

  1. 尺度空间极值检测点检测
  2. 关键点定位:去除一些不好的特征点
  3. 关键点方向参数:获取关键点所在尺度空间的邻域,然后计算该区域的梯度和方向,根据计算结果创建方向直方图,直方图的峰值为主方向的参数
  4. 关键点描述:每个关键点用一组向量(位置、尺度、方向)将这个关键点描述出来,使其不随着光照、视角等等影响而改变【优势】
  5. 关键点匹配:分别对模板图和实时图建立关键点描述符集合,通过对比关键点描述符来判断两个关键点是否相同

OpenCV > 4.0受到专利限制移除了xfeatures2d函数

import cv2
import numpy as np
img = cv2.imread("1.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

sift = cv2.xfeatures2d.SIFT_create()
kp = sift.detect(gray, None) # 找到关键点
img = cv2.drawKeypoints(gray, kp, img) # 绘制关键点

cv2.imshow('sp', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

纹理特征 LBP算法

Local Binary Pattern, 局部二值模式
LBP算子定义在3X3的窗口内,以窗口中心为阈值,与相邻的8个像素的灰度值比较,若周围的像素值大于中心像素值,则该位置被标为1;否则标记为0。

def LBP(src):
	height = src.shape[0]
	width = src.shape[1]
	dst = src.copy() # 浅拷贝
	lbp_value = np.zeros((1, 8), dtype=np.uint8)
	neighbours = np.zeros((1, 8), dtype=np.uint8)
	for x in range(1, width-1):
		for y in range(1, height-1):
			neighbours[0, 0] = src[y - 1, x - 1]
			neighbours[0, 1] = src[y - 1, x]
    		neighbours[0, 2] = src[y - 1, x + 1]
 	   		neighbours[0, 3] = src[y, x - 1]
   	  	    neighbours[0, 4] = src[y, x + 1]
        	neighbours[0, 5] = src[y + 1, x - 1]
        	neighbours[0, 6] = src[y + 1, x]
        	neighbours[0, 7] = src[y + 1, x + 1]
	        center = src[y, x]
        	for i in range(8):
        		if neighbours[0, i] > center:
        			lbp_value[0, i] = 1
      	  	else:
        			lbp_value[0, i] = 0
			# 计算lbp值(即二进制到十进制)
			lbp = lbp_value[0, 0] * 1 + lbp_value[0, 1] * 2 + lbp_value[0, 2] * 4 + lbp_value[0, 3] * 8 \
			 + lbp_value[0, 4] * 16 + lbp_value[0, 5] * 32 + lbp_value[0, 6] * 64 + lbp_value[0, 7] * 128
			# 将中心值改为lbp值
			dst[y, x] = lbp
		
	return dst

import cv2
import numpy as np
img = cv2.imread('building.png', 0) # 以单通道读入图像
# 看下源图
cv2.imshow('src',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

new_img = LBP(img)

cv2.imshow('lbp',new_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像特征描述和人脸识别,计算机视觉基础,计算机视觉
图像特征描述和人脸识别,计算机视觉基础,计算机视觉

模板匹配

人脸识别

一个完整的人脸识别系统一般包含4个主要组成部分:

  1. 人脸检测(人脸位置)Face Detect
  2. 人脸对齐(五官位置)Face Alignment
  3. 人脸特征提取(抽象为字符串信息)Face Feature Extraction
  4. 人脸识别(计算相似度,确认身份)Face Recognition
  • OpenCV封装的人脸检测方法
import cv2

img = cv2.imread("1.png")
# 检测器,加载人脸特征(该文件在python安装目录下)
face_cascade = cv2.CascadeClassifier(r'haaracascade_frontalface_default.xml')
# 灰度图减少计算强度(避免颜色干扰)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 检测的一个人脸坐标[x,y,w,h]是一个list,所以list的数量就是人脸数量
faces = face_cascade.detectMultiScale(gray, scaleFactor = 1.15, minNeighbors = 4, minSize = (5, 5))
print("Faces:{0}".format(len(faces)))

# 用矩形圈出人脸的位置(提供左上角和右下角坐标)
for(x, y, w, h) in faces:
	cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2)

cv2.imshow("Faces", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Face : 1
图像特征描述和人脸识别,计算机视觉基础,计算机视觉
通过其他照片的试验,OpenCV自带的方法和dilb对于标准正脸检测OK的,但是对于侧脸(不同角度)以及低像素基本完全不OK

  • 使用dlib中的方法
# -*- coding:utf-8 -*-
import cv2
import dlib
import numpy as np

predictor_model = 'shape_predictor_68_face_landmarks/shape_predictor_68_face_landmarks.dat'
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor(predictor_model)

dlib库没办法直接pip安装
找python3.8对应的dlib的轮子找了好一会儿,放百度盘了需要自取

许多博客尤其是CSDN,开源的资源放自己文章里收费😅,很不友好,目前还是习惯在这里记一些流水帐笔记😞文章来源地址https://www.toymoban.com/news/detail-678084.html

到了这里,关于图像特征描述和人脸识别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • OpenCV完结篇——计算机视觉(人脸识别 || 车牌识别)

    scaleFactor调整哈尔级联器的人脸选框使其能框住人脸 官方教程指路 每个特征都是通过从黑色矩形下的像素总和减去白色矩形下的像素总和获得的单个值 级联器模型文件位置 识别嘴就会不精确了 识别鼻子 只要不测口,还是比较准确的 测口准确度太低!!! 安装很简单,这里

    2024年02月19日
    浏览(50)
  • 每天五分钟计算机视觉:使用神经网络完成人脸的特征点检测

    我们上一节课程中学习了如何利用神经网络对图片中的对象进行定位,也就是通过输出四个参数值bx、by、bℎ和bw给出图片中对象的边界框。 本节课程我们学习 特征点的检测 ,神经网络可以通过输出图片中对象的特征点的(x,y)坐标来实现对目标特征的识别, 我们看几个例子

    2024年04月17日
    浏览(92)
  • 计算机视觉之图像特征提取

    图像特征提取是计算机视觉中的重要任务,它有助于识别、分类、检测和跟踪对象。以下是一些常用的图像特征提取算法及其简介: 颜色直方图(Color Histogram) : 简介 :颜色直方图表示图像中各种颜色的分布情况。通过将图像中的像素分成颜色通道(如RGB)并计算每个通道

    2024年02月12日
    浏览(40)
  • 计算机视觉基础__图像特征

    目录 一、前言 二、位图和矢量图概念 三、图像的颜色特征 四、RGB 颜色空间 五、HSV 颜色空间 六、HLS 颜色空间 七、CMYK 颜色 八、Lab模式 九、索引模式 十、HSB色彩模式 十一、灰度图 十二、二值图 十三、P(pallete)模式 十四、位图模式 十五、双色调模式 十六、多通道模式

    2023年04月19日
    浏览(49)
  • 计算机视觉设计如何应用于人脸识别技术?

           计算机视觉设计在人脸识别技术中起着重要的作用。它通过使用图像处理和模式识别技术,对人脸图像进行分析和比对,从而实现人脸的检测、定位和识别。下面是计算机视觉设计在人脸识别技术中的应用方法: 人脸检测:计算机视觉设计可以通过使用人脸检测算法

    2024年01月19日
    浏览(48)
  • 【计算机视觉40例】案例29:LBPH人脸识别

    【 导读 】本文是专栏《计算机视觉 40 例简介》的第 29 个案例《 LBPH 人脸识别 》。该专栏简要介绍李立宗主编《计算机视觉 40 例——从入门到深度学习( OpenCV-Python )》一书的 40 个案例。 目前,该书已经在电子工业出版社出版,大家可以在京东、淘宝、当当等平台购买。

    2024年02月06日
    浏览(40)
  • 计算机视觉丨基于OpenCV的人脸识别打卡系统

    本期内容:基于OpenCV的WANT公司人脸识别打卡系统。 项目需求 : pycharm opencv numpy 项目下载路径:https://download.csdn.net/download/m0_68111267/88754360 社会上很多公司,学院都需要使用手机或者智能软件进行打卡签到。随着计算机技术的飞速发展,计算机视觉技术也越来越成熟了,例如

    2024年01月18日
    浏览(50)
  • 图像特征Vol.1:计算机视觉特征度量|第一弹:【纹理区域特征】

    🍊 什么是计算机视觉特征? 简单来说就是 图像特征 ,对于我们来说,看到一张图片,能很自然的说出和描述图像中的一些特征,但是同样的图片,丢给计算机,只是一个二维矩阵,计算机需要从这个图像中提取计算得到一些数值表示,来描述这个图像所具有的特征:颜色

    2024年02月03日
    浏览(60)
  • 矩阵分析与计算机视觉:从特征提取到对象识别

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机对图像和视频等多媒体数据进行处理和理解的技术。矩阵分析是线性代数的一个重要分支,它涉及到矩阵的运算、分解、求解等方面。在计算机视觉中,矩阵分析起到了关键的支持作用,因为图像和视频数据都可以

    2024年01月19日
    浏览(41)
  • 特征向量与计算机视觉: 解决图像理解的挑战

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机对于图像和视频的理解与处理。图像理解是计算机视觉的核心技术之一,它旨在让计算机能够理解图像中的对象、场景和动作,并进行相关的分析和判断。然而,图像理解的挑战在于图像中的信息量非常大,并且与

    2024年04月14日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包