深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用

这篇具有很好参考价值的文章主要介绍了深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


一、二、Tesnsflow入门 & 环境配置 & 认识Tensorflow

Tensorflow入门(1)——深度学习框架Tesnsflow入门 & 环境配置 & 认识Tensorflow

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

三、线程与队列与IO操作

深度学习框架Tesnsflow & 线程+队列+IO操作 & 文件读取案例

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

神经网络基础知识

神经网络的种类:
基础神经网络:单层感知器,线性神经网络,BP神经网络,Hopfield神经网络等
进阶神经网络:玻尔兹曼机,受限玻尔兹曼机,递归神经网络等
深度神经网络:深度置信网络,卷积神经网络,循环神经网络,LSTM网络等
• 结构(Architecture)例如,神经网络中的变量可以是神经元连接的权重
• 激励函数(Activity Rule)大部分神经网络模型具有一个短时间尺度的动力学规则,来定义神经元如何根据其他神经元的活动来改变自己的激励值。
• 学习规则(Learning Rule)学习规则指定了网络中的权重如何随着时间推进而调整。(反向传播算法)

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

损失计算-交叉熵损失公式

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

1.简单神经网络

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

http://yann.lecun.com/exdb/mnist/

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

TensorFlow的代码

import tensorflow as tf
old_v = tf.logging.get_verbosity()
tf.logging.set_verbosity(tf.logging.ERROR)
from tensorflow.examples.tutorials.mnist import input_data
FLAGS = tf.app.flags.FLAGS
tf.app.flags.DEFINE_integer("is_train", 1, "指定程序是预测还是训练")


def full_connected():

    # 获取真实的数据
    mnist = input_data.read_data_sets("./data/mnist/", one_hot=True)
    tf.logging.set_verbosity(old_v)
    # 1、建立数据的占位符 x [None, 784]    y_true [None, 10]
    with tf.variable_scope("data"): # 作用域
        x = tf.placeholder(tf.float32, [None, 784])
        y_true = tf.placeholder(tf.int32, [None, 10])
    # 2、建立一个全连接层的神经网络 w [784, 10]   b [10]
    with tf.variable_scope("fc_model"):
        # 随机初始化权重和偏置
        weight = tf.Variable(tf.random_normal([784, 10], mean=0.0, stddev=1.0), name="w")
        bias = tf.Variable(tf.constant(0.0, shape=[10]))
        # 预测None个样本的输出结果matrix [None, 784]* [784, 10] + [10] = [None, 10]
        y_predict = tf.matmul(x, weight) + bias

    # 3、求出所有样本的损失,然后求平均值
    with tf.variable_scope("soft_cross"):
        # 求平均交叉熵损失
        loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))

    # 4、梯度下降求出损失
    with tf.variable_scope("optimizer"):
        train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)# 学习率和最小化损失
    # 5、计算准确率
    with tf.variable_scope("acc"):

        equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))
        # equal_list  None个样本   [1, 0, 1, 0, 1, 1,..........]
        accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))
    # 收集变量 单个数字值收集
    tf.summary.scalar("losses", loss)
    tf.summary.scalar("acc", accuracy)
    # 高纬度变量收集
    tf.summary.histogram("weightes", weight)
    tf.summary.histogram("biases", bias)
    # 定义一个初始化变量的op
    init_op = tf.global_variables_initializer()
    # 定义一个合并变量的 op
    merged = tf.summary.merge_all()
    # 创建一个saver
    saver = tf.train.Saver()   
    # 开启会话去训练
    with tf.Session() as sess:
        # 初始化变量
        sess.run(init_op)
        # 建立events文件,然后写入
        filewriter = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
        if FLAGS.is_train == 1:# 如果是1,进行训练
            # 迭代步数去训练,更新参数预测
            for i in range(2000):
                # 取出真实存在的特征值和目标值
                mnist_x, mnist_y = mnist.train.next_batch(50)
                # 运行train_op训练
                sess.run(train_op, feed_dict={x: mnist_x, y_true: mnist_y})

                # 写入每步训练的值
                summary = sess.run(merged, feed_dict={x: mnist_x, y_true: mnist_y})

                filewriter.add_summary(summary, i)

                print("训练第%d步,准确率为:%f" % (i, sess.run(accuracy, feed_dict={x: mnist_x, y_true: mnist_y})))
            # 保存模型
            saver.save(sess, "./tmp/ckpt/fc_model")
        else:# 如果是0,做出预测
            # 加载模型
            saver.restore(sess, "./tmp/ckpt/fc_model")
            # 如果是0,做出预测
            for i in range(100):
                # 每次测试一张图片 [0,0,0,0,0,1,0,0,0,0]
                x_test, y_test = mnist.test.next_batch(1)
                print("第%d张图片,手写数字图片目标是:%d, 预测结果是:%d" % (
                    i,
                    tf.argmax(y_test, 1).eval(),
                    tf.argmax(sess.run(y_predict, feed_dict={x: x_test, y_true: y_test}), 1).eval()
                ))
    return None

if __name__ == "__main__":
    full_connected()

2.卷积神经网络

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

神经网络的进化

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn
神经网络(neural networks)的基本组成包括输入层、隐藏层、输出层。而卷积神经网络的特点在于隐藏层分为卷积层和池化层(pooling layer,又叫下采样层)。

  • 卷积层:通过在原始图像上平移来提取特征,每一个特征就是一个特征映射
  • 池化层:通过特征后稀疏参数来减少学习的参数,降低网络的复杂度,(最大池化和平均池化)

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

结构示意图

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn
零填充:
• 卷积核在提取特征映射时的动作称之为padding(零填充),由于移动步长不一定能整除整张图的像素宽度。其中有两种方式,SAME和VALID

  1. SAME:越过边缘取样,取样的面积和输入图像的像素宽度一致。
  2. VALID:不越过边缘取样,取样的面积小于输入人的图像的像素宽度

卷积层

tf.nn.conv2d(input, filter, strides=, padding=, name=None)
计算给定4-D input和filter张量的2维卷积
input:给定的输入张量,具有[batch,heigth,width,
channel],类型为float32,64
filter:指定过滤器的大小,[filter_height, filter_width, in_channels, out_channels]
strides:strides = [1, stride, stride, 1],步长
padding:“SAME”, “VALID”,使用的填充算法的类型,使用“SAME”。其中”VALID”表示滑动超出部分舍弃,“SAME”表示填充,使得变化后height,width一样大

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

新的激活函数-Relu

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn

第一,采用sigmoid等函数,反向传播求误差梯度时,计算量相对大,而采用Relu激活函数,整个过程的计算量节省很多

第二,对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况(求不出权重和偏置)

激活函数:
tf.nn.relu(features, name=None)
features:卷积后加上偏置的结果
return:结果

池化层(Pooling)计算

Pooling层主要的作用是特征提取,通过去掉Feature Map中不重要的样本,进一步减少参数数量。Pooling的方法很多,最常用的是Max Pooling。

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn
深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn
池化:
tf.nn.max_pool(value, ksize=, strides=, padding=,name=None)
输入上执行最大池数
value:4-D Tensor形状[batch, height, width, channels]
ksize:池化窗口大小,[1, ksize, ksize, 1]
strides:步长大小,[1,strides,strides,1]
padding:“SAME”, “VALID”,使用的填充算法的类型,使用“SAME”

Full Connected层:
分析:前面的卷积和池化相当于做特征工程,后面的全连接相当于做特征加权。最后的全连接层在整个卷积神经网络中起到“分类器”的作用。

案例:Mnist手写数字图片识别卷积网络案例

流程:
1、准备数据
2、卷积、激活、池化(两层)
3、全连接层
4、计算准确率

import tensorflow as tf
old_v = tf.logging.get_verbosity()
tf.logging.set_verbosity(tf.logging.ERROR)
from tensorflow.examples.tutorials.mnist import input_data
# 定义一个初始化权重的函数
def weight_variable(shape):
    w = tf.Variable(tf.random_normal(shape=shape,mean=0.0,stddev=1.0))
    return w
# 定义一个初始化偏置的函数
def bias_variable(shape):
    b = tf.Variable(tf.constant(0.0,shape=shape))
    return b
def model():
    '''
    自定义的卷积模型
    :return:
    '''
    # 1、准备数据的占位符  x [None, 784]    y_true [None, 10]
    with tf.variable_scope("data"): # 作用域
        x = tf.placeholder(tf.float32, [None, 784])
        y_true = tf.placeholder(tf.int32, [None, 10])

    # 2、一卷积层 卷积 5x5x1,32个,strides=1
            ##   激活 tf.nn.relu,池化
    with tf.variable_scope("conv1"):  # 作用域
        # 随机初始化权重,偏置
        w_conv1 = weight_variable([5,5,1,32])
        b_conv1 = bias_variable([32])
        # 对 x进行形状的改变 [none,784]  ---> [none,28,28,1]
        x_reshape = tf.reshape(x,[-1,28,28,1])

        # 卷积 [none,28,28,1] ---> [none,28,28,32]
        x_relu = tf.nn.relu(tf.nn.conv2d(x_reshape,w_conv1,strides=[1,1,1,1],padding="SAME") + b_conv1)
        # 池化 2x2,strides=2[none,28,28,32]---> [none,14,14,32]
        x_pool1 = tf.nn.max_pool(x_relu, ksize=[1,2,2,1],strides=[1,2,2,1], padding="SAME")

    # 3、二卷积层       卷积 5x5x32,64个,strides=1
    #             ##   激活 tf.nn.relu,池化
        # 随机初始化权重[5, 5, 32, 64],偏置
        w_conv2 = weight_variable([5, 5, 32, 64])
        b_conv2 = bias_variable([64])
        # 卷积,激活,池化计算
        # [none,14,14,32] ---> [none,14,14,64]
        x_relu2 = tf.nn.relu(tf.nn.conv2d(x_pool1, w_conv2, strides=[1, 1, 1, 1], padding="SAME") + b_conv2)
        # 池化 2x2,strides=2[none,14,14,64]---> [none,7,7,64]
        x_pool2 = tf.nn.max_pool(x_relu2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

    # 4、全连接层 [none,7,7,64]---> [none,7*7*64]*[7*7*64,10] +[10] = [none,10]
    with tf.variable_scope("conv2"):  # 作用域none,
        # 随机初始化权重,偏置
        w_fc = weight_variable([7*7*64, 10])
        b_fc = bias_variable([10])

        # 修改形状 [none,7,7,64]---> [none,7*7*64],四维到二维
        x_fc_reshape = tf.reshape(x_pool2,[-1,7*7*64])

        # 矩阵运算得出每个样本的10个结果
        y_predict = tf.matmul(x_fc_reshape, w_fc) + b_fc

    return  x , y_true ,y_predict

def conv_fc():
    #获取真实数据
    mnist = input_data.read_data_sets("./data/mnist/", one_hot=True)
    # 定义模型,得出输出
    x, y_true, y_predict = model()

    # 进行交叉熵损失计算
    with tf.variable_scope("soft_cross"):
        # 求平均交叉熵损失
        loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))

    # 4、梯度下降求出损失 学习率要比较小
    with tf.variable_scope("optimizer"):
        train_op = tf.train.GradientDescentOptimizer(0.0001).minimize(loss)# 学习率和最小化损失

    # 5、计算准确率
    with tf.variable_scope("acc"):
        equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))
        # equal_list  None个样本   [1, 0, 1, 0, 1, 1,..........]
        accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))

    # 定义一个初始化变量 op
    init_op = tf.global_variables_initializer()
    # 开启会话去训练

    with tf.Session() as sess:
        # 初始化变量
        sess.run(init_op)
        # 循环训练
        for i in range(1000):
            # 取出真实存在的特征值和目标值
            mnist_x, mnist_y = mnist.train.next_batch(50)
            # 运行train_op训练
            sess.run(train_op, feed_dict={x: mnist_x, y_true: mnist_y})
            print("训练第%d步,准确率为:%f" % (i, sess.run(accuracy, feed_dict={x: mnist_x, y_true: mnist_y})))
    return None

if __name__ == "__main__":
    conv_fc()

GoogleNet:

深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn
深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用,python,深度学习,神经网络,dnn文章来源地址https://www.toymoban.com/news/detail-599881.html

到了这里,关于深度神经网络基础——深度学习神经网络基础 & Tensorflow在深度学习的应用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pytorch第2周:深度学习基础 - Day 8-9: 神经网络基础

    Pytorch第2周:深度学习基础 - Day 8-9: 神经网络基础 学习目标: 理解神经网络的基础概念。 学习如何使用PyTorch的nn模块构建神经网络。 学习内容: 神经网络基础概念: 神经元:构成神经网络的基本单元,模拟生物神经元的功能。 层:神经网络的构建块,包括输入层、隐藏层

    2024年01月20日
    浏览(51)
  • 深度学习基础:循环神经网络中的长期依赖问题

    在深度学习中,循环神经网络(RNN)是一种经典的模型,用于处理序列数据,如自然语言处理、时间序列预测等任务。然而,传统的RNN存在着一个长期依赖问题,即在处理长序列时,模型往往难以捕捉到序列中远距离的依赖关系,导致性能下降。在本文中,我们将介绍长期依

    2024年04月28日
    浏览(37)
  • 16 PyTorch 神经网络基础【李沐动手学深度学习v2】

    在构造自定义块之前,我们先回顾一下多层感知机的代码。 下面的代码生成一个网络,其中包含一个具有256个单元和ReLU激活函数的全连接隐藏层, 然后是一个具有10个隐藏单元且不带激活函数的全连接输出层。 层和块 构造单层神经网咯:线性层+RELU+线性层 生成2x20(2是批量

    2024年03月10日
    浏览(84)
  • 深度学习基础——卷积神经网络的感受野、参数量、计算量

    深度学习在图像处理领域取得了巨大的成功,其中卷积神经网络(Convolutional Neural Networks,CNN)是一种非常重要的网络结构。本文将介绍卷积神经网络的三个重要指标:感受野、参数量和计算量。首先,会对这些指标进行定义,然后介绍如何计算它们,并通过Python实现示例代

    2024年04月28日
    浏览(38)
  • 计算机视觉基础知识(十二)--神经网络与深度学习

    一种机器学习的算法 一般有输入层--隐藏层--输出层 隐藏层数量多于两个的称为深度神经网络; 输入的是特征向量; 特征向量代表的是变化的方向; 或者说是最能代表这个事物的特征方向; 权重是特征值,有正有负,加强或抑制; 权重的绝对值大小,代表输入信号对神经元的影响大小

    2024年02月21日
    浏览(53)
  • 《PyTorch深度学习实践》第十一讲 循环神经网络(基础篇 + 高级篇)

    b站刘二大人《PyTorch深度学习实践》课程第十一讲循环神经网络(基础篇 + 高级篇)笔记与代码: https://www.bilibili.com/video/BV1Y7411d7Ys?p=12vd_source=b17f113d28933824d753a0915d5e3a90 https://www.bilibili.com/video/BV1Y7411d7Ys?p=13spm_id_from=pageDrivervd_source=b17f113d28933824d753a0915d5e3a90 markdown笔记:https://gi

    2024年02月13日
    浏览(40)
  • 40 深度学习(四):卷积神经网络|深度可分离卷积|colab和kaggle的基础使用

    卷积神经网络的基本结构 1: (卷积层+(可选)池化层) * N+全连接层 * M(N=1,M=0) 卷积层的输入和输出都是矩阵,全连接层的输入和输出都是向量,在最后一层的卷积上,把它做一个展平,这样就可以和全连接层进行运算了,为什么卷积要放到前面,因为展平丧失了维度信息,因

    2024年02月08日
    浏览(43)
  • 深度学习基础——通过PyTorch构建神经网络实现1维/2维序列分类

    通过PyTorch构建前馈神经网络,并对二维数据点进行分类。在该例子当中,所有的训练数据和测试数据都是通过高斯混合模型GMM生成的: 更换使用循环神经网络RNN模型,进行1维序列分类任务。 为了简化问题,我们假定: 序列的长度是固定的。我们将其长度设为T=4。 我们只有

    2024年02月11日
    浏览(40)
  • 深度学习实战基础案例——卷积神经网络(CNN)基于SqueezeNet的眼疾识别|第1例

    SqueezeNet是一种轻量且高效的CNN模型,它参数比AlexNet少50倍,但模型性能(accuracy)与AlexNet接近。顾名思义,Squeeze的中文意思是压缩和挤压的意思,所以我们通过算法的名字就可以猜想到,该算法一定是通过压缩模型来降低模型参数量的。当然任何算法的改进都是在原先的基

    2024年02月12日
    浏览(44)
  • 第二章:AI大模型的基本原理2.2 深度学习基础2.2.3 循环神经网络

    循环神经网络(Recurrent Neural Networks,RNN)是一种特殊的神经网络结构,它可以处理序列数据,如自然语言、时间序列预测等。RNN的核心特点是包含反馈连接,使得网络具有内存功能,可以在处理序列数据时保留以前的信息。这一特性使得RNN成为处理自然语言和时间序列数据的

    2024年01月16日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包