毕业设计：基于卷积神经网络的古诗词生成系统人工智能-Toy模板网

这篇具有很好参考价值的文章主要介绍了毕业设计：基于卷积神经网络的古诗词生成系统人工智能。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

设计思路

一、课题背景与意义

二、算法理论原理

2.1 深度学习

2.2 神经网络

三、检测的实现

3.1 数据集

3.2 实验环境搭建

3.3 模型训练

最后

前言

📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

🚀对毕设有任何疑问都可以问学长哦!

选题指导:

最新最全计算机专业毕设选题精选推荐汇总

大家好,这里是海浪学长毕设专题,本次分享的课题是

🎯基于卷积神经网络的古诗词生成系统

设计思路

一、课题背景与意义

古诗作为中华文化的重要组成部分，传统的古诗创作需要高水平的文学素养和诗词鉴赏能力。然而，随着人工智能技术的发展，利用自然语言处理和生成模型如BERT等，可以开发出能够自动生成符合古诗规律和风格的诗句的古诗生成器。这样的生成器可以为创作者提供创作灵感和辅助工具，帮助普通读者欣赏和接触古诗，促进古诗的传承和传播，以及在教育领域辅助教师进行古诗教学。

二、算法理论原理

2.1 深度学习

BERT模型在古诗生成系统中通过丰富的上下文理解能力和长距离依赖建模，能够生成准确、流畅的古诗作品。同时，BERT模型的多样性和创新性使得生成的古诗更具个性和创意，满足不同用户的需求和口味。此外，它还推动了文学研究领域的发展，通过生成大量的古诗作品，为文学特征和演变的分析提供支持，加深了对古代文学的理解。综上所述，BERT模型的应用为古诗创作和文学研究带来了新的可能性和进展。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

BERT模型可以使用两种策略来应对不同的任务和应用场景：

Fine-tuning（微调）策略：首先使用大规模无监督的预训练数据对BERT模型进行预训练，学习通用的语言表示。然后，将预训练的BERT模型用于特定任务时，通过在少量标注数据上进行有监督的微调，将模型参数调整到与特定任务相关的特征上。这种策略适用于各种自然语言处理任务，如文本分类、命名实体识别、情感分析等。通过微调，BERT模型可以适应不同任务的特定特征和语境。
Feature-based（基于特征）策略：在某些场景下，微调整个BERT模型的代价较高，或者只希望利用BERT模型的表示能力而不改变模型架构。在这种情况下，可以使用基于特征的策略。该策略通过在预训练的BERT模型之上构建新的模型，将BERT的输出作为输入特征，并在其基础上进行后续的任务建模和训练。例如，可以将BERT的输出作为输入，连接到一个全连接层或其他特定任务的模块，然后进行目标任务的训练和推断。这种策略在需要灵活调整模型结构或在计算资源有限的情况下很有用。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

2.2 神经网络

卷积神经网络（CNN）在古诗生成系统能够通过层级特征提取捕捉古诗的字、词、句子结构和模式，生成准确而富有语言感的古诗作品。CNN的并行计算能力使得处理大规模数据更加高效，提高了生成速度和实时性。其局部感知能力帮助理解古诗中字、词之间的依赖关系和语义规律，生成连贯自然的古诗。数据共享和参数共享机制减少了过拟合风险，提高了模型的泛化能力。此外，CNN的可解释性使得开发者和研究人员能够理解和优化模型的行为。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

LSTM（长短期记忆网络）在古诗生成系统中具有显著的优势。其主要优点包括：

对长距离依赖关系的建模能力，使得LSTM能够捕捉古诗中的上下文信息，生成具有连贯性和一致性的古诗作品；
对输入文本的序列特征进行建模，有助于理解和学习古诗中的节奏、韵律和语言结构，生成更加韵味悠长的古诗；
具有记忆单元和遗忘门机制，可以有效地处理输入序列的长期依赖和信息传递，帮助LSTM模型更好地捕捉古诗中的语义和情感；
能够适应不同长度的输入序列，使得LSTM在处理古诗生成任务时更具灵活性和适应性。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

三、检测的实现

3.1 数据集

为了解决低频词在训练集中的不足，采用了基于词向量相似度的方法来扩展训练集。对于高频词，直接选取含有该词的古诗四联句作为标签；对于低频词，通过计算词向量相似度，选取与该词最相似的一组词作为标签。此外，为了确定每个关键词应匹配的标签数量，提出了一种选取阈值的方法。该方法旨在尽可能扩展低频词的相关诗句，并提高低频词与簇生词之间的相似度。

通过构建句关键词数据集，利用词向量相似度来扩展训练集，对高频词直接选取含有该词的古诗四联句作为标签，对低频词通过计算词向量相似度选取与该词最相似的一组词作为标签。同时，提出了一种选取阈值的方法来确定每个关键词应匹配的标签数量，以尽可能扩展低频词的相关诗句并提高低频词与簇生词之间的相似度。这样的模型能够生成更准确、连贯的古诗四联句，并考虑了词语的上下文信息和语义相似度。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

import imgaug.augmenters as iaa
import cv2
import os

# 图像增强器
augmenter = iaa.Sequential([
    iaa.Fliplr(0.5),  # 左右翻转概率为0.5
    iaa.Affine(rotate=(-45, 45)),  # 旋转角度范围为-45到45度
    iaa.Resize({"height": 300, "width": 300}) # 缩放图像到300x300像素
])

# 图像增强函数
def augment_image(image):
    augmented_image = augmenter.augment_image(image)
    return augmented_image

# 数据集路径import gensim
from sklearn.metrics.pairwise import cosine_similarity

# 加载预训练的词向量模型
word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('word2vec_model.bin', binary=True)

# 定义训练集中的低频词
low_frequency_words = ['低频词1', '低频词2', '低频词3']

# 定义阈值，用于确定每个关键词应匹配的标签数量
threshold = 0.8

# 扩展训练集中的低频词
expanded_train_data = []

for word in low_frequency_words:
    # 计算低频词与训练集中所有词的相似度
    similarities = word2vec_model.similarity(word, train_data)

    # 根据相似度选择与低频词最相似的一组词作为标签
    similar_words = [train_data[i] for i in range(len(train_data)) if similarities[i] > threshold]

    # 将低频词和其对应的标签添加到扩展后的训练集中
    expanded_train_data.append((word, similar_words))

# 打印扩展后的训练集
for word, labels in expanded_train_data:
    print('Word:', word)
    print('Labels:', labels)
    print('----------------------')
dataset_path = "/path/to/dataset"

# 遍历数据集图像文件
for filename in os.listdir(dataset_path):
    if filename.endswith(".jpg"):
        image_path = os.path.join(dataset_path, filename)
        
        # 读取图像
        image = cv2.imread(image_path)
        
        # 进行图像增强
        augmented_image = augment_image(image)
        
        # 保存增强后的图像
        augmented_image_path = os.path.join(dataset_path, "augmented_" + filename)
        cv2.imwrite(augmented_image_path, augmented_image)

3.2 实验环境搭建

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络

3.3 模型训练

提出了一种改进的Seq2Seq模型，用于生成中文古典诗词。传统的Seq2Seq模型在处理古诗任务时存在连贯性问题，但改进后的模型通过引入注意力机制和一维卷积神经网络，解决了这个问题。模型采用了Transformer的自注意力机制来提取序列特征，并且能够并行训练以提高效率。最终，该模型能够生成具有较好连贯性的古诗词序列。

使用了标注的豪放派七言绝句古诗数据集（2509首）和婉约派七言绝句数据集（3091首）作为训练数据。训练集和验证集按照7:3的比例进行划分。词向量选用了BERT模型训练的200维词向量，自注意力机制使用了4个头，隐层维度为256维，前馈网络维度为128维。编码器模块堆叠了3层，解码器的参数与编码器一致。损失函数采用了交叉熵损失（categorical_crossentropy），输入尺寸的batch_size为64，训练轮数为50。

diy 古诗词生成模型 csdn,深度学习毕业设计,人工智能,cnn,毕业设计,毕设,深度学习,python,神经网络