C#/VB.NET:如何从 PowerPoint 演示文稿中提取文本

这篇具有很好参考价值的文章主要介绍了C#/VB.NET:如何从 PowerPoint 演示文稿中提取文本。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在学习或者日常工作中,有时我们需要把幻灯片的东西整理成文字,而从 PowerPoint 演示文稿中一张一张的整理手动复制粘贴,整个过程会非常费精力且耗时。那么怎么样才能比较轻松且快速地提取PowerPoint中的文字呢?今天这篇文章就将为你介绍如何通过编程方式提取PowerPoint中的文字,文章最后附有C#/VB.NET代码以及效果图,希望对你有所帮助。

程序环境

本次测试时,在程序中引入Free Spire.Presentation for .NET。可通过以下方法引用 Free Spire.Presentation.dll文件:

方法1:将 Free Spire.Presentation for .NET下载到本地,解压,安装。安装完成后,找到安装路径下BIN文件夹中的 Spire.Presentation.dll。然后在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径BIN文件夹下的dll文件添加引用至程序。

方法2:通过NuGet安装。可通过以下2种方法安装:

(1)可以在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理NuGet包”,然后搜索“Free Spire.Presentation”,点击“安装”。等待程序安装完成。

(2)将以下内容复制到PM控制台安装。

Install-Package FreeSpire.Presentation -Version 7.8.0

从 PowerPoint 演示文稿中提取文本

为了便于在 PowerPoint 文档中共享或传递文本信息,有时需要进行文本提取操作。以下是从所有演示文稿幻灯片中提取文本并保存在 TXT 文件中的步骤。

  • 初始化 Presentation 类的实例。
  • 使用 Presentation.LoadFromFile() 方法加载 PowerPoint 文档示例。
  • 创建 StringBuilder 实例。
  • 遍历文档中的每张幻灯片,然后遍历每张幻灯片中的所有形状。
  • 确定形状是否为 IAutoShape 类型。如果是,则遍历每个形状中的所有段落,并使用 TextParagraph.Text 属性获取段落文本。
  • 使用 StringBuilder.AppendLine() 方法将提取的文本附加到StringBuilder实例
  • 创建一个新的txt文件,并使用 File.WriteAllText() 方法将提取的文本写入该文件。

完整代码

C#

using Spire.Presentation;
using Spire.Presentation.Charts;
using Spire.Presentation.Converter.Equation.Word;
using System;
using System.IO;
using System.Text;
namespace ExtractText
{
    class Program
    {
        static void Main(string[] args)
        {
            //初始化Presentation类的实例
            Presentation presentation = new Presentation();

            //载PowerPoint文档示例
            presentation.LoadFromFile("海市蜃楼是如何形成的?.pptx");
            //创建StringBuilder实例
            StringBuilder sb = new StringBuilder();

            //遍历文档中的每张幻灯片
            foreach (ISlide slide in presentation.Slides)
            {
                //遍历每张幻灯片中的每个形状
                foreach (IShape shape in slide.Shapes)
                {
                    //检查形状是否为IAutoShape类型
                    if (shape is IAutoShape)
                    {
                        //以每种形状遍历所有段落
                        foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
                        {
                            //提取文本并保存到StringBuilder实例
                            sb.AppendLine(tp.Text);
                        }
                    }
                }
            }
            //创建一个新的txt文件以保存提取的文本
            File.WriteAllText("提取文本.txt", sb.ToString());
            presentation.Dispose();
        }
    }
}

VB.NET

Imports Spire.Presentation
Imports Spire.Presentation.Charts
Imports Spire.Presentation.Converter.Equation.Word
Imports System.IO
Imports System.Text

Namespace ExtractText
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            '初始化Presentation类的实例
            Dim presentation As Presentation = New Presentation()

            '载PowerPoint文档示例
            presentation.LoadFromFile("海市蜃楼是如何形成的?.pptx")
            '创建StringBuilder实例
            Dim sb As StringBuilder = New StringBuilder()

            '遍历文档中的每张幻灯片
            For Each slide As ISlide In presentation.Slides
                '遍历每张幻灯片中的每个形状
                For Each shape As IShape In slide.Shapes
                    '检查形状是否为IAutoShape类型
                    If TypeOf shape Is IAutoShape Then
                        '以每种形状遍历所有段落
                        For Each tp As TextParagraph In TryCast(shape, IAutoShape).TextFrame.Paragraphs
                            '提取文本并保存到StringBuilder实例
                            sb.AppendLine(tp.Text)
                        Next
                    End If
                Next
            Next
            '创建一个新的txt文件以保存提取的文本
            Call File.WriteAllText("提取文本.txt", sb.ToString())
            presentation.Dispose()
        End Sub
    End Class
End Namespace

效果图

C#/VB.NET:如何从 PowerPoint 演示文稿中提取文本

—本文完—文章来源地址https://www.toymoban.com/news/detail-463296.html

到了这里,关于C#/VB.NET:如何从 PowerPoint 演示文稿中提取文本的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Beautiful AI:演示文稿制作工具

    【产品介绍】​ 名称​              Beautiful AI​ 上线/成立时间​              Beautiful.ai是一家创立于2017年的美国创业公司。​ 具体描述              Beautiful.ai是一款基于云计算

    2024年02月08日
    浏览(43)
  • PowerPoint 演示快捷键大全

    执行的操作 按 从头开始运行演示文稿。 F5 从当前幻灯片开始放映幻灯片 Shift+F5 在 演示者视图中启动演示文稿 Alt+F5 执行下一个动画或前进到下一张幻灯片 NEnterPage down向右键向下键空格键 执行上一个动画或返回到上一张幻灯片 PPage up向左键向上键Backspace 隐藏指针和导

    2024年02月06日
    浏览(64)
  • 随手笔记——演示如何提取 ORB 特征并进行匹配

    演示如何提取 ORB 特征并进行匹配 特征点由关键点(Key-point)和描述子(Descriptor)两部分组成。 ORB 特征亦由关键点和描述子两部分组成。它的关键点称为“Oriented FAST”,是一种改进的 FAST 角点。它的描述子称为 BRIEF(Binary Robust Independent Elementary Feature)。因此,提取ORB 特征

    2024年02月16日
    浏览(38)
  • PDF控件Spire.PDF for .NET【安全】演示:使用文本或/和图像对 PDF 进行数字签名

    数字签名确保签名的文档不能被除其作者之外的任何人更改。添加签名是确保文档内容真实性的最常见方法。PDF 文档中的可视数字签名可以显示文本或图像(例如手写签名)。本文从以下三个方面介绍如何使用Spire.PDF for .NET对PDF 进行数字签名。 Spire.PDF for .NET 是一款独立

    2024年01月23日
    浏览(47)
  • 如何通过C#/VB.NET 代码调整PDF文档的页边距

    PDF边距是页面主要内容区域和页面边缘之间的距离。与Word页边距不同,PDF文档的页边距很难更改。因为Adobe没有提供操作页边距的直接方法。但是,您可以通过缩放页面内容来改变页边距。本文将介绍如何在不更改页面大小的情况下使用C#/VB.NET 代码调整PDF文档的页边距。 增

    2023年04月27日
    浏览(45)
  • c#WPF 自定义UI控件学习,vb.net界面UI美化

    最近项目中运用到了WPF处理三维软件,在C/S结构中WPF做UI还是有很多优越性,简单的学了一点WPF知识,成功的完成项目目标。项目过度阶段对于WPF的一些基本特点有了进一步了解 。至此花费一点时间研究研究WPF控件。 为以后的项目开发中提供一些可观的资源也是不错的。 目

    2024年02月20日
    浏览(49)
  • 在WPS演示中如何将文本内容设置为环形?

    当前版本:2022冬季更新12608 步骤: 选中文本框——【文本工具选项卡】——文本效果——转换——选择跟随路径中的需要的效果即可。 补充说明: 设置的文字弧形效果,根据文本框的长宽而定,可调整文本框宽度,从而改变弧形的半径大小; 文本框右侧黄色控点可调整文

    2024年02月16日
    浏览(40)
  • Word控件Spire.Doc 【图像形状】教程(1) ;如何在 Word 中插入图像(C#/VB.NET)

    Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转换和打印Word/PDF/Excel等格式文件处

    2024年02月07日
    浏览(44)
  • 【机器学习】特征工程 - 文本特征提取TfidfVectorizer

    「作者主页」: 士别三日wyx 「作者简介」: CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」: 对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 对 「文本」 进行特征提取时,一般会用 「单词」 作为特征,即特征词。

    2024年02月12日
    浏览(40)
  • 通过python如何实现视频提取音频,并将音频转文本

    大致思路: (1)使用moviepy库中的VideoFileClip类读取视频文件,并将其转换为音频文件; (2)使用pydub库中的splitonsilence函数将音频文件分割成多个音频片段,以便进行语音识别; (3)使用SpeechRecognition库中的Recognizer类进行语音识别,并将识别结果写入文本文件中 注意: 将

    2024年02月05日
    浏览(72)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包