node简单处理xls、xlsx、docx文件

这篇具有很好参考价值的文章主要介绍了node简单处理xls、xlsx、docx文件。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近想爬取一些excel和word文件中的数据,于是记录下来,方便自己后面复杂粘贴,xls、xlsx、docx文件还是能处理的,但是doc文件处理不了

  1. 使用cmd

    #创建npm项目
    npm init
    #安装所需包
    npm install request --save
    npm install node-xlsx --save
    npm install adm-zip --save
    
  2. 在入口文件文章来源地址https://www.toymoban.com/news/detail-554837.html

    const xlsx = require('node-xlsx');
    const fs = require('fs');
    const path = require('path');
    const AdmZip = require('adm-zip');
    var request = require("request");
    
    
    let url = "https://xxxx.cn/442054773520384.xls";
    //创建跟该文件同级的data目路
    const dataPath = path.resolve("./data");
    
    
    getFlag(url).then(res => {
      console.log("res==" + res);
    });
    
    
    function getFlag(url) {
      return new Promise(resolve => {
        //下载文件
        getFileByUrl(url).then(filename => {
          //处理文件
          handleDocxFile(filename);
          handleExcelFile(filename);
          resolve(1);
        }, () => {
          resolve(2);
        }).catch((err) => {
          console.error(err);
          resolve(3);
        });
      })
    }
    
    
    /**
     * 下载文件
     * @param {*} url  网络文件url地址
     */
    function getFileByUrl(url) {
      return new Promise((resolve, reject) => {
        //添加文件名和后缀--start
        let fileName = "file" + new Date().getTime();
        if (url.indexOf(".docx") > -1)
          fileName += ".docx";
        else if (url.indexOf(".xls") > -1)
          fileName += ".xls";
        else if (url.indexOf(".xlsx") > -1)
          fileName += ".xlsx";
        else
          reject();
        console.log(fileName);
        //添加文件名和后缀--end
    
        //保存文件--start
        let stream = fs.createWriteStream(path.join(dataPath, fileName));
        request(url).pipe(stream).on("close", function (err) {
          if (err) {
            reject();
          }
          console.log("文件" + fileName + "下载完毕");
          resolve(fileName);
        });
        //保存文件--end
      })
    
    }
    
    
    /**
     * 处理word文件
     * @param {文件名} filename 
     */
    function handleDocxFile(filename) {
      if (filename.indexOf(".docx") != -1) {
        const filePath = path.join(dataPath, filename);
        const zip = new AdmZip(filePath); //filePath为文件路径
        const str = zip.readAsText("word/document.xml");//将document.xml读取为text内容;
        //处理该内容
        console.log(str);
        //删除文件
        fs.unlink(filePath, err => {
          if (err) console.log("删除失败");
          else console.log("删除成功");
        });
      }
    }
    
    /**
     * 处理Excel文件
     * @param {文件名} filename 
     */
    function handleExcelFile(filename) {
      if (filename.indexOf(".xls") != -1 || filename.indexOf(".xlsx") != -1) {
        const filePath = path.join(dataPath, filename);
        const sheets = xlsx.parse(filePath);
        //循环工作表
        for (let i = 0; i < sheets.length; i++) {
          let len = sheets[i].data.length;
          //循环获取每一行
          for (let j = 0; j < len; j++) {
            let row = sheets[i].data[j];
            //循环获取每个单元格
            for (let k = 0; k < row.length; k++) {
              let cell = row[k];
              //处理
              console.log(cell);
            }
          }
        }
        //删除该文件
        fs.unlink(filePath, err => {
          if (err) console.log("删除失败");
          else console.log("删除成功");
        });
      }
    }
    

到了这里,关于node简单处理xls、xlsx、docx文件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Java给文件加水印,支持.pptx,.doc,.docx,.xls,.xlsx,.pdf,.png,.jpg。

    office 相关格式文档的加密主要使用微软提供的Spire.Office for Java ,free部分有针对性每个类型的API说明和示例,请自行参考以下链接。下面也会附上我在项目中的实际工具类。 Spire.Office for Java | 专业的 Java Office 套件 | 创建、修改、转换、打印 Word/PowerPoint/PDF 文档 我的策略是

    2024年02月12日
    浏览(48)
  • Python实现将pdf,docx,xls,doc,wps,zip,xlsx,ofd链接下载并将文件保存到本地

    前言 本文是该专栏的第31篇,后面会持续分享python的各种干货知识,值得关注。 在工作上,尤其是在处理爬虫项目中,会遇到这样的需求。访问某个网页或者在采集某个页面的时候,正文部分含有docx,或pdf,或xls,或doc,或wps,或ofd,或xlsx,或zip等链接。需要你使用python自

    2024年02月17日
    浏览(48)
  • H5实现附件预览功能(doc/docx、xls/xlsx、ppt/pptx、pdf)

    一、H5用以下方式即可实现: (钉钉小程序官方目前没有预览附件的API,也可用这种方法实现) doc/docx、xls/xlsx、ppt/pptx 可直接用以下链接打开: 注意:使用此方法,附件链接必须是域名。 https://view.officeapps.live.com/op/view.aspx?src= + 文档url pdf类型附件需要另外处理 ,具体方法

    2024年02月16日
    浏览(32)
  • 在Windows和MacOS环境下实现批量doc转docx,xls转xlsx

    Python中批量进行办公文档转化是常见的操作,在windows状态下我们可以利用changeOffice这个模块很快进行批量操作。 Windows环境下,如何把doc转化为docx,xls转化为xlsx? 首先,我们要安装这个第三方模块,在cmd下输入 其次,导入这个模块 然后,要确定文件所在的位置 最后就可以

    2024年02月13日
    浏览(27)
  • uniapp 在线预览各种格式文件(支持doc, xls, ppt, pdf, docx, xlsx, pptx格式) 适用于小程序 (解决了真机调试可以打开,发布体验版打不开的问题)(可设置文件名)

    代码: 参考官方文档: uni.saveFile(OBJECT) @savefile | uni-app官网 uni-app,uniCloud,serverless https://uniapp.dcloud.net.cn/api/file/file.html#opendocument tips: 问题一: 打不开         1. 文件地址须保证能正常打开(在浏览器中尝试是否能预览或正常下载)         2.注意文件名最好为数字字母(非中文) 问题

    2024年02月05日
    浏览(49)
  • Node.js中处理特殊字符的文件名,安全稳妥的方案

    在Node.js中,通过 path 模块提供的 basename 方法,我们可以轻松地从文件路径中提取文件名。然而,这个方法在处理特殊字符时存在一些问题,因为它会对这些字符进行转义,导致在不同操作系统上的兼容性问题。在这篇文章中,我们将介绍一种安全稳妥的方法,结合使用 dir

    2024年02月04日
    浏览(27)
  • 文件格式xls和xlsx有什么区别?xlsx和xls选择哪个

    在数字时代,我们经常需要处理各种电子文件,其中xls和xlsx是两种常见的电子表格文件格式。尽管它们只有一字之差,但它们在功能、兼容性和性能等方面有着显著的区别。本文将详细解析这两种文件格式的区别,并指导您如何根据需求选择合适的格式。 XLS是Microsoft Excel的

    2024年01月24日
    浏览(43)
  • xlsx.js: 基于 JavaScript 的 Excel 文件读写库

    如果你需要在浏览器端处理 Excel 文件,那么 xlsx.js 可能是一个不错的选择。这是一个基于 JavaScript 的库,可以方便地读取、创建和修改 Excel 文件。 支持多种文件格式:.xlsx, .xlsm, .xlsb, .ods, .csv 等。 支持数据的读取和写入。 支持多种单元格样式,如字体、颜色、背景色等。

    2024年04月17日
    浏览(41)
  • Node.js -- JavaScript的运行环境

    HTML : 骨架 CSS :外观 JS : 灵魂 JavaScript可以在浏览器中被执行的原因是浏览器里面都有一个JavaScript的解析引擎 浏览器 解析引擎 Chrome V8 Firefox OdinMonkey (奥丁猴) Safri JSCore IE Chakra(查克拉) 每个浏览器都内置了DOM、BOM这样的API函数。 V8引擎负责解析和执行JavaScript代码 内置

    2023年04月10日
    浏览(27)
  • 使用JavaScript和XLSX.js将数据导出为Excel文件

    导出数据是Web应用程序中常见的功能之一。在许多情况下,我们需要将数据导出为Excel文件,以便用户可以在本地计算机上查看和编辑数据。在本篇博客中,我们将介绍如何使用JavaScript和XLSX.js将数据导出为Excel文件。 XLSX.js是一个JavaScript库,它提供了一组API,可以将数据转换

    2024年04月26日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包