记录--产品:请给我实现一个在web端截屏的功能!

这篇具有很好参考价值的文章主要介绍了记录--产品:请给我实现一个在web端截屏的功能!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助

记录--产品:请给我实现一个在web端截屏的功能!

一、故事的开始

最近产品又开始整活了,本来是毫无压力的一周,可以小摸一下鱼的,但是突然有一天跟我说要做一个在网页端截屏的功能。

作为一个工作多年的前端,早已学会了尽可能避开麻烦的需求,只做增删改查就行!

我立马开始了我的反驳,我的理由是市面上截屏的工具有很多的,微信截图、Snipaste都可以做到的,自己实现的话,一是比较麻烦,而是性能也不会很好,没有必要,把更多的时间放在核心业务更合理!

结果产品跟我说因为公司内部有个可以用来解析图片,生成文本OCR的算法模型,web端需要支持截取网页中部分然后交给模型去训练,微信以及其他的截图工具虽然可以截图,但需要先保存到本地,再上传给模型才行。

网页端支持截图后可以在在截屏的同时直接上传给模型,减少中间过程,提升业务效率。

我一听这产品小嘴巴巴的说的还挺有道理,没有办法,只能接了这个需求,从此命运的齿轮开始转动,开始了我漫长而又曲折的思考。

二、我的思考

在实现任何需求的时候,我都会在自己的脑子中大概思考一下,评估一下它的难度如何。我发现web端常见的需求是在一张图片上截图,这个还是比较容易的,只需要准备一个canvas,然后利用canvas的方法 drawImage就可以截取这个图片的某个部分了。

示例如下:

<!DOCTYPE html>
<html>
<head>
    <title>截取图片部分示例</title>
</head>
<body>
    <canvas id="myCanvas" width="400" height="400"></canvas>
    <br>
    <button onclick="cropImage()">截取图片部分</button>
    <br>
    <img id="croppedImage" alt="截取的图片部分">
    <br>

    <script>
        function cropImage() {
            var canvas = document.getElementById('myCanvas');
            var ctx = canvas.getContext('2d');
            var image = new Image();

            image.onload = function () {
                // 在canvas上绘制整张图片
                ctx.drawImage(image, 0, 0, canvas.width, canvas.height);

                // 截取图片的一部分,这里示例截取左上角的100x100像素区域
                var startX = 0;
                var startY = 0;
                var width = 100;
                var height = 100;
                var croppedData = ctx.getImageData(startX, startY, width, height);

                // 创建一个新的canvas用于显示截取的部分
                var croppedCanvas = document.createElement('canvas');
                croppedCanvas.width = width;
                croppedCanvas.height = height;
                var croppedCtx = croppedCanvas.getContext('2d');
                croppedCtx.putImageData(croppedData, 0, 0);

                // 将截取的部分显示在页面上
                var croppedImage = document.getElementById('croppedImage');
                croppedImage.src = croppedCanvas.toDataURL();
            };

            // 设置要加载的图片
            image.src = 'your_image.jpg'; // 替换成你要截取的图片的路径
        }
    </script>
</body>
</html>

一、获取像素的思路

但是目前的这个需求远不止这样简单,因为它的对象是整个document,需要在整个document上截取一部分,我思考了一下,其实假设如果浏览器为我们提供了一个api,能够获取到某个位置的像素信息就好了,这样我将选定的某个区域的每个像素信息获取到,然后在一个像素一个像素绘制到canvas上就好了。

我本以为我发现了一个很好的方法,可遗憾的是经过调研浏览器并没有为我们提供类似获取某个位置像素信息的API。

唯一为我们提供获取像素信息的是canvas的这个API。

<!DOCTYPE html>
<html>
<head>
    <title>获取特定像素信息示例</title>
</head>
<body>
    <canvas id="myCanvas" width="400" height="400"></canvas>
    <br>
    <button onclick="getPixelInfo()">获取特定像素信息</button>
    <br>
    <div id="pixelInfo"></div>

    <script>
        function getPixelInfo() {
            var canvas = document.getElementById('myCanvas');
            var ctx = canvas.getContext('2d');

            // 绘制一些内容到canvas
            ctx.fillStyle = 'red';
            ctx.fillRect(50, 50, 100, 100);

            // 获取特定位置的像素信息
            var x = 75; // 替换为你想要获取的像素的x坐标
            var y = 75; // 替换为你想要获取的像素的y坐标
            var pixelData = ctx.getImageData(x, y, 1, 1).data;

            // 提取像素的颜色信息
            var red = pixelData[0];
            var green = pixelData[1];
            var blue = pixelData[2];
            var alpha = pixelData[3];

            // 将信息显示在页面上
            var pixelInfo = document.getElementById('pixelInfo');
            pixelInfo.innerHTML = '在位置 (' + x + ', ' + y + ') 的像素信息:<br>';
            pixelInfo.innerHTML += '红色 (R): ' + red + '<br>';
            pixelInfo.innerHTML += '绿色 (G): ' + green + '<br>';
            pixelInfo.innerHTML += '蓝色 (B): ' + blue + '<br>';
            pixelInfo.innerHTML += 'Alpha (透明度): ' + alpha + '<br>';
        }
    </script>
</body>
</html>

浏览器之所以没有为我们提供相应的API获取像素信息,停下来想想也是有道理的,甚至是必要的,因为假设浏览器为我们提供了这个API,那么恶意程序就可以通过这个API,不断的获取你的浏览器页面像素信息,然后全部绘制出来。一旦你的浏览器运行这个段恶意程序,那么你在浏览器干的什么,它会一览无余,相当于在网络的世界里裸奔,毫无隐私可言。

二、把DOM图片化

既然不能走捷径直接拿取像素信息,那就得老老实实的把document转换为图片,然后调用canvas的drawImage这个方法来截取图片了。

在前端领域其实99%的业务场景早已被之前的大佬们都实现过了,相应的轮子也很多。我问了一下chatGPT,它立马给我推荐了大名鼎鼎的html2canvas,这个库能够很好的将任意的dom转化为canvas。这个是它的官网。

我会心一笑,因为这不就直接能够实现需求了,很容易就可以写出下面的代码了:

html2canvas(document.body).then(function(canvas) {
    // 将 Canvas 转换为图片数据URL
    var src = canvas.toDataURL("image/png");
    var image = new Image();
    image.src = src;
    image.onload = ()=>{
       const canvas = document.createElement("canvas")
       const ctx = canvas.getContext("2d");
       const width = 100;
       const height = 100;
       canvas.width = width;
       canvas.height = height;
       // 截取以(10,10)为顶点,长为100,宽为100的区域
       ctx.drawImage(image, 10, 10, width, height , 0 , 0 ,width , height);
    }
});

上面这段代码就可以实现截取document的特定的某个区域,需求已经实现了,但是我看了一下这个html2canvas库的资源发现并没有那么简单,有两个点并不满足我希望实现的点:

1.大小

当我们将html2canvas引入我们的项目的时候,即便压缩过后,它的资源也有近200kb:

记录--产品:请给我实现一个在web端截屏的功能!

要知道整个react和react-dom的包压缩过后也才不到150kb,因此在项目只为了一个单一的功能引入一个复杂的资源可能并不划算,引入一个复杂度高的包一个是它会增加构建的时间,另一方面也会增加打包之后的体积。

如果是普通的web工程可能情有可原,但是因为我会将这需求做到插件当中,插件和普通的web不一样的一点,就是web工程如果更新之后,客户端是自动更新的。但是插件如果更新了,需要客户端手动的下载插件包,然后再在浏览器安装,因此包的大小尽可能小才好,如果一个插件好几十MB的话,那客户端肯定烦死了。

2.性能

作为业内知名的html2canvas库,性能方面表现如何呢?

我们可以看看它的原理,一个dom结构是如何变成一个canvas的呢!

它的源码在这里:核心的实现是canvas-renderer.ts这个文件。

当html2canvas拿到dom结构之后,首先为了避免副作用给原dom造成了影响,它会克隆一份全新的dom,然后遍历DOM的每一个节点,将其扁平化,这个过程中会收集每个节点的样式信息,尤其是在界面上的布局的几何信息,存入一个栈中。

然后再遍历栈中的每一个节点进行绘制,根据之前收集的样式信息进行绘制,就这样一点点的绘制到提前准备的和传入dom同样大小的canvas当中,由于针对很多特殊的元素,都需要处理它的绘制逻辑,比如iframe、input、img、svg等等。所以整个代码就比较多,自然大小就比较大了。

整个过程其实需要至少3次对整个dom树的遍历才可以绘制出来一个canvas的实例。

这个就是这个绘制类的主要实现方法:

记录--产品:请给我实现一个在web端截屏的功能!

可以看到,它需要考虑的因素确实特别多,类似写这个浏览器的绘制引擎一样,特别复杂。

要想解决以上的大小的瓶颈。

第一个方案就是可以将这个资源动态加载,但是一旦动态加载就不能够在离线的环境下使用,在产品层面是不能接受的,因为大家可以想一想如果微信截图的功能在没有网络的时候就使用不了,这个肯定不正常,一般具备工具属性的功能应该尽可能可以做到离线使用,这样才好。

因此相关的代码资源不能够动态加载。

dom-to-image

正当我不知道如何解决的时候,我发现另外了一个库dom-to-image,我发现它打包后的大小只有10kb左右,这其实已经一个很可以接受的体积了。这个是它的github主页。好奇的我想知道它是怎么做到只有这么小的体积就能够实现和html2canvas几乎同样的功能的呢?于是我就研究了一下它的实现。

dom-to-image的实现利用了一个非常灵活的特性--image可以渲染svg

我们可以复习一下img标签的src可以接受什么样的类型:这里是mdn的说明文档:

可以接受的格式要求是:

  • APNG(动态可移植网络图形)——无损动画序列的不错选择(GIF 性能较差)。
  • AVIF(AV1 图像文件格式)——静态图像或动画的不错选择,其性能较好。
  • GIF(图像互换格式)——简单图像和动画的不错选择。
  • JPEG(联合图像专家组)——有损压缩静态图像的不错选择(目前最流行的格式)。
  • PNG(便携式网络图形)——对于无损压缩静态图像而言是不错的选择(质量略好于 JPEG)。
  • SVG(可缩放矢量图形)——矢量图像格式。用于必须以不同尺寸准确描绘的图像。
  • WebP(网络图片格式)——图像和动画的绝佳选择。

如果我们使用svg格式来渲染图片就可以是这样的方式:

<!DOCTYPE html>
<html>
<head>
    <title>渲染SVG</title>
</head>
<body>
    <h1>SVG示例</h1>
    <img src="example.svg" alt="SVG示例">
</body>
</html>
但是也可以是这样的方式:
<!DOCTYPE html>
<html>
<head>
    <title>渲染SVG字符串</title>
</head>
<body>
    <div id="svg-container">
        <!-- 这里是将SVG内容渲染到<img>标签中 -->
        <img id="svg-image" src="data:image/svg+xml, <svg xmlns='http://www.w3.org/2000/svg' width='100' height='100'><circle cx='50' cy='50' r='40' stroke='black' stroke-width='2' fill='red' /></svg>" alt="SVG图像">
    </div>
</body>
</html>

把svg的标签序列化之后直接放在src属性上,image也是可以成功解析的,只不过我们需要添加一个头部:data:image/svg+xml,

令人兴奋的是,svg并不是只支持svg语法,也支持将其他的xml类型的语法比如html嵌入在其中。antv的x6组件中有非常多这样的应用例子,我给大家截图看一下:

记录--产品:请给我实现一个在web端截屏的功能!

 在svg中可以通过foreignObject这个标签来嵌套一些其他的xml语法,比如html等,有了这一特性,我们就可以把上面的例子改造一下:

<!DOCTYPE html>
<html>
<head>
    <title>渲染SVG字符串</title>
</head>
<body>
    <div id="svg-container">
        <!-- 这里是将SVG内容渲染到<img>标签中 -->
        <img 
          id="svg-image" 
          src="data:image/svg+xml, <svg xmlns='http://www.w3.org/2000/svg' width='100' height='100'><circle cx='50' cy='50' r='40' stroke='black' stroke-width='2' fill='red' /><foreignObject>{ 中间可以放 dom序列化后的结果呀 }</foreignObject></svg>" 
          alt="SVG图像"
        >
    </div>
</body>
</html>
所以我们可以将dom序列化后的结构插到svg中,这不就天然的形成了一种dom->image的效果么?下面是演示的效果:
<!DOCTYPE html>
<html>
  <head>
    <title>渲染SVG字符串</title>
  </head>
  <body>
    <div id="render" style="width: 100px; height: 100px; background: red"></div>
    <br />
    <div id="svg-container">
      <!-- 这里是将SVG内容渲染到<img>标签中 -->
      <img id="svg-image" alt="SVG图像" />
    </div>

    <script>
      const perfix =
        "data:image/svg+xml;charset=utf-8,<svg xmlns='http://www.w3.org/2000/svg' width='100' height='100'><foreignObject x='0' y='0' width='100%' height='100%'>";
      const surfix = "</foreignObject></svg>";

      const render = document.getElementById("render");

      render.setAttribute("xmlns", "http://www.w3.org/1999/xhtml");

      const string = new XMLSerializer()
        .serializeToString(render)
        .replace(/#/g, "%23")
        .replace(/\n/g, "%0A");

      const image = document.getElementById("svg-image");

      const src = perfix + string + surfix;

      console.log(src);

      image.src = src;
    </script>
  </body>
</html>

记录--产品:请给我实现一个在web端截屏的功能!

如果你将这个字符串直接通过浏览器打开,也是可以的,说明浏览器可以直接识别这种形式的媒体资源正确解析对应的资源:

data:image/svg+xml;charset=utf-8,<svg xmlns='http://www.w3.org/2000/svg' width='100' height='100'><foreignObject x='0' y='0' width='100%' height='100%'><div id="render" style="width: 100px; height: 100px; background: red" xmlns="http://www.w3.org/1999/xhtml"></div></foreignObject></svg>

实不相瞒这个就是dom-to-image的核心原理,性能肯定是不错的,因为它是调用浏览器底层的渲染器。

通过这个dom-to-image我们可以很好的解决资源大小性能这两个瓶颈的点。

三、优化

这个库打包后的产物是umd规范的,并且是统一暴露出来的全局变量,因此不支持treeshaking。

记录--产品:请给我实现一个在web端截屏的功能!

但是很多方法比如toJpeg、toBlob、等方法我们其实都用不到,所以打包了很多我们不需要的产物,于是其实我们可以把核心的实现自己写一遍,使用1-2kb的空间就可以做到这一点。

经过以上的思考我们就可以基本上确定方案了:

基于dom-to-image的原理,实现一个简易的my-dom-to-image,大约只需要100行代码左右就可以做到。

然后将document.body转化为image,再从这个image中截取特定的部分。

记录--产品:请给我实现一个在web端截屏的功能!

好了,以上就是我关于这个需求的一些思考,如果掘友也有一些其他非常有意思的需求,欢迎评论区讨论我们一起头脑风暴啊!!!

利用插件

其实针对截屏,如果只用纯web技术,确实有点麻烦,但是如果说我们利用插件去做就非常简单了,我们只需要借助一个API就可以获取一个tab的截屏数据。

chrome.tabs.captureVisibleTab(
  windowId, 
  { format: 'png' }
, function(dataUrl) { 
  const img = new Image(); 
  img.src = dataUrl; // 将图像添加到页面或进行其他操作  
  document.body.appendChild(img);
});

所以说如果你有精力,可以和你的产品商量一下能不能把这个需求做到一个插件里面,你可以开发一个插件去做这件事情。不必担心不懂插件相关的技术,因为我已经帮你写了一个插件专栏,点击这里查看。里面有插件开发入门的大部分内容,快来看看吧!

四、维护 -- 这个内容非重点,可以跳过

9.13日更

文章发布后,针对这个需求有很多掘友提出了新的想法和思路,给思考的掘友们点赞(๑•̀ㅂ•́)و✧,我大概整理一下评论区的方案:

有一位掘友提到了一个库 rasterizeHTML.js。

记录--产品:请给我实现一个在web端截屏的功能!

 从名字来看是想要栅格化HTML,通俗来讲把HTML画出来的意思,我以前还真不知道还有这个库,学习了,他的核心源码就是下面这一段:

记录--产品:请给我实现一个在web端截屏的功能!

说白了,还是一样,利用svg可以包含html的特点去做的,和dom-to-image的思想差不多。

另外一位掘友提到了一个API:navigator.mediaDevices.getDisplayMedia,我大概试了一下,应该是不满足需求的,因为这个API的调用必须需要用户手动赋予许可才可以,你一调用它,就会弹出赋予权限的提示框,就像下面这样:

记录--产品:请给我实现一个在web端截屏的功能!

即便用户同意了,可以得到一个MediaStream被称为媒体流的对象,但是这个对象内部肯定封装了屏幕的像素信息,但是压根没把这个东西暴露给用户,反正我找遍了它的几乎所有属性,没看到它把像素信息暴露出来了。它是方便用户直接在video上使用而设计的。可以用它来做类似屏幕共享的功能。

但是既然已经将像素绘制到了video上实际上就可以将其转化为canvas,我们可以像下面这样的方式去做:

<!DOCTYPE html>
<html lang="en">
  <head>
    <meta charset="UTF-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <title>共享屏幕</title>
    <style>
      .animated-box {
        width: 100px;
        height: 100px;
        background-color: #3498db;
        position: relative;
        animation-name: slideIn;
        animation-duration: 2s; /* 动画持续时间 */
        animation-timing-function: ease; /* 动画时间函数 */
        animation-fill-mode: forwards; /* 动画结束后保持最终状态 */
        animation-iteration-count: infinite;
      }

      /* 定义动画关键帧 */
      @keyframes slideIn {
        0% {
          left: 100px; /* 起始位置 -100px 左侧 */
        }
        50% {
          left: 0; /* 结束位置 0 左侧 */
        }

        100% {
          left: 100px;
        }
      }
    </style>
  </head>
  <body>
    <div class="animated-box"></div>

    <button onclick="share()">share</button>
    <video src="" id="video" width="640" height="360" controls></video>
    <canvas id="canvasElement" width="640" height="360"></canvas>
    <script>
      let tracks;
      function share() {
        try {
          navigator.mediaDevices
            .getDisplayMedia({ video: true })
            .then((mediaStream) => {
              const videoElement = document.getElementById("video");
              const canvasElement = document.getElementById("canvasElement");

              videoElement.srcObject = mediaStream;

              const ctx = canvasElement.getContext("2d");

              // 在每个AnimationFrame绘制视频帧
              function drawFrame() {
                ctx.drawImage(
                  videoElement,
                  0,
                  0,
                  canvasElement.width,
                  canvasElement.height
                );
                const imageData = ctx.getImageData(
                  0,
                  0,
                  canvasElement.width,
                  canvasElement.height
                );

                // 在 imageData 中获取像素信息
                // imageData.data 包含了每个像素的RGBA数据
                // 您可以处理这些数据以获取所需的信息
                // 例如,获取特定坐标的像素颜色值:imageData.data[(y * imageData.width + x) * 4]

                console.log(imageData);

                requestAnimationFrame(drawFrame);
              }

              // 启动绘制循环
              requestAnimationFrame(drawFrame);
            });
        } catch (e) {
          console.log("Unable to acquire screen capture: " + e);
        }
      }
    </script>
  </body>
</html>
演示效果:

记录--产品:请给我实现一个在web端截屏的功能!

本文转载于:

https://juejin.cn/post/7276694924137463842

如果对您有所帮助,欢迎您点个关注,我会定时更新技术文档,大家一起讨论学习,一起进步。

 记录--产品:请给我实现一个在web端截屏的功能!文章来源地址https://www.toymoban.com/news/detail-746224.html

到了这里,关于记录--产品:请给我实现一个在web端截屏的功能!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 前端js如何实现截屏功能,插件推荐js-web-screen-shot

    读取dom结构转换成canvas,最后转成图片形式展示 缺点 :没有编辑功能 链接:html2canvas 大佬模仿qq截图实现的,也可以搭配webrtc实现web端远程桌面共享 链接: github gitee 简单使用 注意点:

    2024年02月06日
    浏览(43)
  • CTO:给我一个SpringBoot实现MySQL百万级数据量导出并避免OOM的解决方案

    动态数据导出是一般项目都会涉及到的功能。它的基本实现逻辑就是从mysql查询数据,加载到内存,然后从内存创建excel或者csv,以流的形式响应给前端。 参考:https://grokonez.com/spring-framework/spring-boot/excel-file-download-from-springboot-restapi-apache-poi-mysql。 SpringBoot下载excel基本都是这

    2023年04月13日
    浏览(48)
  • 初级 - 如何搭建一个Java Web项目 - 记录

    Intellij IDEA 一般可以通过两种方式创建 Spring Boot 项目: 使用 Maven 创建 使用 Spring Initializr 创建 Tips: 标题选项后的 感叹号 ! 的是重点配置 这里笔者选择的是 2.x 版本的 Spring Boot,不勾选 Download pre-built … 1. 取消download pre-built shared indexes自动下载 Developer Tools 选项 ! 1. Spring

    2024年02月07日
    浏览(46)
  • Python爬虫:给我一个链接,西瓜视频随便下载

    1.实现原理 首先,我们需要来到西瓜视频的官网,链接为:西瓜视频,随便点击其中一个视频进入,点击电脑键盘的F12来到开发者模式,按ctrl+F进行搜索,输入video,如下: 我们可以发现,这里有一个视频链接,我们点击这个链接进入,依旧按电脑F12键来到开发者模式,继续

    2024年02月14日
    浏览(78)
  • 让chatGPT给我写一个CSS,我太蠢了

    CSS这东西,让AI写的确有点难度,毕竟它写出来的东西,没办法直接预览,这是其次。重要的是CSS这东西怎么描述,不好描述啊,比如我让他给我制作一个这样的效果出来,没办法描述,所以最终失败了! 想要一个像上图一样的红色标签 提问 回答 以下是使用 CSS 画一个正方

    2024年02月03日
    浏览(46)
  • 我有一个朋友,分享给我的字节跳动测试开发真题

    朋友入职已经两周了,整体工作环境还是非常满意的!所以这次特意抽空给我写出了这份面试题,而我把它分享给小伙伴们,面试入职的经验! 大概是在3月中的时候他告诉我投递了简历,5月的时候经过了3轮面试收获了Offer,当时也参考了很多牛客网站上大佬的面经。 今天来

    2024年02月06日
    浏览(46)
  • 基于Web的农产品直卖平台的设计与实现论文

    收藏关注不迷路 农产品直卖平台管理数据的工具是MySQL,编码的语言是Java,运用的框架是Spring Boot框架。该系统可以实现商家信用类型管理,农产品信息管理,农产品评价管理,商家管理,农产品订单管理,公告信息管理,用户管理等功能。 农产品直卖平台不仅能让操作人员

    2024年02月21日
    浏览(37)
  • 怎样正确做 Web 应用的压力测试?字节8年测试5个步骤给我看师了

    Web应用,通俗来讲就是一个网站,主要依托于浏览器来访问其功能。 那怎么正确做网站的压力测试呢? 提到压力测试,我们想到的是服务端压力测试,其实这是片面的, 完整的压力测试包含服务端压力测试和前端压力测试 。 为了让大家看完文章后,更有获得感,本文将从

    2024年02月09日
    浏览(32)
  • 截屏插件 js-web-screen-shot(Vue 、html)

    最近有个需求是需要再页面上截屏并上传的,于是找到了这个插件【js-web-screen-shot】 先在package.json中添加这个 然后 npm install 然后在对应页面的vue文件的 script 中 import 接下就可以使用了; 使用方式大概就是 定义一个按钮,来触发构建该插件对象(也可以用其他方式) 然后就

    2024年02月12日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包