论文解析——In-DRAM Bulk Bitwise Execution Engine

这篇具有很好参考价值的文章主要介绍了论文解析——In-DRAM Bulk Bitwise Execution Engine。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

作者及发表详情

Vivek Seshadri, Onur Mutlu. “In-DRAM Bulk Bitwise Execution Engine,” ADCOM 2020

最早发布于2019年。
论文链接

摘要

很多应用都严重依赖逐位操作计算。在已有的系统中机型批量逐位操作需要处理器在内存通道上传输大量的数据,因此需要高延迟、内存带宽和能耗。
在这篇文章中,我们介绍了Ambit,一种完全在主存中进行批量逐位操作(bulk bitwise operation)的机制,通过基于DRAM的内部的架构和模拟操作可以获得低成本、高性能和低功耗的效果。

正文

Ambit的实现目标

  • 探索在每个DRAM阵列内最大内部带宽
  • 跨DRAM整列的内存级别的并行性,使批量位操作的原始吞吐量和能源消耗提高一到两个数量级。

文章讨论主要概念

  • 由于Ambit建立在现代DRAM体系结构的基础上,研究团队提供了一个关于现代DRAM组织和操作的简要背景,这足以理解Ambit提出的机制
  • 研究团队描述了Ambit的不同组件、设计和实现方式,以及执行模型,详细地展现了host系统中Ambit
  • 大量的实验评估证明Ambit在明显的工艺变化下也能稳定工作,相比已有系统提升新跟那个和能效

DRAM硬件架构介绍

论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM

Ambit硬件架构介绍

论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM

电路级的Spice仿真

Ambit的吞吐和能耗分析

论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM

实际应用效果

论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM
论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM
论文解析——In-DRAM Bulk Bitwise Execution Engine,# 论文解析,DRAM文章来源地址https://www.toymoban.com/news/detail-796442.html

参考文献

到了这里,关于论文解析——In-DRAM Bulk Bitwise Execution Engine的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • onnx模型转engine并进行推理全过程解析

    深度学习模型在训练好以后,下一步就是部署到不同的设备进行测试,不同设备之间的转换一般可以通过中间件ONNX进行转换,以达到不同平台的通用。本文以模型转为ONNX为起点,分析介绍ONNX转为TensorRT Engine并进行推理的整个流程链路。 ONNX序列化为TRT模型的整个流程可以用

    2024年02月06日
    浏览(42)
  • OpenCV:对图像的位操作bitwise_and(与),bitwise_or(或),bitwise_not(非),bitwise_xor(异或)

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 使用opencv对图像处理时,可能需要对图像按位操作,而opencv自带位操作运算函数,不必再手写遍历算法,位操作函数包括: bitwise_and 与 bitwise_or 或 bitwise_not 非 bitwise_xor 异或 关于掩膜mask请点击查看 n

    2024年02月05日
    浏览(95)
  • opencv位运算,cv2.bitwise_and,cv2.bitwise_or,cv2.bitwise_not,cv2.bitwise_xor

    目录 与运算 或运算 非运算 异或运算 位运算完整代码          在opencv进行与运算使用cv2.bitwise_and方法 src1:参与与运算的图像 src2:用src2与src1进行与运算 dst:与输入具有相同大小和类型的输出数组 mask:可选操作掩码,8 位单通道数组,即指定要更改的输出数组的元素

    2024年02月04日
    浏览(85)
  • cv.bitwise_and用法

    cv.bitwise_and 是 OpenCV 中的一个函数,它的作用是对两幅图像进行逐位与操作。 使用方法如下: cv.bitwise_and(src1, src2[, dst[, mask]]) → dst src1 和 src2 是输入图像,它们必须具有相同的尺寸和类型。dst 是输出图像,它也必须具有与 src1 和 src2 相同的尺寸和类型。mask 是一个可选的掩

    2024年02月13日
    浏览(44)
  • 位运算bitwise_and函数

    今天在学习opencv时,把OpenCV 的标志放到另一幅图像上。这时要用到cv2.bitwise_and函数,加下来从原理和效果讲一下这个函数。 目标:将下面这个logo加到蚂蚁图像的左上角并且背景无遮挡(logo图片白的部分不遮挡蚂蚁图片蓝的地方)。 效果: 下面直接上代码,根据代码讲解原理

    2024年02月04日
    浏览(57)
  • 【DRAM存储器六】DRAM存储器的架构演进-part3

    👉个人主页:highman110 👉作者简介:一名硬件工程师,持续学习,不断记录,保持思考,输出干货内容  参考书籍:《Memory Systems - Cache, DRAM, Disk》      目录

    2024年02月08日
    浏览(38)
  • 【DRAM存储器五】DRAM存储器的架构演进-part2

    👉个人主页:highman110 👉作者简介:一名硬件工程师,持续学习,不断记录,保持思考,输出干货内容  参考书籍:《Memory Systems - Cache, DRAM, Disk》      目录

    2024年02月07日
    浏览(41)
  • django 批量创建bulk_create和批量更新bulk_update

    以创建1万个对象为例,相比save() 循环和save() 事务,bulk_效率是save()循环保存的百倍,是事务处理的近10倍: 用法: 用法:

    2024年02月11日
    浏览(47)
  • elasticsearch bulk 批量操作

    bulk 请求体如下: { action: { metadata }}n { request body }n { action: { metadata }}n { request body }n 测试索引示例 PUT batch_test { “mappings”: { “properties”: { “id”:{ “type”: “keyword” }, “name”:{ “type”: “text” }, “age”:{ “type”: “integer” } } } } 测试原始数据 PUT /_bulk {“index”:{“_i

    2024年02月07日
    浏览(42)
  • FPGA | BRAM和DRAM

    Block ram 由一定数量固定大小的存储块构成的,使用 BLOCK RAM 资源不占用额外的逻辑资源,并且速度快。 但是 使用的时候消耗的 BLOCK RAM 资源是其块大小的整数倍 。如 Xilinx公司的结构中每个 BRAM 有 36Kbit 的容量,既可以作为一个 36Kbit 的存储器使用,也可以拆分为两个独立的

    2024年02月12日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包