论文笔记 CPU Accounting for Multicore Processors

这篇具有很好参考价值的文章主要介绍了论文笔记 CPU Accounting for Multicore Processors。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Abstract

  • 确定了对CPU utilization的不准确测量是如何影响OS的几个关键方面的
  • 这篇文章提出来了一个比CPU utilization更准确的性能评估指标

In this paper, we identify how an inaccurate measurement of the CPU utilization affects several key aspects of the system such as OS statistics or the charging mechanism in data centers.

We propose a new hardware CPU accounting mechanism to improve the accuracy when measuring the CPU utilization in CMPs and compare it with the previous accounting mechanisms.

Question

论文笔记 CPU Accounting for Multicore Processors,System学习笔记,论文阅读

作者在后文中举例:在锁定一个固定的,排除了 “OS noise” 的核上运行SPEC CPU 2,000 benchmark 171.swim, it completes its execution in 117 seconds. when swim runs together with other applications in the same core, its real execution time increases up to 4x due to task switches forced by the OS. (cache data eviction or process switch)

所以似乎是指对于一个固定的计算系统对于同一workload所花的计算时间大致相同。

论文笔记 CPU Accounting for Multicore Processors,System学习笔记,论文阅读

这个是啥

Tricks

  • We move all the OS activity to the first core, leaving the other cores as isolated as possible from “OS noise.”

Points

  • processors with shared on-chip resources, such as CMPs 会因为其他正在运行的任务而导致不同的性能、时间和方差
  • processors with shared on-chip resources, such as CMPs 由于空间上的cache共享而使得 the time spent running on the CPU 这种衡量方式不准确

QA

  1. What is the CPU Accounting Problem they are addressing?

The Classical Approach(CA) has been proved to work well for single-threaded uniprocessor and SMP systems, as the amount of hardware resources spatially shared is limited.
However, processors with shared on-chip resources, such as CMPs , make CPU accounting more complex because the progress of an application depends on the activity of the other applications running at the same time.
The inaccuracy measuring per-task CPU utilization may affect several key components of a computing system, such as several commonly used programs (i.e., top or time) which may not properly account applications’ progress. Finally, CPU accounting can be also used in data centers to charge users (together with other factor such as used amount of memory, disk space, I/O activity, etc.), according to their effective use of the system.

  • CPU utilization 在衡量single-threaded uniprocessor and SMP systems性能时表现良好,因为硬件资源在空间上的分享比较有限
  • 但它在衡量 共享片上资源 的CPU时就会存在误差
  • 这一误差会导致很多工具包括基础软件和计费工具不准确

论文笔记 CPU Accounting for Multicore Processors,System学习笔记,论文阅读
比如说我这个CPU,可以看到时6个core但是有12个逻辑处理器。

逻辑处理器指的就是支持 超线程 技术的处理器在一个单核心的CPU内,利用其中空闲的执行单元,模拟出另外一个核心,使整个CPU有两个逻辑核心,从而提高整个CPU的 工作效率 。

超线程技术应用的场景下,CPU utilization会导致偏差。一个计算负载,在其他正在运行的进程不同的情况下,也会出现CPU utilization不同的情况。

  1. What is their solution? Software? Hardware?
  • a hardware mechanism, Intertask Conflict-Aware (ITCA) accounting
  • cal solution: full share & fair share
  1. How do they validate their solution?
  • use MPsim simulator: a highly flexible cycle-accurate simulator that allows us to model CMP architectures
  • SPEC CPU 2000
    • classify benchmarks into two groups depending on their cache behavior
    • 评估指标:论文笔记 CPU Accounting for Multicore Processors,System学习笔记,论文阅读
  1. What are the strengths and limiations of their solution?

strengths: 可以跟踪不同tasks使用的core和算力
limiations: 需要在寄存器层面上作修改文章来源地址https://www.toymoban.com/news/detail-520526.html

  1. They did their work on Intel CPU with Hyper-Threading. Did Intel use their solution? Why or why not?
  2. What did Intel do?
  3. Do we still have the problem of misleading CPU utilization?

到了这里,关于论文笔记 CPU Accounting for Multicore Processors的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [论文阅读]4DRadarSLAM: A 4D Imaging Radar SLAM System for Large-scale Environments

      目录   1.摘要和引言: 2. 系统框架: 2.1 前端: 2.2 回环检测: 2.3 后端: 3.实验和分析: 4.结论 1.摘要和引言: 这篇论文介绍了一种名为“4DRadarSLAM”的新型4D成像雷达SLAM系统,旨在提高大规模环境下的定位与地图构建性能。与传统的基于激光雷达的SLAM系统相比,该系统

    2024年01月23日
    浏览(60)
  • 【操作系统】在阅读论文:OrcFS: Orchestrated file system for flash storage时需要补充的基础知

    在阅读论文:OrcFS: Orchestrated file system for flash storage是需要补充的基础知识 这篇论文是为了解决软件层次之间的信息冗余问题 To minimize the disk traffic, the file system buffers the updates and then flushes them to the disk as a single unit, a segment (e.g.,2Mbyte), either when the buffer is full or when fsync() is ca

    2024年02月01日
    浏览(41)
  • [论文阅读&代码]DehazeNet: An End-to-End System for Single Image Haze Removal

    现有的单图像去雾方法使用很多约束和先验来获得去雾结果,去雾的关键是根据输入的雾图获得得到介质传输图(medium transmission map) 这篇文章提出了一种端到端的可训练的去雾系统—Dehaze Net,用于估计介质传输图 Dehaze Net中,输入为雾图,输出为介质传输图,随后通过大气散

    2024年02月08日
    浏览(45)
  • 论文阅读 《Pingmesh: A Large-Scale System for Data Center Network Latency Measurement and Analysis》

    在我们内部产品中,一直有关于网络性能数据监控需求,我们之前是直接使用 ping 命令收集结果,每台服务器去 ping (N-1) 台,也就是 N^2 的复杂度,稳定性和性能都存在一些问题,最近打算对这部分进行重写,在重新调研期间看到了 Pingmesh 这篇论文,Pingmesh 是微软用来监控数

    2024年02月11日
    浏览(58)
  • [论文笔记] Gemini: A Computation-Centric Distributed Graph Processing System

    Gemini: 以计算为中心的分布式图处理系统 [Paper] [Slides] [Code] OSDI’16 提出了 Gemini, 一个分布式图处理系统, 应用了多种针对计算性能的优化以在 效率之上构建可扩展性 . Gemini 采用: 稀疏-稠密信号槽 抽象, 将混合推拉计算模型扩展到分布式场景 基于分块的划分 (chunk-based partiti

    2024年02月15日
    浏览(41)
  • AndroidStudio启动虚拟机时报错Android Emulator Hypervisor Driver for AMD Processors is not installed(保姆级教程)

    相信很多小伙伴在启动Android虚拟机时有遇到报错问题,Android Studio提示下面内容: Intel HAXM is required to run this AVD. Android Emulator Hypervisor Driver for AMD Processors is not installed.  Install Android Emulator Hypervisor Driver for AMD Processors for better emulation performance.  点击下一步安装时又报错: An

    2023年04月09日
    浏览(75)
  • 【安卓】zoo for zotero && WebDAV 自动同步论文笔记

    前言是我写这篇博客的动机,可以跳过直接从“准备”开始看 之前使用mendeley管理文献,它不仅可以同步文件,还跨平台(win、安卓等)。但是后面,mendeley停止了移动平台的支持,导致我不能用我的电纸书(本质是个安卓平板)和手机等移动端随时看论文了。于是后面找了

    2024年02月03日
    浏览(36)
  • .report_system 占用100% CPU

    故障现象: 突然发现CPU利用好高,好在CPU 配置还行 CPU100%,通过htop 查看进程对应PID  查看进程,top靠前的进程  查看服务和端口 netstat -tlnp 查看任务计划,发现三个非常规计划,清理任务计划,删除计划相关文件 crontab -l  查看任务 crontab -e 编辑任务 rm -r *对应文件 serive cr

    2024年02月10日
    浏览(50)
  • 【论文笔记】《Learning Deconvolution Network for Semantic Segmentation》

    重要说明: 严格来说,论文所指的反卷积并不是真正的 deconvolution network 。 关于 deconvolution network 的详细介绍,请参考另一篇博客:什么是Deconvolutional Network? Learning Deconvolution Network for Semantic Segmentation deconvolution network 是卷积网络( convolution network ) 的镜像,由反卷积层( dec

    2024年02月20日
    浏览(46)
  • 论文笔记--GloVe: Global Vectors for Word Representation

    标题:GloVe: Global Vectors for Word Representation 作者:Jeffrey Pennington, Richard Socher, Christopher D. Manning 日期:2014 期刊:EMNLP   文章提出了一种新的单词表示的训练方法:Glove。该方法结合了基于统计方法和基于上下文窗口方法的优势,在多个下游任务上超越了当下SOTA方法的表现。

    2024年02月15日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包