【IC】RTL功耗高精度预测

article/2025/7/22 10:53:53

介绍

美国能源部(DOE)的一份综合报告“半导体供应链深度潜水评估”(2022年2月)呼吁将能源效率提高1000倍,以维持未来的需求,因为世界能源产量有限。能源效率是当今设计师的首要任务。能源效率的整体方法必须从设计流程的早期阶段开始,即建筑和微观建筑层面。正是在这些抽象层面,设计师可以评估power-performance-area权衡并创建节能架构。设计过程的后期阶段提供的节能机会有限。

能源效率和功率优化工作必须以所有抽象级别的功率分析为指导。在实施阶段,早期功率分析本质上不如签署功率分析准确,但早期功率分析的目标必须是为设计人员提供一致的准确性,使他们能够做出明智的决策。

传统的寄存器传输级(RTL)功率分析工具考虑的与设计实际实现相关的信息量非常有限。此类工具中使用的快速合成技术通常不是时序驱动的,具有有限的寄生电容估计能力,构建简单的扇出驱动时钟树结构,执行次优小区大小,并使用不精确的启发式方法进行毛刺功率计算。

这些考虑要求新一代RTL功率分析工具通过利用技术相关信息、时序约束和准确的故障功率建模来提供一致的准确性。这些工具以一致的方式提供RTL功率分析与最终签署分析的紧密相关性。只有对实现和签署功率计算算法有深入的理解,这种一致的准确性才可能实现。

本文概述了数字设计中功率耗损的基础知识,概述了RTL功率分析的工作原理,概述了实现一致的RTL功率分析精度的关键要求,并介绍了使设计团队能够做到这一点的Synothy s技术。

数字设计中的功耗基础

功率耗损计算的基本概念如下图1所示:

  • 动态-动态功率是门切换时消耗的功率
    • 内部:
      • 短路:栅极P和N晶体管之间的瞬时短路
      • 内部电容:栅极内的充电/放电电容(例如缓冲器=2个反相器)
    • 开关:cell输出端负载电容的充电和放电耗散的功率
    • 静态/泄漏:静态功率是栅极不切换时耗散的功率
      在这里插入图片描述
      功耗大致可分为两大类:动态和静态(或泄漏)功率。动态功率是由于设计中的逻辑状态转换——信号从逻辑“0”切换到逻辑“1”,反之亦然。这一活动基于设计的RTL或门级模拟,因此是正在使用的特定测试或“矢量”的函数。动态功率进一步分为内部功率和开关功率子类别。内部功率是由于门内部的短路电流和电容切换而在门内部消耗的功率。开关功率是通过对门的输出电容负载进行充电和放电而消耗的功率。这个外部电容负载是从门输出到接收器的寄生路由电容和接收器的输入引脚电容的总和。即使没有输入或输出开关活动,逻辑门也会消耗静态(或泄漏)功率。

工艺库(例如Liberty)包含与库中每个单元的逻辑状态转换相关的能量值。RTL或门级功率分析工具处理仿真数据,并根据设计和库能量值中的网络活动计算内部功耗。功率分析工具还通过使用估计或提取的电容和相应的网络活动作为CV2Fa来计算开关功率,其中C是净电容,V是电源电压(来自工艺库),Fa是与电容相关的网络频率。每个单元的泄漏功率值可直接从工艺库获得。

RTL功率分析-它是如何工作的

RTL功率分析利用快速逻辑合成技术将输入的RTL代码转换为设计的门级(网表)或字级表示。活动信息是RTL模拟的结果,还需要一个工艺库。然后,RTL功率分析工具能够以上述方式计算功耗。这如图2所示。还需要快速周转时间(TAT),以使RTL设计工程师能够评估RTL编码变化及其对功耗的影响。
在这里插入图片描述
快速合成技术的一种类型是基于扇出的字级逻辑推理。虽然这种方法提供了快速TAT,但它也有严重的限制,极大地影响了RTL功率分析的准确性,导致用户进行真正降低功率和提高能效的RTL编码更改的置信度降低。以下部分概述了在RTL功率分析中实现一致精度的关键要求,克服了基于扇出的技术的缺点。

一致的RTL功率精度的关键要求

虽然RTL功率分析的高精度是非常可取的,但这种精度也必须是一致的。这意味着对于各种设计类型或块,精度或RTL功率分析必须在最终实现后功率分析的明确定义范围内(例如在15%内),而不需要每个设计类型或块独有的特殊工具设置。为了实现这种一致的精度,RTL功率分析工具必须使用具有时序和物理感知的快速合成技术,以及signoff质量功率计算引擎。让我们更详细地检查这些要求中的每一个。

时序感知快速合成

嵌入RTL功率分析工具中的快速合成需要时序驱动,就像下游合成和实现(放置和路由)工具一样。基于扇出的快速合成不足以根据时序限制适当调整单元大小,因此可能导致不准确的内部功率计算。这在下面的图3中说明:
在这里插入图片描述
在此示例中,关键时序路径以红色突出显示,因为它从输入通过慢速3输入或门到3个逻辑电平的输出。设计中单元的最大扇出为2,如圆圈所示。由于扇出较低,基于扇出的快速合成技术将为每个单元分配最小尺寸(1x)。然而,时序驱动的快速合成算法将识别关键路径并使用更高的驱动强度单元来满足关键路径上的时序限制。这些更高驱动强度的单元在技术库中具有更高的能量值,因此基于扇出的RTL功率分析工具将低估此设计中的内部功率。另一方面,时序驱动的RTL功率分析工具将提供更准确的结果。

物理感知快速合成

如上所述,在设计中计算开关功率需要净电容。传统的基于扇出的RTL功率分析工具使用启发式方法来执行净电容估计——类似于线载模型,电容是根据设计中每个单元的扇出根据扇出电容表计算的,其中电容是表示可能的电线长度范围的统计数字。尽管线载模型在过去甚至被实施工具使用,但线载模型在高级过程节点上变得无效以实现时序闭合。为了实现一致的RTL功率精度,RTL功率分析工具必须是物理软件——即它必须能够在设计中对单元进行第一遍放置,以及全局路由,以获得准确的净电容值。这需要除了技术库之外的技术数据(技术文件)输入。如图4所示,物理感知电容估计会为每个网络产生唯一的准确值,而基于扇出的方法会导致开关功率不准确。
在这里插入图片描述

Sgnff质量功率计算引擎

实现一致的RTL功率分析精度的最后一个关键要求是signoff质量功率计算引擎。signoff功率分析通常经过与SPICE结果和硅测量的验证,预计在实际硅值的百分之几以内。signoff分析的如此高精度确保了在带电前预测功率值的可信度,避免了设备启动和系统验证期间的不愉快意外。动态功耗的一个关键组成部分是故障功率——由于设计中不必要的活动而产生的功率,如图5所示。
在这里插入图片描述
签署质量功率分析引擎必须准确计算glitch功率。这只有通过单元级或网表表示设计和用于精确计算延迟的内置计时引擎才能实现。使用字级逻辑推理进行快速综合的传统RTL功率分析工具只能应用启发式方法进行glitch功率计算,因此不准确。

https://www.synopsys.com/content/dam/synopsys/solutions/energy-efficient-socs/white-papers/achieving-consistent-rtl-power-accuracy-wp.pdf


http://www.hkcw.cn/article/XZYGaAKfKe.shtml

相关文章

美国要求澳大利亚上调军费 提升至GDP的3.5%

当地时间6月1日,美国国防部长赫格塞思在新加坡会见了澳大利亚副总理兼国防部长理查德马尔斯。双方讨论了美澳联盟的关键优先事项。赫格塞思在会谈中建议澳大利亚尽快将国防开支提高到国内生产总值的3.5%。尽管澳大利亚不是北约成员国,美国总统特朗普此前曾多次要求北约成员国…

高反缺氧去世卡友已回老家下葬 留下6个孩子引关注

近日,46岁的河南卡车司机常志荣在青藏高原不幸离世。他的卡友团队一同将其骨灰接回老家,并于6月1日在老家安葬。常志荣去世后,留下了重组家庭的六个孩子,其中五个孩子还在上学。车友任先生透露,常志荣出发前曾被建议至少携带两罐氧气,但他为了节省30元费用,最终只购买了…

亚历山大本赛季两战步行者场均39分 雷霆双胜步行者

NBA总决赛的对阵双方是雷霆和步行者。本赛季两队交手两次,雷霆分别以120-114和132-111取胜。这两场比赛中霍姆格伦都没有出战。亚历山大在这两场比赛中的表现非常出色,场均能够贡献39分、7篮板、8助攻、1抢断和1盖帽,场均罚球次数达到11.5次,真实命中率为71.1%。在面对步行…

六地将有大到暴雨 端午出行需谨慎

中央气象台今日6时继续发布暴雨蓝色预警和强对流天气蓝色预警。福建、广东、广西等六个地区将出现大到暴雨,多地还将遭遇8级以上的雷暴大风或冰雹天气。正值端午假期最后一天,出行前请务必关注天气情况。责任编辑:zhangxiaohua

017搜索之深度优先DFS——算法备赛

深度优先搜索 如果说广度优先搜索是逐层扩散,那深度优先搜索就是一条道走到黑。 深度优先遍历是用递归实现的,预定一条顺序规则(如上下左右顺序) ,一直往第一个方向搜索直到走到尽头或不满足要求后返回上一个叉路口按…

举办中国户外运动展哪个城市较理想

杭州:强劲经济引擎,中国户外运动展的理想之选! 为什么是杭州?—— 硬核实力,无可争议! 经济活力领跑: 浙江人均GDP超2.5万美元,人均收入与消费全国TOP 1!2024年省外人口…

JMeter接口自动化脚本框架

登录后的CRUD自动化脚本 内容: 用户自定义变量 ${}引用 HTTP请求默认值:复用内容 HTTP信息头:请求类型、token、cookie setUp、tearDown线程组:前后置操作 响应断言:文本、代码 Json提取器:提取响应…

缺氧离世卡车司机已下葬卡友发声 家庭重担引关注

近日,46岁的河南卡车司机常志荣在青藏高原离世,卡友团队将其骨灰接回老家。6月1日,他在老家安葬。常志荣去世后,留下了重组家庭的6个孩子,其中5个还在上学。据车友任先生透露,常志荣出发前同行曾建议他至少携带两罐氧气,但他为省下30元费用,最终只购买了一罐氧气。常志…

【C++】多态

目录 1. 多态的概念 2. 多态的定义和实现 2.1 构成多态的条件 2.2 虚函数 2.3 虚函数的重写(覆盖) 2.4 小试牛刀 3. 重载/重写/隐藏的对比 4. 纯虚函数和抽象类 5.多态的原理 5.1 虚表 5.2 虚表指针 5.3 对比虚函数、虚表、虚表指针 1. 多态的…

肖战演活了藏海 台湾观众好评如潮

正在热播的电视剧《藏海传》在台湾引起了广泛关注,不仅获得了岛内观众的一致好评,也得到了媒体的争相报道。这部剧以其精良的制作、紧凑的情节以及所展现的中华文化深深吸引了台湾观众。5月31日,“肖战演藏海在台湾刷屏”这一话题冲上了微博热搜榜。近年来,大陆电视剧在台湾…

C# 多线程编程全面指南:从基础到高级实践

在现代软件开发中,多线程编程已成为提升应用程序性能的关键技术。C# 作为.NET平台的主力语言,提供了丰富的多线程处理机制。本文将全面介绍C#中的多线程编程技术,从基础概念到高级应用,帮助开发者掌握这一重要技能。 一、多线程基…

PASCAL VOC数据集/AI标注/算法训练推理EasyAML如何实现“数据不出域”的本地化AI标注训练

在当今数字化转型的大潮中,众多企业对AI视觉技术的需求日益增长。无论是制造业的产品质量检测、物流行业的货物识别与车辆管理,还是安防领域的视频监控与分析,AI视觉技术的应用场景广泛且多样。然而,在实际应用过程中,…

Linux系统中的shell脚本基础知识

1.shell脚本基础:shell脚本是文本的一种,属于可以运行的文本,shell脚本的内容是由逻辑和数据组成的。 2.shell脚本意义:shell脚本语言是实现Linux/unix系统管理及自动化运维所必备的重要工具。 常见shell种类:Bourne …

C++修炼:位图和布隆过滤器

Hello大家好&#xff01;很高兴我们又见面啦&#xff01;给生活添点passion&#xff0c;开始今天的编程之路&#xff01; 我的博客&#xff1a;<但凡. 我的专栏&#xff1a;《编程之路》、《数据结构与算法之美》、《题海拾贝》、《C修炼之路》 1、引言 在计算机科学…

贾冰瘦脱相 压力给到沈腾了 减肥热潮席卷娱乐圈

5月31日,演员贾冰的妻子发布了一段视频,祝福大家端午节快乐,并配文“从此我家多了个瘦子”。从两人合影中可以看出,贾冰明显瘦了很多。评论区里很多人询问他如何瘦下来的,甚至有人表示他瘦得有些认不出来了。贾冰妻子回复说,主要是通过少吃(一天一顿)和运动达到的。贾冰…

AdaCtrl:自适应可控Reasoning,可降10~90%推理长度!!

摘要&#xff1a;现代大型推理模型通过运用复杂的推理策略展示了令人印象深刻的解决问题能力。然而&#xff0c;它们常常难以平衡效率和有效性&#xff0c;经常为简单问题生成不必要的冗长推理链。在本研究中&#xff0c;我们提出了AdaCtrl&#xff0c;这是一个新颖的框架&…

格式工厂 FormatFactory v5.20.便携版 ——多功能媒体文件转换工具 长期更新

—————【下 载 地 址】——————— 【​本章下载一】&#xff1a;https://pan.xunlei.com/s/VORWF3Q7D0eCVV06LHbzheD-A1?pwdjikz# 【​本章下载二】&#xff1a;https://pan.quark.cn/s/8ee59ed83658 【百款黑科技】&#xff1a;https://ucnygalh6wle.feishu.cn/wiki/…

贾冰瘦到脱相 网友:压力给到沈腾 减肥风潮席卷娱乐圈

5月31日,演员贾冰的妻子发布了一段视频,祝福大家端午节快乐,并配文“从此我家多了个瘦子”。在两人合影中,贾冰明显瘦了很多。评论区里大家都在问他是如何瘦下来的,甚至有人觉得他瘦得都快认不出来了。对此,贾冰妻子回复说,主要是通过少吃(一天一顿)和运动来减肥的。贾…

多地机关食堂端午向社会开放 节日共享美食

端午假期,全国多地政府机关食堂面向社会公众开放。重庆市荣昌区政府机关食堂在5月31日中午如约向游客开放,首日吸引了超过3000名游客前来体验。该食堂特别推出了61元的“六一”家庭套餐,包括荣昌卤鹅、黄凉粉等特色菜品,并新增了粽子和儿童喜欢的薯条、鸡腿、鸡块等小吃,让…

vscode实用配置

前端开发安装插件&#xff1a; 1.可以更好看的显示文件图标 2.用户快速打开文件 使用步骤&#xff1a;在html文件下右键点击 open with live server 即可 刷力扣&#xff1a; 安装这个插件 还需要安装node.js即可