网站首页
学术动态 首页 - 学术动态 - 正文

面向芯片可靠性的任务调度

2022-07-22 10:56 浏览次数:

主讲人:哈亚军

职务:上海科技大学教授

报告时间:7月25日16:00-17:00

地点:信科院软件大楼627会议室

联系人:张吉良

·个人简介

哈亚军教授在浙江大学、新加坡国立大学及比利时鲁汶大学分别获得电子工程学士、硕士及博士学位。他目前是上海科技大学教授,国家自然科学基金首届外国资深学者研究基金获得者,IEEE Transactions on Circuits and Systems II: Express Briefs(2022-2023)主编(Editor-in-Chief),上海高能效与定制人工智能芯片工程技术研究中心主任。他曾是新加坡信息通信研究院实验室主任,以及新加坡国立大学电子与计算机工程系的兼职副教授和助理教授。他的研究兴趣包括FPGA电路/架构/工具、超低功耗数字集成电路和系统,以及以上研究在智能汽车、机器学习和硬件安全中的应用。

·报告摘要

对于边缘智能计算设备而言,可靠性已越来越成为重要的设计约束,因为人们期望大多数边缘计算设备即使在复杂环境中都能可靠地工作多年。边缘计算设备的可靠性可按对系统的影响分为长期可靠性和短期可靠性两类。影响长期可靠性的重要因素是偏置温度不稳定性(Bias Temperature Instability,BTI)和电迁移效应(Electromigration,EM);而影响短期可靠性的重要因素是单粒子翻转现象(Single Event Upset,SEU)。一方面,随着器件使用年限的增加,BTI可导致器件的延迟增加,更严重的是,它可破坏设计的原始时序收敛;同时EM会使金属导线在大电流的作用下,引起电路开路,从而影响芯片正常工作。另一方面,SEU会影响边缘智能计算设备中的存储器和时序逻辑的数据状态,例如,SRAM或寄存器中的1值数据会错误地翻转为0值,反之亦然。

先前针对BTI和EM长期可靠性的工作主要集中在器件和电路层面,如晶体管BTI和EM效应建模,电路级分析和优化等,未能充分在更有效的系统级探索动态BTI和EM感知的负载模式,更未上下联动电路级优化。而先前针对SEU短期可靠性设计的工作主要集中在资源利用率极低的三重模块冗余方法,如何让新的基于擦除的方法最优地提高擦除调度成功率是一个挑战。

针对这些问题,本次报告提出一个工作负载模式感知、基于动态电压频率调节(DVFS)的系统和电路联动的动态调度框架,首先针对BTI和EM约束分别研究基于自适应性应用和基于强化学习的动态调度算法,同时针对SEU约束研究基于擦除的动态调度算法。报告还将介绍高效的DVFS体系结构和精确的在线延时监测技术。