扑克王德州平台下载

体系结构顶会HPCA2017英特尔夺魁跨平台深度学习论文获最佳论文提名

作者:扑克王德州平台下载    来源:poker官网下载    发布时间:2025-03-30 08:33:48

poker官网下载

  新智元日前宣布,获6家顶级机构总额达数千万元的PreA轮融资,蓝驰创投领投,红杉资本中国基金、高瓴智成、蓝湖资本 、蓝象资本、今日头条跟投。本轮融资将用于新智元团队规模扩充并增加新产品服务线,目标打造 To B 的人工智能全产业链服务平台。

  新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界中等水准的工资和奖金。

  【新智元导读】IEEE 高性能计算架构会议( HPCA 2017 )日前公布了本年度的最佳论文,英特尔摘下桂冠。本文除了对最佳论文的介绍,还重点介绍了另一篇来自佛罗里达大学李涛教授的跨平台深度学习论文,这篇论文被提名为最佳论文候选。中科院神经网络架构博士王超帮助下,本文还尝试对体系结构研究中的中国实力进行量化的盘点。

  2017年 2月4日到8日,IEEE 高性能计算架构会议( HPCA 2017 )在美国的奥斯汀举行,这是计算机体系结构的国际顶级会议之一,一起召开的还有编译和算法领域的CGO以及PPoPP。

  中科院计算所研究员韩银和总结说, 今年大陆有3篇论文入选,不到总论文数的1/10,和其他方向相比,体系结构还是美国难以撼动的优势领域,追赶的路还很长。

  根据中科大神经网络架构研究团队的博士王超的统计,在HPCA会议(1995-2016)上发表过论文的知名华人学者包括来自UCSB的谢源教授(9篇),佛罗里达大学的李涛教授(8篇),匹兹堡大学的张有弢教授(7篇),以及UCSD的周源源教授(6篇)。

  韩银和同时带来一个消息:UCSB的谢源教授当选明年(HPCA2018)的程序主席。这是华人学者在体系结构体系上地位提升的一个标志性事件。

  在计算机体系结构的三个顶级会议中,来自中国大陆的团队研究论文非常少。据统计,大陆第一单位在ISCA会议上发表的论文共18篇,其中陈云霁和陈天石研究员团队在ISCA上发表了4篇论文。而对HPCA会议来说,大陆第一单位会议上发表的论文共17篇。MICRO会议,1994年之前中国有9篇论文,然后从2009年至今有10篇论文,共19篇。 不过整体看来,大陆第一作者的论文数量呈现上升趋势。

  然而有必要注意一下的是,近年来,不仅仅大陆第一作者论文数量的提升,第一作者是华裔学生及研究人员的论文数量也大幅度的提高,显示出华人研究人员在未来体系结构研究领域的实力。例如ISCA 2016在所有的57篇论文中,有21篇论文的第一作者是华人研究人员,HPCA 2017的一作华人论文有19篇,MICRO 2016也有19篇,大体占到了论文总数的三分之一左右。

  存储墙仍然是性能的瓶颈。虽然小型管芯缓存到目前为止的性能尚足以隐藏这个瓶颈 ,但是现代的应用中持续不断的增加的占用使得这样的缓存效果越来越差。近年来,内存技术,比如嵌入式DRAM(eDRAM)和高宽带存储(High Bandwidth Memory)的进步,使得在 CPU 封装上集成大型存储,作为一种额外的带宽资源而不是DRR 主存储成为可能。由于容量的限制,这些存储大多数都会被当成一个内存侧的缓存。受到传统思路的启发,许多致力于提升系统性能的优化都在尝试将内存侧的缓存的命中率最大化。一个更高的命中率能让人更好地利用缓存,进而被认为能带来更高性能的表现。

  在本论文中,我们队这种传统的思路进行了挑战,并提出了一个动态存取分割(Dynamic Access Partitioning)算法,也称DAP。它牺牲了缓存的命中率,来利用主存储中未被利用的带宽。DAP 利用一个轻量的学习机制,只需要额外硬件的16个字节,便能在内存侧缓存和主内存之间获得一个近似最优化的带宽。模拟的结果为,在一个片叠式(die-stacked)内存侧DRAM 缓存上采用DAP,能够得到13%的性能。我们还证明了,DAP 在不同的实现、带宽点和内存侧缓存的容量点上都能带来较大的性能优势,使得它对任何超越芯片上SRAM 缓存层次的、基于多相带宽资源的当下或者未来系统都是有价值的。

  不过,在本届会议中,另一篇被提名最佳论文的研究《Toward Pervasive and User Satisfactory CNN across GPU Microarchitectures》引起了我们的注意。这篇论文来自佛罗里达大学电子和计算机工程系的教授李涛和他的该校的同事。论文提出了 Pervasive CNN (P-CNN)——一个注重用户满意度的CNN 推理框架。P-CNN 在不同的推理任务中能提供最佳的用户满意度。

  在GPU 上加速卷积神经网络通常包含两个步骤:训练和推理(Inference)。传统上,这两步处理都在含高端GPU配置的服务器中进行。台式机和手机GPU计算力的一直增长,使得在各种各样的平台上进行推理的兴趣不断地增长。与训练阶段所需要的高吞吐量和高精度不同,在与推理相关的任务中,最终用户面临着更多样化的要求。

  为了跟进这一新兴趋势,满足新的要求,我们提出了 Pervasive CNN (P-CNN),这是一个注重用户满意度的CNN 推理框架。P-CNN 有两个组成部分:跨平台离线编译(compilation)和运行时间管理。按照每个用户的需求,离线编译使用架构独立技术,比如自适应批处理量大小选择(adaptive batch size selection )和协同微调(coordinated fine-tuning)来生成最佳内核(optimal kernel)。运行时间管理阶段由准确率修正、执行和校正组成。首先,准确率修正会在可接受的准确率下动态地确定最快的内核。然后,运行时间内核调度器会为每一层神经网络分配出最优的计算资源,调度GPU 线程。如果获得的准确率对于终端用户来说是不能接受的,校正阶段会选择一个更慢但是更加精确的内核来提升准确率。最后,我们为 CNN 设计了一个用户满意度衡量指标,用于评估我们的 Pervasive 设计。我们的测试结果为,P-CNN 在不同的推理任务中提供最佳的用户满意度。

  李涛是佛罗里达大学电子和计算机工程系的教授。他在德克萨斯大学 获得计算机工程博士学位。他的研究兴趣包括计算机架构、微处理器/记忆/存储系统模块设计、虚拟技术、节约型/可持续/可依赖数据中心、云/大数据计算平台、计算机信息技术与应用以及计算机系统的评估。

  ASPLOS(编程语言和操作系统的体系结构支持会议)是ACM开办的一个以体系结构为核心内容的多学科会议,其研究领域跨越硬件、体系结构、编译器、编程语言、操作系统、网络和应用,尤其关注这些学科间的交叉性研究课题。

  ASPLOS一年仅录用20多篇论文,几乎每篇都会受到计算机领域的大量引用。

  (中科院计算所研究员韩银和,UCSB 谢源教授、中科院王超博士对此文有贡献,特此感谢!)

  AI 创业大赛由新智元与10 家主流 AI 创投机构:蓝驰创投、红杉资本中国基金、高瓴智成人工智能基金、蓝湖资本、蓝象资本、IDG资本、高榕资本、中信建投证券、明势资本、松禾远望基金携手发起,由新智元主办,北京市中关村科技园区管理委员会、中关村科技园区海淀园管理委员会支持,是一场聚合了 AI 技术领袖和投资领袖的盛会。新智元向满怀雄心的未来AI独角兽提供强大的创投资源对接机会,顶级风投 TS 等你来拿。

  点击文章下方阅读原文,在线填写报名申请报名表。该报名表为参与评选必填资料。

  如有更多介绍资料(例如BP等),可发送至,邮件标题请注明企业名称。如有任何咨询问题,也欢迎向该邮箱发信联系。

扑克王德州平台下载

服务热线:4000-662-888

服务手机:13818913497

公司地址:上海市奉贤区展工路888号

扑克王德州平台下载 二维码二维码
微信公众号手机网站
Copyright © 扑克王德州平台下载 版权所有