• CUDA中的C语言:对C语言子集的扩展,GPU代码支持C++模板。
  • CUDA的目标:扩展代码支持100个核心和1000个并行线程 、协助异构计算:CPU+GPU
  • CUDA定义了编程模型和存储模型
  • 应用中划分出的并行部分作为kernel在GPU上执行,一个线程执行一个kernel,多个线程可同时执行一个kernel。 Continue reading »
  •  

    上周末中国计算机学会(CCF)举办了《多核技术讲习班》,举办地点在北京,中科院计算所。邀请了明尼苏达大学的丁晨副教授、华为美国研究所的胡子昂博士、美国宾州州立大学的谢源副教授和中科院计算所的范东睿副研究员分别做讲座。

    四位的报告题目:

    1. 丁晨:并行编程与编译技术
    2. 谢源:新型半导体器件与工艺
    3. 胡子昂:通信与多核计算
    4. 范东睿:Godson-T与众核体系结构 Continue reading »
     

    今天听了一个博士师兄的论文答辩,试图提高分布式存储并行和共享存储并行中,循环中并行粒度。

    分布式存储下的并行,可以简单的理解为片间的并行,集群,很多CPU的计算机中的并行都属于这一类,这类并行强调的是消息传递,因为每个计算单元都有自己的存储空间,且这些存储是相互独立的,靠消息传递的方式来维护存储一致性,这类程序通常使用MPI工具做并行程序开发。这种并行一般是进程之间的并行,每个进程都有独立的资源管理和消息收发,地址空间相互独立。

    共享存储下的并行则不同,采用线程间的并行策略,即并行任务之间采用共享存储空间的形式,存储和资源都是共享的。这类并行多存在于现在流行的多核和众核系统中。主要面临的问题是一致性,缓存一致性是最主要的,因为多核系统通常是每个单核有一级cache,而多个核之间又共享二级或者三级cache,据说CPU上30%多的功耗都用在了维持一致性上。片上面积也一半多用来做了cache。OPENMP就是为共享存储而生的编程工具。 Continue reading »

     

    今天的会议日程比昨天轻松。五个报告。

    1. 台湾资讯研究院的游本中老师,未来编译研究的潜在领域展望。
    2. 江南所,关于精细编译调优的
    3. 计算所,关于并行的
    4. 上交 关于llvm的
    5. 武大 关于MCU编译器开发的

    其中,游老师的演讲最为重量级,也对我们这些晚生最有指导意义。大牛就是大牛,在美国混了这么久,现在又是台湾某个研究所的所长,编译领域的了解可谓渊博,虽然还谦虚的说自己的讲义只是匆匆的准备,但是演讲的过程却功底颇厚。 Continue reading »

    2009-2011© 编译点滴 Suffusion theme by Sayontan Sinha

    无觅相关文章插件,快速提升流量