上篇文章前瞻-主流处理器中的数据并行支持(SIMD)>和《前瞻-拿起SIMD的武器I》分别介绍了当今主流CPU中的SIMD扩展 ,以及前人是如何利用SIMD来做优化的,本文<前瞻-拿起SIMD的武器II>将探讨如何使用CPU的向量指令为程序做优化

如何实现?

编程环境

在现在CPU设计中都加入SIMD扩展并不是解决应用性能问题的好方法。如果没有很好的利用途径,再强大的SIMD扩展指令集都是徒劳。接下来,我们从编译器技术和编程方法论上探讨如何使用SIMD指令来实现应用加速。 Continue reading »

 

一年多的时间,终于读完了这套《明朝那些事儿》,一共七本。一本一本的买,一本一本的看。花了将近140块大洋.是一套不错的好书。作者以一种平易近人而又不失幽默的写法,像小说一样,介绍了明朝自开国到崇祯上吊这三百年的历史。
无数的尔虞我诈,勾心斗角,争权夺势。但也有忠义之士为国为民。一年断断续续读完,现在已经忘的差不多了。在读到第五部和第六部的时候,就忍不住问过自己,我能做到以史为鉴吗?好像作者在介绍每个人物的时候都在一开始暗示了他的结局。现实中有谁能认清时局,辨清是非?幸好,作者在洋洋洒洒写完七部之后,在结尾,给了一个自己的答案,也大概是我想要的答案。

没有了权谋,没有了势利,只是介绍一个人,跟随自己的心,走遍中国的名山大川,记录自己一生的游历见闻。不见五陵豪杰墓,无花无酒锄作田。那些争权夺势的,大多都短命,死的很惨。忠义之士,虽然流芳千古,却只能死后流芳。能在权倾天下的位置,干到退休并正常老死的,屈指可数,那是神人,我做不到。做叛徒的,一时风光,却两边被唾弃。只有坚持自己,坚持信念的人,跟随自己的心,才会过的幸福,成功与否无所谓。

看来自己太不适合写文章了,想写点什么,但下笔之后却完全不知该写什么。

不管怎样,就以此文纪念我一年,300多天,每天晚上回到宿舍那一个多小时的阅读时间。还要感谢当年明月,用心的讲述明朝的正史,一套用心写的书.

以史为鉴曾经是自己打算买第一本明朝那些事儿的理由。看到最后,人性本来就是这样,该如何还是会如何。几百年的历史都在亘古不变的历史规律上以具体的人和事将这些规律演绎了一把而已。看了这些史书,或许自己的年少轻狂会稍微少点,但历史还是会按照它的方式继续前进。就让喜欢勾心斗角的人,继续去斗吧,就让喜欢尔虞我诈的人,继续去骗吧,我只想按照自己的方式,去度过我短暂的一生。去嬉笑怒骂,去经历世态炎凉,人生悲欢,那就是我的成功。

 

本博在实际工作中,曾经安装过不少龙芯电脑的系统,可谓稍有经验,这里略微介绍一些常见问题。

  1. 内核通用吗?一般龙芯2F使用MIPSIII的指令级,内核格式都为64位的文件。所以不管时O32系统还是N32系统,只要硬件相同都是通用的,不过别忘了连同/lib/modules 和/lib/firmware一起使用:)
  2. 龙芯到底有多少种系统?很多,按照ABI分为3类:O32,N32,N64.O32是出厂时自带的系统,一般龙芯盒子中的华镭,龙芯本中的loonux、红旗和龙芯一体机中的共创都是O32系统。这类系统基本都是在debian的基础上做做山寨化。当然也有英文版的debian系统,这个比较干净一些。对于O32的系统,源的问题最头疼,因为各个公司画地为牢,大家都努力维护自己的源,又都缺人手,所以都不完美,试了几个都不太好,装着装着就会出依赖问题,除非一直跟着升级,不然一次apt-get dist-upgrade,那简直是噩梦。N32的系统,zhllg基于Gentoo的已经有了,龙芯论坛里就能找到下载链接。因为Gentoo是自己直接编译,问题相对少些。debian的还没有。N64的系统,有憨牛LFS的,没有试过。至于为啥会有这么多系统,得问问MIPS,因为有不少改进,就产生了不少问题。请参考本博<好大一筐梅普斯>.N32系统据说比O32快20%-30%。因为龙芯本身是64位处理器,所以64位系统也没问题.
  3. Continue reading »

 

如何能做上高薪的程序员

这个题目有点功利,其实目的不是为了强调钱,只是为了强调这程序员背后的价值,也就是为何能拿到高薪。

我一直很想把一切做技术的看作是在练功,一种修为的锻炼。学编程的,学法律的,学传媒的,各行各业都有自己的门道。都需要长时间的积累和锻炼才能有大的收获,才能在这个行业有自己的地位,让自己的价值得到体现。虽然自己现在都已经研二了,但是还是买了《我是一只IT小小鸟》这本书来看,主要是想刺激一下自己。这本书是一些已经算是有点小成绩的刚刚走出学校或是还在读研究生的学生,但各个都是传说中的牛人。每个人都从自己的角度介绍了自己求学的几年时间里的经验和教训。是本好书,尤其适合想做IT的大学本科生。

这本书里,几乎所有的人都先谈到了自己大学前的经历,简言之就是兴趣爱好。有了这个才能在这一行里走的更远,这个就不多说了。

说说书里一些人的成功经验:

Continue reading »

 

今天的会议日程比昨天轻松。五个报告。

  1. 台湾资讯研究院的游本中老师,未来编译研究的潜在领域展望。
  2. 江南所,关于精细编译调优的
  3. 计算所,关于并行的
  4. 上交 关于llvm的
  5. 武大 关于MCU编译器开发的

其中,游老师的演讲最为重量级,也对我们这些晚生最有指导意义。大牛就是大牛,在美国混了这么久,现在又是台湾某个研究所的所长,编译领域的了解可谓渊博,虽然还谦虚的说自己的讲义只是匆匆的准备,但是演讲的过程却功底颇厚。 Continue reading »

 

3.0 应用和小矮人

(译者注:原文单词为Dwarfs,意思是有魔法的小矮人)

图1左侧的塔是应用。除了传统的桌面、服务器、科研和嵌入式应用外,面向消费生产的重要性正在增加。

我们决定发掘高性能计算领域中并行化的经验,以期能从中学到有关更广泛领域的并行计算的知识。这样做的前提并非传统的科学计算是并行计算的未来;而是在大规模并行计算机上开发高效运行程序的经验本身或许能为以后应用的并行化提供有用的经验。而且许多其他领域的作者,如嵌入式计算,也为他们自己领域内的未来应用与现有并行计算问题如此的相似而感到吃惊。 Continue reading »

 

2.0 动机

翻译者:erlv,转载请注明出处 http://lingcc.com

并行化的前景已经在至少三十年的时间里让研究者着迷不已。虽然过去并行计算的性能已经预示了前景而且吸引了不少投资,但是最终还总是单处理器计算占据上 风。然而,我们认为通用计算正在向并行体系结构做着不可逆转的改变。这次与以往又有什么不同呢?这次向增加并行性的转变并不是一种基于基于新颖的并行性软 件和体系结构的昂首向前,而实际上只是在面对在硅晶体上高效实现传统单处理器体系结构上越来越大的挑战时一种不得已的退却。
下面,我们将通过几个指导性的概念来详细的展现计算技术是如何演变的。他们将仿效新闻周刊的方式,以传统的经验观点(CW)和取代他的经验观点对比的形式列举出来。我们将在以后的讨论中使用CW #n来引用这些对比:

Continue reading »

 

在北京大学2008年开学典礼上的发言
英语系80级校友、新东方教育科技集团董事长兼总裁俞敏洪
2008年9月21日

  北大原来从未邀请过校友在开学典礼上讲话,2008年开学典礼,北大邀请了新东方教育科技集团董事长兼总裁俞敏洪老师讲话,这是俞老师的一种荣幸,更是新东方的一种荣誉。

北京大学2008级新生开学典礼(摄影/王天天)
Continue reading »

 

1 引言

翻译者:erlv,转载请注明出处 http://lingcc.com

从Intel跟随IBM的Power 4 和 Sun 微系统的Niagara处理器宣布其以后的高性能微处理器将以多处理器或者多核为基础开始,计算机工业就转换变了他的路线。在这个行业上”多核”这一时髦 词开始取代过去每一代半导体处理技术都从一个单处理开始的历史,走向了每代将使片上的核心翻一番的时代。多核毋庸置疑的会提升很多时序上独立的多任务负载 情况下的性能,但是多核如何使每个单独的任务变得更快呢?若不充分挖掘和改进能耗,程序设计从串行到适度并行化的转变将会是十分困难的。因此,多核不像是 理想的未来计算技术发展方向。
Continue reading »

 

摘要

翻译者:erlv,转载请注明出处 http://lingcc.com

近来向并行微处理器的转变是计算技术的一个里程碑。工业界已经为通过二进制兼容和缓存一致性来保留过去的程序范例能在多核处理器可用设计好了路线图。工业界的智力投资也开始转变为在新一代硅材料上成倍增加核数。

由伯克力的多个学科的研究人员组成的研究小组已经就这一转变讨论了将近两年。我们的观点是:这一软件和硬件并行化的变革对有2-8个处理器的系统将很有效,但当16核和32核的处理器系统出现之后效果将可能会减小,就像较大的指令级并行造成的减小一样。 Continue reading »

2009-2011© 编译点滴 Suffusion theme by Sayontan Sinha

无觅相关文章插件,快速提升流量