个人超级计算机编辑本段回目录
世界首台个人超级计算机--“泰斯塔”
新浪科技讯 北京时间12月8日消息,据英国《每日邮报》报道,美国NVIDIA公司日前表示,他们目前已经历功地研制出了世界上首台个人超级计算机。这种名为“泰斯塔”(Tesla)的超级计算机售价为4000英镑(约合4万元人民币),运算速度比普通的个人电脑快250倍。
这种桌面工作站采用最新的Nvidia图像处理器,可以拥有与超级计算集群相当的同步计算性能。但是,这种所谓的超级计算集群体积非常庞大,甚至可以占据整个房间。Nvidia公司发言人本杰明-贝拉昴多认为,“这一技术代表了计算机历史上的一次伟大飞跃。它与微芯片一样,都具有革命性的意义。这种个人超级计算机拥有960个处理核心和16GB显存,运算速度极其惊人,是目前性能最好的个人电脑的250倍左右。”英国剑桥大学、牛津大学以及美国麻省理工学院的学生们已经开始利用这种基于Nvidia图像处理器的个人超级计算机进行科学研究。科学家们还相信,个人超级计算机将能够帮助人类治愈多种疾病。这种超级计算机将能够根据无数的科学代码,分析并生产出能够治疗人类各种疾病的有效药物。
美国马里兰州高级生物医学计算中心科学家杰克-科林斯认为,“这一杰出的发明将可能帮助人类加速癌症治疗药物的研发速度,挽救更多人的生命。”个人超级计算机的创新之处在于采用了Nvidia公司最新的图像处理器。Nvidia公司宣称,这种图像处理器可以给下一代家庭计算机带来闪电般的速度。贝拉昴多介绍说,“传统的处理器在一个线程中,同时只能处理一个任务。但Nvidia最新的图像处理器可以同时处理多个任务,比如可以同时采集多个象素以产生动态图像。”
据研发人员介绍,“泰斯塔”个人超级计算机拥有“工作站的价格,超级计算机的性能,适合个人操作,非常简单易用”等几大特点。在外观上就如同一台可以放在桌面上的工作站一样,内置一颗四核CPU 和3-4个GPU单元模块,拥有12-16GB系统内存、1200-1350W电源,可以直接使用办公环境下标准的电源。由于总共拥有960个GPU核心,使其浮点计算性能高达每秒4万亿次,是当前台式工作站的250倍,而售价不到1万美元,跟相同性能水平的传统超级计算集群相比,价格只有1%。研发人员说,“泰斯塔”个人超级计算机实现了人们“以工作站的价格和占地空间获得超级计算集群性能”的梦想,开启了个人高性能计算的新领域。“就象20多年以来,PC从早期的专家设备变成了今天人手一台的普及工具一样,我们相信从现在开始,个人超级计算机也可以走向普及。”
英国维根伦(Viglen)公司、阿玛尼(Armari)公司以及戴尔(Dell)公司等多家计算机生产商共同参与了这种超级计算机的研发。目前这种超级计算机主要面向大学以及科研机构销售。Dell公司称,这款电脑将投入大规模生产,逐渐向普通消费市场进军。目前,这类个人超级计算机产品已经在国外一些大学科研人员当中得到了采用。
集群计算终结者——Tesla个人超级计算机编辑本段回目录
当一个新产品出来,在某个方面性能提升100%,已经很好了,当这种产品性能提升到1000%,那就是非常优秀了,但是当它把性能提升到5000%~40000%,那就是太让人激动了,这就是Nvidia Tesla C1060.
在并行计算应用领域比现有的CPU技术快50倍,某些应用快400倍,这不是量的飞跃,这是质的飞跃,这种技术虽然现在还没有普及,但是这种性能已经足以改变更多应用缓慢发展,你如果拒绝,或无动于衷,你就太麻木了
今天为了普及推广Nvidia Tesla C1060,我们提供一套最具性价比Tesla高性能计算机硬件配置
配置:
分类 | 配件型号规格 | 数量 | 备注 |
CPU | AMD Phenom 9650 | 1 | |
FAN | |||
主板 | Foxconn A79-S | 1 | |
内存 | 2GB DDR800 | 4 | |
显卡 | 丽台Quadro FX570 256MB | 1 | |
GPU处理器 | Tesla C1060 240核/4GB显存 | 1 | |
硬盘 | ST 500G SATA企业级 | 1 | |
光驱 | DVD-RW | 1 | |
机箱 | XASUN T2 | 1 | |
电源 | 600W EPS | 1 | |
合计 | 21800元 |
产品型号 XASUN X900 T12708TT
配置:
分类 配件型号规格 数量 备注 CPU Core i7 920 1 FAN 主板 intel DX58SO 1 内存 4GB DDR3-1333 2 显卡 丽台Quadro FX570 256MB 1 GPU处理器 Tesla C1060 240核/4GB显存 1 硬盘 ST 500G SATA企业级 1 光驱 DVD-RW 1 机箱 XASUN T2 1 电源 600W EPS 1 合计 24500元
Tesla C1060个人超级计算机性能指标:
l 240个处理核心,多核架构,解决以前集群来运算的计算难题
l 4 GB高速内存,高达102GB/s传输速度,512位显存位宽
l CUDA C语言编程环境
l 可扩展到多个GPU,来解决大规模计算的问题
l IEEE 754单和双精度浮点单元
l 最大可以支持2Tflops运算速度
l PCI-Express 2.0接口,CPU与GPU之间的通信速度快、带宽高
GPU计算应用实例
下面的一些实例展示了GPU计算的性能,众多运算密集型的应用程序执行速度已经可以通过NVIDIA的GPU产品获得令人瞩目的提升。
医学成像:数字层析 X 射线照相组合
数字层析X 射线照相组合是一种早期胸部肿瘤X射线透视法,可以使癌症对乳房组织的损害被更早的检测、发现。在这种应用中,美国马萨诸塞州综合医院就使用了NVIDIA的 GPU产品,通过对X射线透视所获取的数据进行高强度计算来重建图像。
为了更好的显现肿瘤或其它癌变,层析X射线照相使用了视差技术,可以使图像上相邻物体间的距离更远、成像更清晰。电脑的任务就是将病人胸部的X光扫描图像电子式的排列组合起来。通过使用这种技术,可以消除层叠结构对癌变组织图像的模糊作用。
层析X 射线照相组合作为一种医学成像概念问世于上世纪60年代,但是直到90年代,当数字感光器具有足够的灵敏度之后才得以成为现实。但是,当时的处理器性能还不足以满足这项任务。首次通过层析 X 射线照相获得的数据进行医学成像的尝试中,花费了5个小时才完成对一个病人的扫描,时间太长,无法进入实际应用。使用一个由34台PC的服务器集群也耗费了20分钟才完成处理,结果还不错,但是在医院的放射实验室安置服务器集群是不切实际的。
现在,在使用NVIDIA的GPU产品进行计算后,马萨诸塞州综合医院在图像重建的过程中获得了100倍的速度提升,使用一台PC只用5分钟就可以完成计算,使医生很快就可以得到成像图片并给出诊断结果。
模拟与设计:生物医学核磁共振成像植入设备
在医学领域内,为了保证核磁共振成像或是其它一些诊疗成像设备的安全使用,许多生物医学植入设备被广泛使用。在这些植入设备的模拟与设计过程中,需要进行高强度的计算,用传统的电脑集群将耗费相当多的时间。
著名的美国波士顿科学国际有限公司就是一个设计和制造起搏器和其他一些生物医学植入设备的公司,他们使用了NVIDIA GPU 运算技术加速整个计算过程。通过NVIDIA的 并行 GPU 架构,模拟过程的执行速度提高了25倍。不仅速度方面提高很多,在成本方面也比过去使用CPU集群时大大降低。
地球科学: 石油与天然气勘探
现在,石油与天然气的勘探正变得越来越困难。大型的油气储藏带经常处于地表下很深的地方以至于难于勘测。例如最近在墨西哥湾发现的油田就处于海床下20000英尺深的地方。为了解释地质数据,就必须对获得与处理大量的地震数据。
大多数人今天仍然认为GPU是一种用于娱乐消费的技术。但是,休斯敦的Headwave(一个专门从事地质数据分析的公司)正着手开发新一代计算平台,以充分利用图形卡的并行计算潜力了。
Headwave的解决方案也通过NVIDIA 的GPU技术,并使用CUDA SDK来运行。地球物理学者可以更快速的筛选他们的数据,即便这些数据多达几TB的容量。过去处理这些多达几TB的数据需要数月的计算时间,而使用NVIDIA GPU 计算技术后,计算速度比过去提高了20倍。所以说,没有NVIDIA 的GPU 计算技术,即时演算这些数据是不可能的,石油与天然气公司将成为这项新技术的直接受益者。
计算生物学:分子动力学模拟
在分子动力学模拟领域内,模拟复杂的分子系统需要要耗费大量的时间,并使用复杂的计算机集群。位于Urbana-Champaign的美国伊利诺伊大学的研究人员就使用了NVIDIA的 GPU 产品用于计算生物分子、离子的相互作用,结果是运算速度比过去采用CPU集群提高了100倍。
关于人类疾病的研究是高性能科学计算的主要用途之一
使用GPU工作站后,实际运算速度达到了705 gigaflops。这样非凡的成绩也使得生物科学研不再被限制在服务器集群平台,有了GPU计算,在个人实验室、桌面平台都可以很轻松的进行这些生物分子的模拟,从而使研究者之间不再争夺有限的计算资源。
更进一步,在一些大规模服务器集群中引入GPU之后,一些过去无法实现的梦想现在也可以成为可能。纳米级分子动力学与NVIDIA计算技术的结合是尖端研究与软件开发技术的联姻,用于帮助超级计算机解读活性细胞分子的微小组成。
科学计算:MathWorks MATLAB
MATLAB是一种非常适合于对科学和数学算法进行快速编码的高级语言,并广泛应用于各种研究领域,例如信号与图像处理、测量、商业建模与分析、计算生物学等。
使用NVIDIA 的GPU产品来加速MATLAB有两种方法,第一种不需要改变MATLAB的代码,仅通过插入CUDA FFT 或BLAS 函数库就可完成。为了进一步加速MATLAB程序,CUDA 中的MATLAB插件允许编程人员使用优化过的CUDA程序来替换某些关键函数,这些新的CUDA函数可以被MATLAB程序所调用。由于使用了CUDA函数,MATLAB的使用者可以方便的加速计算而不必重写整个应用程序。
神经电路模拟
大脑神经电路的模拟需要大规模的进行大规模的生物电路模拟,其中也涉及到大量的并行计算。模拟一个神经细胞需要在一秒钟内求解2亿个方程式。一个神经系统矩阵则有成千上万个神经细胞构成,对一格神经系统的即时模拟则需要超过10teraflops的计算能力。Evolved Machines公司在2006年与NVIDIA 合作,将神经系统的模拟速度比当今的x86 微处理器提高了130倍。
随着Nvidia Tesla目前应用普及,凭借其强大性能,更多单位加入,东京工业大学1周时间的准备,用了680块Tesla卡就拿到了高性能计算排名Top500的第29名,全球高性能计算机顶级制造商Cray公司改变传统采用Tesla,以前医学成像更高应用受制于计算机性能和成本,现在用Tesla就能做到实时心脏跳动虚拟仿真,多么不可思议,赶紧加入Tesla的应用开发队伍里吧,更多的奇迹等着你创造出来呢,这不是忽悠,这是实实在在发生在我们周围的事情。赶紧参与吧。
更多Tesla个人超级计算机配置,请点击:http://www.xasun.com/article/08/703.html
参考文献编辑本段回目录
http://www.kuqin.com/shuoit/20081209/30063.html
http://www.xasun.com/article/80/810$2.html