从FAST落成看中科曙光的科学大数据
- +1 你赞过了
2016年9月25日,一个可以载入史册的日子。贵州平塘,世界最大射电望远镜——“500米口径球面射电望远镜”(英文简称FAST)落成启用。从项目预研到FAST正式落成,“观天巨眼”的诞生共历经22年,其中仅安装直径500米的圈梁就用了17个月。而用4450块反射面板单元拼成的FAST反射面,总面积约达25万平方米。
天文研究是典型的数据密集型科学,数据的采集、存储、管理、分析和可视化已成为天文学研究的新手段和新流程。作为继实验科学、理论科学、计算科学之后的第四种科学发现的模式(“第四范式”),“科学大数据”逐渐成为新的科学发现的基础。FAST项目正是超级计算与观天大数据完美结合的典型范例。可以预见,FAST及其配套的超算中心投入使用后,我国贵州FAST所在地将成为国际天文学界又一重要的科研中心。
FAST作为射电天文学界毋庸置疑的“世界第一天眼”,其对数据存储与计算的需要同样也是“天文级”的。据了解,短期内,FAST的计算性能需求至少需达到每秒200万亿次以上,存储容量需求达到10PB以上。而随着时间推移和科学任务的深入,其对计算性能和存储容量的需求将爆炸式增长,数据量和计算量“大得惊人”。
FAST在设计之中便将配套的超算中心规划在内,凭借在高性能计算和科学大数据方面的长期耕耘,曙光承担了支撑FAST运行的后端高性能计算机的研制和建设工作。日前,首期系统已经建成并投入使用,其机房位于FAST旁边的观测楼一层,可满足FAST未来一年左右观测数据存储和初步分析处理的需求。
据悉,曙光还将针对FAST的需求特点继续在数据的高效存储、数据处理的性能优化、系统的功耗控制和快速交付等方面加强研发,以满足未来FAST运行和相关科学研究需求。
曙光发力科学大数据
其实不光是在天文方面,曙光公司在地球模拟、气象环保、空天大数据、基因研究、天文探测、深度学习等领域都所有涉及。从这些领域的布局,我们可以看到曙光在大数据方面的不走寻常路。
为什么这样说呢?通常我们认为的大数据,更多是企业业务数据或者互联网数据。但是在科学研究数据与日俱增的今天,我们把与科学相关的大数据称之为科学大数据。在曙光看来,科学大数据的开放、共享、挖掘、计算与应用,不仅能推动科学研究的发展,催生新的学科,而且能带动经济发展,造福社会。
比如在气候环境变化,气候灾害和环境危机方面,曙光“地球数值模拟装置”原型系统,就可以通过对自然的观测和数据的积累,以及对这些观测数据进行分析和挖掘,实现对未来气候环境的变化趋势进行预测和预报。
而对于国内日趋严峻大气污染形势,科学大数据再次显现出其助力决策的重要作用。借助曙光的高性能计算集群,可以较准确地预报未来3到7天、甚至更长时间的雾霾情况,通过对可能的雾霾天气进行精准的预报预警,该系统为相关部门采取防控措施、做出相应决策提供了科学依据。
科学大数据集复杂性、综合性、全球性和信息与通信技术高度集成性等诸多特点融于一身,其研究方法也正在从单一学科向多学科、跨学科方向转变,科学大数据正在使科学世界发生变化,科学研究已经进入一个全新的范式——数据密集型科学范式。而曙光可以为科学研究提供融合超级计算、大数据、云计算的融合架构解决方案。
其中,“地球数值模拟装置”原型系统就是典型的代表。原型系统包含高性能计算机硬件、地球数值模拟应用软件、并行软件支撑框架、可视化系统等多个部分,可满足对地球系统的仿真研究。我国地球科学家可借助该系统,在地球系统模式研发、短期气候预测、灰霾治理等方面得出一些对科学和社会有益的成果。
曙光公司为该项目提供的计算机硬件原型系统峰值计算能力不低于1Pflops,存储总容量大于5PB,并针对性地对系统进行了地球系统数值模拟加速计算和软件性能优化。
在雾霾治理方面,中国环境监测总站、中国科学院大气物理研究所、曙光公司、清华大学等多家机构联合研发出了一体化雾霾预报预警系统。在曙光看来,气象预报与雾霾预报有一定的相似之处,都需要大量、高速的运算能力,不同的是数据源和计算模型不一样。当环境监测部门把各个监测点的数据汇集起来,需要一个庞大的计算能力来模拟雾霾的形成和演绎它的走向,通过不断模拟真实的走向,获得精准的空气质量计算模型,最后实现精准的雾霾预报与预警。
所以,曙光的用武之地来了。雾霾预报准确率是个科学问题,取决于多方面的因素,包括污染排放清单的实时性和准确性、气象初始场的准确性、预报模式的科学性和准确性、数值计算的准确度等多方面。而曙光公司提供的雾霾预报一体机可以支持污染排放清单的定期更新和模式参数的动态调节,方便环保用户根据本地大气污染特点进行进一步调整和优化。
结语
凭借在高性能计算市场的耕耘,曙光科学大数据的布局已经初见成效。虽然目前高性能计算领域出现了很多新的变化,但是科学大数据的需求是硬性的,而曙光在这方面可以施展更大的空间。所以,FAST或许会成为曙光在HPC和科学大数据方面的一个标杆项目。
最新资讯
热门视频
新品评测