天文界流传着这样一句话:“建设天文望远镜是一个不断缩小梦想的游戏。”在中国科学院自动化研究所有这样一支研究团队,他们参与研制的高带宽专用实时计算平台已应用于500米口径球面射电望远镜FAST,正和FAST共赴“问天”之旅。
日前,该团队负责人、自动化所国家专用集成电路设计工程技术研究中心(以下简称集成中心)研究员蒿杰告诉《中国科学报》记者:“可以说,我们为FAST量身打造了专属的数据计算平台。”
打造FAST专属计算平台
2016年9月25日,FAST在贵州省平塘县的喀斯特洼坑中落成启用,并开始接收来自宇宙深处的电磁波。FAST搭载的高带宽专用实时计算平台是国际首台3GHZ@12bit以上高带宽数据采集—分析—直存一体化平台,在天文观测领域具有重要意义。
作为世界第一大单口径射电望远镜,FAST的主要工作是接收来自宇宙的海量信息。蒿杰介绍,高带宽专用实时计算平台肩负着两个任务:一是如何快速有效获取、存储这些信息;二是如何计算这些数据,及时从海量数据中获取有用信息,产出有用的科学成果。
据专家估算,FAST前5年总体数据存储需求为20PB,是“天河二号”超级计算机存储容量的1.6倍。蒿杰指出:“不仅如此,FAST 3GHZ带宽的高频率覆盖范围在为科学研究带来便利的同时,也对后端计算平台性能提出了极高的要求。”
他进一步解释,以FAST重要任务之一——快速射电爆探测为例,要在浩如烟海的数据中找到持续时间不到一秒钟的射电信号,对平台的计算能力、高精度数据同步能力、高带宽数据处理及直接存储能力是极大的考验。
此外,望远镜使用周期较长,可进行研究的科学目标较多,不同的研究目标需要不同的配置。这要求后端计算平台具备灵活的可配置性和扩展性。
针对FAST计算平台的这些“高”要求,蒿杰带领研究团队在计算节点架构、低延时高可靠交换网络、可配置IO平台、大型系统整体互连与高效存储结构方面提出了关键性创新架构。
团队自主研发了高速数据交织采集模块、高带宽数据综合变频—并行分路模块、可局部互连的异构实时加速模块、高带宽数据直存模块、管控模块以及配套软件算法,实现了高实时计算,差异化传输下的多源异构海量数据存储、交换及管理,智能化开发及系统管理等。
目前,FAST高带宽专用实时计算平台已初具规模,建成了数据存储与处理集群,具备高速数据直存功能。已部署的数据平台包括谱线数据处理平台、脉冲星数据处理平台、远程数据处理与同步软件等。
该系统经过FAST全系统协调观测,已经得到第一批科学数据,整体运行良好。当记者问及这个平台将会产生什么样的科学成果时,蒿杰的回答是:“希望在不久的将来,脉冲星数据处理平台能为我国新一代的脉冲星导航作出贡献、用我们的谱线数据处理平台能够发现来自星际的有机物分子。”
天文射电领域的认可
高性能数字信号处理器研制是自动化所集成中心的传统优势。2011年,大型信号与数据处理整机系统设计开始结缘天文射电领域,集成中心在新疆承担了国家天文台“天籁”阵列望远镜后端计算平台的设计,为暗能量射电探测提供了有力支持。
蒿杰说:“作为该领域首台国产设备,它摆脱了国内大型干涉探测阵列长期使用国外产品的现状,在可支撑采样精度及系统计算功耗比方面甚至高于国外产品。”
在这个项目中,蒿杰团队创新性地提出了局部计算交换一体化可配置处理单元的概念,解决了大规模全相关处理的数据滞阻问题。“其中,平台架构设计充分考虑了系统的可扩展性和可配置性,仅通过调整系统子卡与尾板,就满足了用户设计指标及方案的多次更改,没有新增任何开发成本”。
接下来几年里,团队在国内天文射电专用计算领域越做越专业,先后参与了位于新疆的国家天文台宇宙第一缕曙光探测21cm阵列(21CMA)、南山25m射电望远镜等多个项目,他们研制的处理平台被美国相中,入选美国在南非建设的HERA大型射电探测阵的实时中央信号处理单元。
国际知名的天文数字后端研发组织CASPER已将蒿杰团队的产品作为其下一代处理设备进行推广。蒿杰团队还作为我国CSP(中央信号处理)工作包的牵头人,加入了国际大科学工程SKA(Square Kilometre Array),承担核心处理集群的研制。
蒿杰欣喜地发现,自己团队的工作得到了国际天文射电研究领域的认可。
大数据处理不再是难题
通过六年多的不断积累,蒿杰团队已实现天文信号采集和核心计算模块的自主知识产权国产化,为我国大型望远镜工程建设提供了核心技术支持。
成绩背后是团队艰辛的付出。射电望远镜大多建设在人迹罕至、自然条件恶劣的地方,“从白雪皑皑的新疆大红柳峡,到气温高达50摄氏度的南非小镇,团队成员长期驻扎在现场进行联调联试,身体经受着巨大考验。”谈及这些,蒿杰笑着说:“条件虽然很艰苦,但是我们也获得了回报,还是很值得。”
既能仰望星空,又能融入产业,蒿杰所说的“回报”是一系列专用领域的大数据处理技术。
通过国家天文台大科学装置FAST实际建设中的历练,蒿杰团队积累了完整的创新型科学数据中心建设经验,在高实时、可配置计算节点架构、差异化传输下的多源异构海量数据高效存储、交换、智能化开发及系统管理、大数据环境下的设备自闭环分析及配置方面形成了完整的技术体系,可以为有专用领域数据处理需求的行业提供有力支撑。
目前,蒿杰团队已经和电力科学研究院、南瑞集团、工程物理研究院等单位进行合作,在大型电网安全计算、电力电子仿真、能源系统仿真等领域进行产品推广应用。
在蒿杰研究团队成员的心里有一个共同的梦想:让快速精准的大数据处理不再成为难题。