“就在几天前,我刚去了一趟中国天眼。为了让它看到宇宙更深处,捕获更多的脉冲星,我们团队正在改进数据传输的准确度。就像是送数据‘快递’,每999万个会弄丢1个,我们的目标是要把‘丢包’率再降低一到两个数量级。”中国天眼(500米口径球面射电望远镜,简称FAST)正式向全世界开放之际,中科院上海高等研究院感知与计算实验室祝永新研究员正忙着提高FAST海量数据的传输准确度。
【让FAST更加“耳聪目明”】
FAST产生的海量数据到底有多少?据介绍,FAST的接收面积相当于30个足球场大小,每秒钟产生38GB的数据。这意味着,用不了7秒,数据量就能挤爆一个256GB的手机。如果这些海量数据不能及时处理,将对后续的传输、存储和信息处理带来很大的困扰。在早期研究中,祝永新团队通过预处理把数据无损压缩到三分之一,大大减缓了海量数据的传输压力。
中科院国家天文台的科学家需要对这些数据进行大规模计算,把原始信号转换成可以观察的图谱。“我们针对感知的数据进行了定制化计算,帮助科学家在海量数据中实现‘海选’而不是‘盲选’,部分关键算法的效率提高了5到10倍,并有信心进一步提高。”祝永新告诉解放日报·上观新闻记者,数据传输得更快,计算得更有效,这样FAST在发现科学目标时就会更加“耳聪目明”。
值得一提的是,FAST只是定制计算的应用场景之一。祝永新介绍,定制计算已应用于国产大飞机试飞数据和国家电网关键设备的异常处理。通过对大规模物联网数据进行实时分析,可检测甚至预测到异常情况的发生,以防患于未然。
【为了发现更多脉冲星】
FAST自去年1月验收以来,发现脉冲星数量已达300颗。为发现更多脉冲星,以及一些更奇特的天体比如双脉冲星,祝永新课题组与FAST科研人员开发了新的机器学习方法,将天文学家从每天需要看近万张图谱中解放出来,只需关注百余张图谱即可。
“要让FAST看到宇宙更深处,我们团队一方面正在改进数据传输的准确度,另一方面正在研制脉冲星单相干消色散处理原型机,以实现更强的抗干扰能力。”祝永新说。
据悉,作为平方公里阵列射电望远镜(SKA)的先导项目,祝永新团队在FAST数据处理中取得的部分成果有望在2023年开始建设的SKA中有所体现。
文中图片由采访对象提供未经正式授权严禁转载本文,侵权必究