还记得《流浪地球2》中的“数字生命计划”吗?为了生成海量数字化的人类意识,它必须仰仗“未来航天中心计算机”的算力支持。而科幻已照进现实。
驱车从乌镇往桐乡方向,一座蓝瓦瓦的玻璃房伫立在我面前,这就是久闻大名的“乌镇之光”。它有“超强大脑”——数据存储能力达60PB,整体计算能力跻身国际前列。凭借天赋异禀,它服务长三角地区、辐射全国多地,自去年3月投运以来,已经为7000多家科研院所、高新企业等提供算力服务。
最近,我跟随运维人员走进“乌镇之光”,前往生命科学和生态环境两个应用场景,体验无形而强大的计算力量。
一秒钟运算量相当于14亿人算7年
这间占地面积529平方米的玻璃房子,四周走廊环绕,6880台运算设备(又称“节点”)按照两侧、四层排布,中间留出一条过道。
置身这座“超强大脑”里,可以看到工作中的计算节点闪着绿灯,耳边传来“啪嗒啪嗒”的阀门开关声。这里的计算能力有多强?运维人员告诉我,如果每人每秒进行一次运算,那么14亿人要连续算7年,才能赶上“乌镇之光”一秒钟的运算量。
强大的计算能力源于核心硬件之一“异构加速器”,运维人员打了个比方:通用处理器就像几个大学教授,可以解出高数难题;而异构加速器就像几千个小学生,可以运算大量简单重复的“1+1”,正适合大数据运算场景。“小学生们”同时记数和算数,最终统一输出,这就需要大家有相近的速度。所以,每位“小学生”都必须搭载过硬配件,形成训练有素的队伍。
溯源检测每段基因来自哪个细胞
在墨卓生物科技(浙江)有限公司,我见证了“乌镇之光”帮助技术人员通过一块肿瘤样本发掘出上亿生命密码本的全过程。
这家公司主打单细胞基因测序技术,该技术在全球范围内都是个“新奇物”。公司资深科学家徐云飞博士介绍,传统的基因测序,是把多个细胞内的基因混在一起,获得平均结果;然而,来自人体同一组织的两个细胞之间仍然有约万分之一的序列差异。
实现单细胞测序,就能探索基因如何调控单个细胞的命运轨迹和生老病死。“这也为精准医疗提供了可能,比如某块肿瘤组织中可能有近10%是癌细胞,精准识别有助于研发专门靶向癌细胞的特效药。”他说。
在“墨卓生物”,技术人员使用单细胞基因测序技术处理生物样本,查看“乌镇之光”解码基因的结果报告。 受访者供图
生物实验室里,“全副武装”的技术人员解离小鼠肿瘤样本获得细胞悬液,并滴在“微流控芯片”上。“注入细胞悬液、分子标签微球和其他多种生化反应试剂,完成细胞和分子标签微球一一匹配,就像把每个细胞单独关进小房间,派发代表生日和出生地等信息的身份证。”徐云飞说。将处理好的芯片送入机器中,10分钟,数万个细胞就能拿到“身份证”。随后经过基因测序流程,上亿生命密码本编制完成。接下来,“乌镇之光”正式登场。办公大厅里,程序员们正在电脑上输入长串的分析样本和参考基因组等代码,实现和“乌镇之光”对话和下达任务。该公司程序员徐丽婷介绍,海量测序数据需要与“身份证”匹配,进行多组学对比分析,“这样大的运算量,普通计算机连打开文件都做不到,必须委托‘乌镇之光’。”
两个多小时后,“乌镇之光”轻松完成任务,并反馈一份近30G的报告。报告显示,这块样本检测到8898个细胞,数据质量良好。“这些精确到单细胞水平的基因测序信息,可以用来溯源检测到的每段基因来自哪个细胞,也可以进一步了解细胞之间如何联系和相互作用。”徐云飞说。目前,该公司已完成超过1000例样本测试,将各地的“生命天书”汇入“乌镇之光”求解。
探知15天内空气“健康”状态
“长三角受弱气压场控制,中北部良至轻度污染,短时可达中度污染,南部以良为主,首要污染物为PM2.5。”这样的空气质量预报是怎么来的?我来到浙江省生态环境监测中心,看“乌镇之光”如何探知空气“健康”状态。
为了给我说明技术原理,中心大气环境监测部副部长徐冰烨翻出一份PPT示意图。“空气质量预报需要综合污染排放源和气象条件两方面因素。”她说,不过,两方面数据不能简单叠加。可以想象,刮风下雨可能产生上升、沉降等物理变化,不同污染物相遇可能出现化学反应,这些数据要纳入复杂的大气模式系统,通过大数据运算来模拟时空变化,从而得出空气质量的仿真结果。
“我们从去年5月开始和‘乌镇之光’合作,运算速率提升近8倍,各类情景在5小时内都能出结果。”徐冰烨说,通过“乌镇之光”的计算,预报的最小空间单位从原来的4km×4km精确到1km×1km,最小时间单位缩减到1小时内,而预报时长则从5天延长到15天甚至更长。不仅如此,预报结果还能为治气决策做参谋。徐冰烨翻出了2022世界互联网大会乌镇峰会的总结资料:“我们和‘乌镇之光’合作,运用浙江省大气预报预警模式系统,提前9天预测到乌镇将出现会期PM2.5浓度高值过程。”治理从何着手?必须反向解析颗粒物来源。为预防可能出现的短时超标,他们通过区域源解析和行业源解析,提前通知乌镇当地相关行业进行精准治理。
上午11时,当日预报出炉。徐冰烨打开平台进行人工订正,稍后将预报结果送到长三角区域空气质量预测预报中心和中国环境监测总站。“这个平台能够对接国家和长三角相关平台,实现数据共享、预报预警联动,今年还将支持亚运环境保障。”她说。
(浙江日报记者 胡静漪)