图1:中科院数据云“一主一备+12分中心”分布式、可扩展存储系统
图2:1992—2012年夜间“一带一路”区域夜间灯光变化数据
图3:大熊猫栖息地保护数据图
图4:大亚湾中微子实验数据传输
图5:近地天体望远镜
图6:太阳射电频谱仪
迅速发展的信息技术正不断助推科研行为方式的变革和科技创新发展。当前,世界各科技强国已经把科研信息化作为21世纪科技创新的战略举措。在我国,科研活动信息化已是提高科研水平和创新能力的必要手段。
作为中国科技的“国家队”,中国科学院(以下简称中科院)一直高度重视科学数据在科研发现、信息化建设中的创新及应用。上世纪70年代,中科院开始建设专业数据库。1982年科学数据库被列入中科院“七五”和后十年的10项重大基本建设项目。1986年国家计委正式批复同意建设“中国科学院科学数据库及其信息系统”,1987年科学数据库数据资源和信息系统正式启动建设,1997年获“中国科学院科技进步一等奖”, 1998年获“国家科技进步二等奖”,基本形成了以研究所和课题组自主自治为单元的科学数据资源建设和积累模式。“十五”期间,科学数据库建设逐步系统化、规范化,共建成503个专业子库。“十一五”期间,在中科院信息化专项和国家科技基础条件平台等支持下,科学数据库逐步形成结构合理的科学数据网格体系,整合可共享数据量达148TB。
“十二五”期间,随着传感器、信息获取等数字技术的不断发展,科学数据也以史无前例的速度急剧增长。面向科技创新和科研信息化新需求,中科院启动“科技数据资源整合与共享工程”建设。“科技数据资源整合与共享工程”涵盖数据存储与管理云服务环境、海量科学数据分析与应用示范、科学数据整合与共享服务等三个子项目,工程着眼于“海·云”服务思想,开展海量存储基础设施服务、海量数据资源共享服务和数据密集型公共支撑服务,全面推进数据环境建设和持续深化数据应用,成为立足中科院,面向科技界,共享开放、服务创新的国家级科技数据中心。
在中科院的统一部署推动、全院50多家下属单位共同参与下,中国科学院计算机网络信息中心作为科学数据库牵头建设和技术支撑单位,紧紧抓住信息技术发展的脉搏,推动科学数据库在建库、整合和应用的全方位成长。科学数据库践行由硬件建设向环境构建、工程化项目向持续化发展方针,以云服务模式为基础,形成支持科研活动与科技创新的数据云,并从基础设施、数据资源、应用平台三大类服务的角度整合集成各类资源和服务,形成中国科学院数据云环境。
从最早“七五”期间15家单位、21个数据库,发展到目前“十二五”期间58家单位、1340个数据库,中国科学院数据云整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享数据量已从2.68GB增加到655TB,年均在线访问超过千万人次。“十二五”期间,共发表论文751篇,申请软件著作权55项、专利30项。累计为131项科研项目提供了数据支持和服务,在支持科研项目、支撑学科发展和服务经济社会发展等方面均取得良好的效果。项目积累的存储、处理与应用等资源整合为数据云一站式服务的相关技术,为持续推动科学数据云发展打下了坚实基础。
一、面向科研创新前沿 构建科研服务新模式
中科院数据云以数据资产为核心,充分利用先进的云计算技术,整合数据全生命周期的重要设施与资源,是现代科研创新体系的重要组成,是大数据科研成果服务于社会应用的示范平台。
中科院数据云环境为科研活动提供以海量存储设施为基础的云存储、云归档、虚拟机和数据云等服务,为科学数据管理和共享提供运行支撑环境,为科研创新活动存储提供了有效保障。截止到2015年,中科院数据云存储环境运行服务总容量达52PB,云存储规模达8PB,共拥有物理服务器约300台,虚拟机5000+的计算服务能力。数据归档总容量达38PB,拥有归档能力大于20TB/天,在线磁盘阵列容量达到2PB,近线磁带库存储容量达到30PB的归档系统。建成布局中科院、直达各所的“一主一备+12分中心”的分布式、可扩展存储系统,提供满足国标5级的“同城双中心”、“两地三中心”的高等级灾备服务。
“十二五”期间中科院数据云形成以基础设施云服务、科研数据云服务、数据应用云服务为主体的多层次、交叉式信息化服务体系。中科院计算机网络信息中心通过研发部署云计算系统,为中科院信息化专项、先导专项、重点基金项目、科技支撑计划等项目提供支持。以生物信息学分子数据分析环境、地理空间数据云、DViz大数据可视化等应用的开发,示范了多学科领域数据、模型及云服务应用的技术手段与服务模式。2015年8月,中科院网络中心成功申请并获批我国首批试点网络连续性出版物,创办《中国科学数据》期刊,探索建立科学数据产权保护的新方法,推动科学数据出版与数据引用,进一步促进我国科学数据资源的开放与共享。
在服务科研的同时,中科院数据云面向社会需求不断加强产业化创新服务,提升拓展技术优势。在交通管理、食品安全、新材料研发等公共领域,中科院计算机网络信息中心与国家发改委、食药监总局、北京地税等三十多家企事业单位开展相关合作。2012年获得中国产学研创新合作奖,2013年获批成立大数据应用服务技术北京工程实验室。2014年、2015年先后两年成功举办科学数据大会,吸引了来自全国科研院所、高校以及相关企业参加。
二、中科院数据云成果五大亮点