生物多样性是人类共同的财富,也是人类社会赖以生存和可持续发展的基础。为了摸清中国生物多样性的家底,中科院生物多样性委员会自2007年起组织国内外100多位分类学专家,依据物种2000标准数据格式,每年编研、更新《中国生物物种名录》,并与全球生物物种名录实现信息共享。2015版《中国生物物种名录》,包括了动物界、细菌界、色素界、真菌界、植物界、原生动物界和病毒等七个部分,共收录物种8.3万个,编研过程中参考了中国动物志数据库,中国动物名录数据库、动物名称引证数据库。《中国生物物种名录》的编研和发布为生物多样性保护政策和规划的制定提供科学依据,为开展生物多样性科学研究提供基础数据,为公众参与生物多样性保护创造必要条件,是中国贯彻实施《中国生物多样性保护战略与行动计划》和积极履行《生物多样性公约》的具体行动。
(五)大数据撬动创业创新新应用
在信息经济发展迅猛的今天,大数据扮演生产要素的角色,让数据在碰撞中聚变,充分释放大数据的价值,带动“大众创业、万众创新”是中科院数据云的应用目标,虽然我国基于大数据的创业、创新业务和服务模式还不成熟,但却意味着更多机会,中科院数据云实际应用中已不断涌现出基于大数据的新尝试和探索。
1.灾种、救灾数据库为应急救灾提供灾害预测等创新服务
2014年10月,广东登革热疫情严重,为了支撑军事医学科学院的救灾防疫行动,“资源学科领域基础科学数据整合与集成应用”为其提供了广东省乡镇级数字地图、广东省面状人口数据和GDP数据、广东省土地利用数据直接应用于疫情聚集区的分析、重点采取防控区域的确定、传播风险的预测,为防疫救灾和危险评估提供了保障。
2015年4月,尼泊尔发生8.1级地震。“资源学科领域基础科学数据整合与集成应用”人地系统主题数据库迅速反应,第二天就整理出灾区及周边范围的基础地理、冰川冰湖、人口及社会经济、土地覆盖、历史地震资料等15个数据集,无限制、无偿向公众开放下载。通过开放尼泊尔数据直通车,快速集成不同灾种、救灾阶段所需要的数据资源和产品,为应急救灾提供无障碍的无偿共享服务,成为科学救灾的重要依据。
2.DNA条形码标准参考数据库助力森林公安快速破案
随着分子生物学的快速发展,DNA条形码为快速的物种鉴定提供了分子水平的精细分类学标准。该技术通过建立一套基于标准短基因片段的数字化序列文库来实现物种鉴定。
森林公安、海关等有关部门在打击野生动物盗猎、珍稀植物砍伐时,很多时候发现的是一些骨头,毛皮,甚至是一些木屑等不完整样本,而依法追责一定要鉴定出这些是动植物的具体信息。中科院昆明植物研究所在获得迪庆州森林公安的木屑标本后,通过与其建设的标准数据库进行比对,不仅鉴定出这些木屑来自红豆杉,而且准确地告诉了这些红豆杉大概生活区域,即采伐地。森林公安凭借这份鉴定报告,快速地破获了这起盗伐偷运案件。
3.语言资源库促进人工智能领域产品研发
中科院自动化所中文语言资源库项目在建立和整合语言资源的基础上,形成系列化的标准和规范,整合百余套数据库,建立了数据支撑服务平台,大大提高了语料库的有效获取和共享利用,并积极开展与企业合作,将语料库应用到企业的创新技术、新产品研发中。平台的数据库大量应用于30余个企业的技术研发,支持包括百度在内的商业公司的产品研发中。基于“语音合成语料库”等数据资源研发的语音合成技术,已与三星和联想分别合作,应用在其多款手机中。
“十三五”期间,在国家大数据行动背景下,以中科院“率先行动”计划为行动指南,面向智慧中科院发展愿景,中科院数据云将以科研需求为牵引,社会应用为落脚点,继续推动科学大数据的整合与开放、提高科学大数据为科学家与公众的服务,探索科学数据库发展和共享服务新模式。
科学大数据正在使科学世界发生变化,促进数据密集型科研范式的产生。中科院数据云先进的发展理念和有效的运行机制,有力的引导和整合了科学数据基础性工作,将科学数据战略机遇转化,成为数据密集型科学发现的制高点和前沿阵地。科技引领着社会的发展,面对“互联网+”、“万众创新、创业”的时代号召,科学大数据将释放出巨大潜力,在社会管理、民生保障、产业发展方面提供新的动能。(记者李建荣 通讯员 张 杨)