基于Hadoop的数值预报产品服务平台设计与实现被引量：33

Design and Implementation of NWP Data Service Platform Based on Hadoop Framework

下载PDF

导出

摘要数值预报产品数据与日俱增,采用传统的关系型数据库对其进行存储和管理存在效率低和存储能力不足的问题。另外,基于文件的存储方式在数据存储处理、数据读取和算法计算等方面存在性能瓶颈。针对这一问题,基于Hadoop技术体系设计了分布式的数据存储模型,实现了数值预报产品数据的分布式存储和处理,开发了数值预报产品数据接入处理模块;并实现了基于Rest Web Service的获取数值预报产品要素场数据访问接口、时间序列数据访问接口、数据下载接口等业务应用接口。多业务用户的实际业务测试表明,该平台在诸如数值预报产品气象数据处理和业务应用方面较传统技术架构具有一定优势。 As the numerical weather prediction （NWP） products increase in huge amounts every day, traditional relational database has the problem of low efficiency in archiving capacity and management, while file based storage faces performance challenges in long-time-series data accessing and massive computation of spatial-temporal data. Therefore, a three-tier software framework is designed, which implements distributed data storage model, parallel data access service and distributed computation for frequently used statistical algorithms based on Hadoop framework. Meteorological big data such as NWP products, radar 3D mosaic and satellite remote sensing are designed to be composed of metadata and data entity, which both are stored in Hbase data tables, and man- aged with HDFS file system. Metadata are defined by variable name, dimension, latitude, longitude, altitude and lead time etc. , and data entity consists of row key, time stamp and column family to store the value at each grid point. A Rest （representational state transfer） Web Service is setup for direct NWP data acquisition, field data clipping and location based time-series accessing. File download services in ＂MICAPS＂, ＂surfer＂ and ＂json＂ format are also ready for the third-party meteorological software. System testing for data access of CHAF model shows that it costs only 12 seconds to write in 1000 NWP data fields each with 82503 grid points, and less than 4 seconds to read out the same amount of data from the distribu- ted databases. Map-reduce scheme are implemented for computation of meteorological algorithms, e. g. , Kalman fil- ter and successive regression. Most of meteorological statistical algorithms are time independent, which make it possible that a task is divided into small sub-tasks according to data slicing on time series, and assigned to different computational nodes in map programs. Reduce programs are to gather and summarize the result of sub-task computation. With data amount and users increasing, Hadoop framework deployed on several X86 PC servers demonstrates performance advantage over single IBM power system. And flexible hardware architecture from 3 computational nodes to 9 nodes show steady and better data access efficiency with good speed-up ratio, which brings more confidence for practical use in weather forecast. Operational trial in multi-user environment further shows advantages of this cloud-like computing service over the traditional client-server model in meteorological data mining, such as NWP interpretation and model evaluation.

作者李永生曾沁徐美红石小英

机构地区广东省气象信息中心

出处《应用气象学报》 CSCD 北大核心 2015年第1期122-128,共7页 Journal of Applied Meteorological Science

基金广州市科技计划项目(2012Y2-00031 2013Y2-00053 2013Y2-00074) 公益性行业(气象)科研专项(GYHY201106009) 广东省气象局重点项目(2012A01)

关键词 Hadoop技术体系气象数据 WEB Service接口 Hadoop framework meteorological data Web Service interface

分类号 P456.7 [天文地球—大气科学及气象学]

引文网络
相关文献

参考文献16

1李集明,沈文海,王国复.气象信息共享平台及其关键技术研究[J].应用气象学报,2006,17(5):621-628. 被引量：90
2王伯民,李集明,吴增祥,邓莉,臧海佳,刘黎平,刘瑞霞,吴贤纬.我国气象科学数据发布策略初步研究[J].应用气象学报,2004,15(B12):152-160. 被引量：8
3宋连春,肖风劲,李威.我国现代气候业务现状及未来发展趋势[J].应用气象学报,2013,24(5):513-520. 被引量：31
4Randriamampianina R. Radiance-bias correction for a limited area model. Quarterly Journal of the Hungarian Meteorological Service ,2005(3) :636.
5王萍,刘颖,王汉芝,刘环珠.基于格点场数据的沙尘暴双预报模型[J].天津大学学报,2006,39(3):329-333. 被引量：4
6王涵,李玲,孙学庆,宋庆武.CMACast内蒙古气象信息Web平台的设计与实现[J].气象科技,2014,42(2):283-286. 被引量：10
7吴焕萍,张永强,孙家民,邵鹏程.气候信息交互显示与分析平台(CIPAS)设计与实现[J].应用气象学报,2013,24(5):631-640. 被引量：27
8Aguilera M K, Merchant A, Shah M, et al. Sinfonia: A New Paradigm for Building Scalable Distributed Systems. Proc of the 21st ACM Symp on Operating Systems Prinei-ples, 2007: 159-174.
9杨锋,吴华瑞,朱华吉,张海辉,孙想.基于Hadoop的海量农业数据资源管理平台[J].计算机工程,2011,37(12):242-244. 被引量：35
10林春泽,智协飞,韩艳,王靖宇.基于TIGGE资料的地面气温多模式超级集合预报[J].应用气象学报,2009,20(6):706-712. 被引量：82

二级参考文献134

1项贻强,李毅,周畅,周逊盛.桥梁结构在线健康监测预警系统Ⅰ——监测评估预警体系和模块设计[J].长沙交通学院学报,2009,25(1):26-31. 被引量：11
2周秀骥.对地球系统科学的几点认识[J].地球科学进展,2004,19(4):513-515. 被引量：31
3丁一汇,李清泉,李维京,罗勇,张培群,张祖强,史学丽,刘一鸣,王兰宁.中国业务动力季节预报的进展[J].气象学报,2004,62(5):598-612. 被引量：83
4丁一汇.我国短期气候预测业务系统[J].气象,2004,30(12):11-16. 被引量：31
5沈文海,赵芳,高华云,高峰,马强.国家级气象资料存储检索系统的建立[J].应用气象学报,2004,15(6):727-736. 被引量：54
6杨学胜,张卫民,陈德辉.网格计算及其在气象中的应用[J].气象,2005,31(2):79-82. 被引量：5
7李集明,熊安元.气象科学数据共享系统研究综述[J].应用气象学报,2004,15(B12):1-9. 被引量：47
8王国复,李集明,邓莉,何小明.中国气象科学数据共享服务网总体设计与建设[J].应用气象学报,2004,15(B12):10-16. 被引量：37
9周秀骥.21世纪的大气科学──纪念中国气象学会成立70周年[J].气象学报,1994,52(3):257-260. 被引量：35
10周秀骥,吴国雄,郑国光,符淙斌,徐祥德.中国气象科学技术发展战略研究[J].地球科学进展,2005,20(3):261-267. 被引量：12

共引文献322

1秦昆,周扬,黄静,刘娟,喻雪松,高牧寒,刘东海,高谢庆.地球系统模式理论与技术研究综述[J].华南地理学报,2023(1):36-50. 被引量：1
2朱桦,智协飞,俞永庆.Applications of Bias-removed Ensemble Mean in the Gale Forecasts over the Yellow Sea and the Bohai Sea[J].Meteorological and Environmental Research,2010,1(11):4-8. 被引量：3
3方萌.中国气象卫星数据共享服务现状和未来发展[J].气象科技进展,2011,1(3):50-54. 被引量：1
4邓莉,王伯民,李庆祥,尹新怀.数据访问控制在气象信息服务平台中的应用[J].计算机工程,2011,37(S1):139-141. 被引量：3
5魏敏.气象高性能计算应用服务环境适应性研究[J].气象,2015,41(1):92-97. 被引量：10
6李俊,杜钧,陈超君.“频率匹配法”在集合降水预报中的应用研究[J].气象,2015,41(6):674-684. 被引量：61
7王婧,徐枝芳,范广洲,刘佩廷,李泽椿.GRAPES_RAFS系统2m温度偏差订正方法研究[J].气象,2015,41(6):719-726. 被引量：43
8李集明,熊安元.气象科学数据共享系统研究综述[J].应用气象学报,2004,15(B12):1-9. 被引量：47
9武勇.植物造景在现代城市景观设计中的应用[J].山西科技,2005(5):93-94. 被引量：2
10王旻燕,邓莉,张洪政,臧海佳.国外气象卫星数据集的引进及其应用价值浅析[J].中国科技资源导刊,2008,40(3):42-45. 被引量：1

同被引文献344

1胡洋.基于深度学习的SDN虚拟蜜网路由优化[J].计算机系统应用,2020(10):274-279. 被引量：3
2陈辉,王守忠,杜成林,赵洪升,张艳春,王黎晖.基于B/S架构的气象科技管理信息系统[J].气象科技,2005,33(S1):165-168. 被引量：15
3查石祥.NetCDF数据的编程式访问[J].气象科技,2004,32(z1):40-43. 被引量：24
4胡志晋.层状云人工增雨机制、条件和方法的探讨[J].应用气象学报,2001,12(z1):10-13. 被引量：129
5陶树旺,刘卫国,李念童,王广河,周毓荃,胡志晋.层状冷云人工增雨可播性实时识别技术研究[J].应用气象学报,2001,12(z1):14-22. 被引量：71
6周毓荃,张存.河南省新一代人工影响天气业务技术系统的设计、开发和应用[J].应用气象学报,2001,12(z1):173-184. 被引量：40
7李茂仑,金德镇,汪晓梅,汪沛沛,张丽萍.飞机人工增雨空地传输系统[J].应用气象学报,2001,12(z1):194-199. 被引量：18
8池文羽,周杰,杜景林.基于Android人工影响天气智能终端的研制与应用[J].湖北农业科学,2013,52(4):940-943. 被引量：3
9董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量：71
10熊亚军,廖晓农,李梓铭,张小玲,孙兆彬,赵秀娟,赵普生,马小会,蒲维维.KNN数据挖掘算法在北京地区霾等级预报中的应用[J].气象,2015,41(1):98-104. 被引量：53

引证文献33

1王霄,孙建印,侯宜广,吕翔,李曼.徐州市霾天气监测预报预警平台设计[J].价值工程,2017,36(6):183-187. 被引量：1
2陈正旭,孙晓燕,滕舟.一种基于混合编程的NC文件WebService接口实现方法[J].气象科技,2017,45(1):36-41. 被引量：4
3曾沁,李永生.基于分布式计算框架的风暴三维追踪方法[J].计算机应用,2017,37(4):941-944. 被引量：3
4王建荣,唐怀瓯,金素文.基于HBase的数值预报产品存储检索应用[J].电子技术与软件工程,2017(10):159-162.
5陈正旭,李爽爽,孙晓燕.一种基于NoSQL的气象非结构化数据产品存储方法[J].气象科技,2017,45(3):430-434. 被引量：12
6王建荣,季刚.海量自动气象站分钟数据存储检索系统设计[J].计算机与现代化,2017(9):40-44. 被引量：10
7高嵩,毕宝贵,李月安,王若瞳,代刊.MICAPS4预报业务系统建设进展与未来发展[J].应用气象学报,2017,28(5):513-531. 被引量：41
8罗敬宁,刘立葳.遥感大数据分布式技术研究与实现[J].应用气象学报,2017,28(5):621-631. 被引量：13
9肖华东,孙婧,孙朝阳,聂元丁,赵春燕,郭锋,常飚,张新诺,刘立明.中国气象局S2S数据归档中心设计及关键技术[J].应用气象学报,2017,28(5):632-640. 被引量：8
10王若曈,王建民,黄向东,董一峰,龙明盛.MICAPS4服务端系统架构设计[J].应用气象学报,2018,29(1):1-12. 被引量：23

二级引证文献194

1李炜,黄倩.基于区块链技术的机器人运行数据抗篡改存储方法[J].科技通报,2021,37(11):65-68. 被引量：2
2孔凡强,刘坤,张剑,王旻雯,戴煜炜.基于WebGIS的气象数据实时可视化研究[J].现代测绘,2023,46(6):31-34. 被引量：2
3夏正龙,姚蓉,朱亮,钟艳雯.基于Spark的探空逆温识别算法实现[J].湖北农业科学,2021,60(S01):335-339. 被引量：1
4易心.CIS的意义与作用[J].湖南包装,2000,15(1):41-43.
5黄启珠.最佳沟通:咨询成败的关键[J].中外管理导报,2000(3):24-26.
6梁勇.获取最佳咨询效果的途径[J].中外管理导报,2000(3):27-27.
7洪燕云.创新思维与创新技法的应用[J].茶叶机械杂志,2000(2):1-2. 被引量：2
8魏志强,王璐.基于历史观测数据的飞行航路点温度估算方法[J].气象科技,2018,46(6):1116-1123. 被引量：1
9李丙辉,高志弘,侯波,张宁.抚顺市霾天气监测系统设计[J].农业灾害研究,2017,7(4):35-36.
10赵文芳,刘旭林.Spark Streaming框架下的气象自动站数据实时处理系统[J].计算机应用,2018,38(1):38-43. 被引量：16

1武茹芳,刘效文,郭五娃.微机在气象数据处理中的应用[J].山西气象,1995(3):34-37.
2江燕如,梁汉明.MICAPS人机交互系统及其应用介绍[J].气象教育与科技,1997(4):34-37. 被引量：1
3李江南.GIS在气象数据处理中的应用[J].广东气象,2002,24(4):14-15. 被引量：34
4曾咺,张艳军.基于ArcGIS的重庆市环保应用服务平台集成[J].中国科技成果,2009(21):34-36.
5丁昊,谭美景,王万历,张晓楠.北斗数据接入中间件的设计与实现[J].测绘工程,2013,22(3):20-23. 被引量：4
6高煜中.气象数据处理系统维护的有关问题及解决方法[J].黑龙江气象,1995,12(1):58-59.
7陈颖健.虚拟天文台[J].国外科技动态,2003(5):29-31.
8刘宣飞.使用GrADS绘图软件的几点体会[J].气象教育与科技,1999,21(1):48-53.
9赵磊,刘吉平.空间数据库在清江GIS系统中的应用[J].水利水电技术,2003,34(3):57-59. 被引量：1
10国网北京电力推进海量平台高频数据接入研究支撑大数据分析应用和业务提升[J].农电管理,2016,0(11):6-6.

应用气象学报

2015年第1期

浏览历史

内容加载中请稍等...

基于Hadoop的数值预报产品服务平台设计与实现被引量：33

参考文献16

二级参考文献134

共引文献322

同被引文献344

引证文献33

二级引证文献194

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的数值预报产品服务平台设计与实现 被引量：33

参考文献16

二级参考文献134

共引文献322

同被引文献344

引证文献33

二级引证文献194

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的数值预报产品服务平台设计与实现被引量：33