基于并行Apriori的物流路径频繁模式研究被引量：6

Research on Logistics Path Frequent Patterns Based on Parallel Apriori

下载PDF

导出

摘要传统的频繁路径挖掘分析主要通过关联规则算法实现,但其在处理大型数据集时,会产生占用内存过多,数据处理速度慢等问题,对此提出一种基于Fuzzy c-means聚类算法的并行Apriori算法模型。该模型通过Fuzzy c-means算法完成对原始数据集的聚类分析,将同一区域的物流路径数据划分到内部相似度较高的数据类,并利用Apriori算法对各数据类中的频繁模式进行挖掘分析,进而获得各区域的物流频繁路径。同时通过Hadoop平台实现算法的并行化,有效提高算法运行效率和质量。通过对物流频繁路径的挖掘分析,使管理者更清楚货物流向,可为配送路径优化等决策提供支持。 The traditional method of frequent path mining analysis is realized by the association rule algorithm. However,when dealing with large data sets, the traditional association rules algorithm will take up too much memory and process data slowly. In this paper, a parallel Apriori algorithm based on Fuzzy c-means clustering algorithm is proposed. The model performs clustering analysis of the original data set by Fuzzy c-means algorithm, divides the logistics path data which is considered as the same district into a data cluster with high similarity. Then the model utilizes the Apriori algorithm to mine the frequent paths in this district, so as to obtain the frequent logistics path of each area. Meanwhile, the algorithm is parallelized through the Hadoop platform, which can effectively improve the efficiency and the quality of the algorithm.Through the analysis of the frequent path of logistics, managers can better understand the flow of goods and make the decision of the optimization of the delivery path.

作者曹菁菁任欣欣徐贤浩 CAO Jingjing;REN Xinxin;XU Xianhao(College of Logistics Engineering, Wuhan University of Technology, Wuhan 430063, China;School of Management, Huazhong University of Science and Technology, Wuhan 430074, China)

机构地区武汉理工大学物流工程学院华中科技大学管理学院

出处《计算机工程与应用》 CSCD 北大核心 2019年第11期257-264,共8页 Computer Engineering and Applications

基金国家自然科学基金重点国际(地区)合作与交流项目(No.71620107002) 国家自然科学基金青年项目(No.61502360)

关键词大数据频繁路径 HADOOP FUZZY c-means聚类算法 APRIORI算法 big data frequent path Hadoop Fuzzy c-means clustering algorithm Apriori algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1苏桂贤.数据挖掘技术在物流配送管理中的应用[J].赤峰学院学报（自然科学版）,2013,29(22):76-77. 被引量：2
2过杭斌.数据挖掘及其在物流运输系统中的应用研究[J].物流技术,2011,30(5):79-81. 被引量：1
3郑军,金贻,鄢吉多,石生金.数据挖掘技术在物流管理中的应用[J].贵阳学院学报（自然科学版）,2013,8(2):32-34. 被引量：4
4唐颖峰,陈世平.一种面向分布式数据流的闭频繁模式挖掘方法[J].计算机应用研究,2015,32(12):3560-3564. 被引量：6
5程军锋.基于人工蜂群算法的数据流聚类研究[J].首都师范大学学报（自然科学版）,2015,36(6):24-29. 被引量：1
6于彦伟,王沁,邝俊,何杰.一种基于密度的空间数据流在线聚类算法[J].自动化学报,2012,38(6):1051-1059. 被引量：28

二级参考文献62

1黄晓英,张剑芳,徐世莲.信息融合技术在智能物流运输系统中的应用[J].包装工程,2004,25(3):74-75. 被引量：6
2陈卓,孟庆春,魏振钢,任丽婕,窦金凤.一种基于网格和密度凝聚点的快速聚类算法[J].哈尔滨工业大学学报,2005,37(12):1654-1657. 被引量：14
3朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报,2006,17(3):379-387. 被引量：51
4魏新军.数据挖掘物流企业提升竞争力的利器[J].中国储运,2007(1):94-95. 被引量：5
5陆锋段滢滢袁文.LBS的数据处理技术[J].中国计算机学会通讯,2010,.
6Guha S, Meyerson A, Mishra N, Motwani R, O'Callaghan L. Clustering data streams: theory and practice. IEEE Trans-actions on Knowledge and Data Engineering, 2003, 15(3): 515-528.
7Han J W, Kamber M. Data Mining Concepts and Tech- niques. Beijing: China Machine Press, 2006. 196-211.
8Ester M, Kriegel H P, Sander J, Xu X W. A density-based algorithm for discovering clusters in large spatial databases with noise. In: Proceedings of the 2nd International Confer- ence on Knowledge Discovery and Data Mining. Portland, USA: AAAI Press, 1996. 226-231.
9Sander J, Ester M, Kriegel H P, Xu X W. Density-based clustering in spatial databases: the algorithm GDBSCAN and its applications. Data Mining and Knowledge Discov- ery, 1998, 2(2): 169-194.
10Hinneburg A, Keim D A. An efficient approach to clustering in large multimedia databases with noise. In: Proceedings of the 4th International Conference on Knowledge Discov- ery and Data Mining. New York, USA: AAAI Press, 1998. 58-65.

共引文献36

1于彦伟,王沁,王小东,王欢,何杰.面向实时查询处理的轨迹流挖掘框架[J].仪器仪表学报,2012,33(12):2803-2811. 被引量：1
2于翔,印桂生,许宪东,王建伟.一种基于区域划分的数据流子空间聚类方法[J].计算机研究与发展,2014,51(1):88-95. 被引量：15
3张亚昕.基于移动对象轨迹段分割的聚类算法研究[J].计算机与数字工程,2014,42(1):69-72. 被引量：1
4张建朋,陈福才,李邵梅,刘力雄.基于密度与近邻传播的数据流聚类算法[J].自动化学报,2014,40(2):277-288. 被引量：28
5张玉峰,曾奕棠.物流信息分析研究现状与趋势展望[J].情报杂志,2014,33(6):87-92. 被引量：6
6冉娟,任琼.关于大数据存储过程中缺失信息检测仿真[J].计算机仿真,2018,35(12):451-455. 被引量：3
7吴振涛,闵俊.关于移动网络数据流断点区优化检测仿真研究[J].计算机仿真,2019,36(1):470-474. 被引量：3
8何杰,徐诚,刘飞,吕默威,王沁.一种多区域多目标TOA实时定位系统信道分配协议[J].计算机科学,2014,41(7):167-170. 被引量：1
9于彦伟,王欢,王沁,赵金东.面向海量数据流的基于密度的簇结构挖掘算法[J].软件学报,2015,26(5):1113-1128. 被引量：3
10颜宏文,周雅梅,潘楚.基于宽度优先搜索的K-medoids聚类算法[J].计算机应用,2015,35(5):1302-1305. 被引量：5

同被引文献76

1梁霏霏,孙佳英.包车模式中多约束条件下的路径规划[J].物流技术与应用,2019,0(11):138-141. 被引量：1
2赵永尊,张谧,赵卫东,李银胜.基于品类聚类的关联规则优化算法[J].计算机应用与软件,2007,24(1):140-142. 被引量：1
3张永,迟忠先.一种高效的基于采样的关联规则挖掘算法[J].计算机工程与应用,2007,43(2):184-186. 被引量：2
4马占欣,黄维通,陆玉昌.相关度计算方法存在的问题及修正[J].计算机工程,2007,33(11):67-69. 被引量：13
5林佳雄,黄战.基于数组向量的Apriori算法改进[J].计算机应用与软件,2011,28(5):268-271. 被引量：14
6张宗郁,张亚平,张静远,张晓君.改进关联规则算法在高校教学管理中的应用[J].计算机工程,2012,38(2):75-77. 被引量：9
7刘芳.基于图和双向搜索的频繁项集挖掘算法[J].计算机工程,2012,38(1):59-61. 被引量：2
8苗苗苗,王玉英.基于矩阵压缩的Apriori算法改进的研究[J].计算机工程与应用,2013,49(1):159-162. 被引量：29
9田坤明,王瑞,由天辉,廖鑫龙.高血压前期的患病率、危险因素和干预[J].实用医学杂志,2013,29(8):1357-1359. 被引量：17
10高海洋,沈强,张轩溢,赵志军.一种基于数据压缩的Apriori算法[J].计算机工程与应用,2013,49(14):117-120. 被引量：6

引证文献6

1冯云霞,韩正亮,薛蓉蓉,宋波.心血管疾病并发症与虚弱症关联模式研究[J].计算机与现代化,2020,0(7):85-89. 被引量：2
2李祎.基于Apriori算法的石油钻井电气设备故障诊断方法研究[J].电子设计工程,2020,28(22):11-15. 被引量：10
3周翔,蔡声镇.基于粒度计算的大数据集频繁项挖掘方法[J].计算机仿真,2020,37(12):287-290. 被引量：1
4王洋.改进量子粒子群算法的物流配送路径优化研究[J].自动化技术与应用,2021,40(7):14-17. 被引量：2
5孙宇博,胡晶,刘鑫.基于灰色理论的船舶应急物流优化模型仿真[J].计算机仿真,2022,39(4):487-491. 被引量：2
6吴春旭,贾银山,于红绯.一种Apriori算法的高效实现方法及其应用[J].辽宁石油化工大学学报,2023,43(2):78-85. 被引量：1

二级引证文献18

1任美洲.煤层气钻井过程中的储层保护技术研究[J].云南化工,2021,48(3):131-132. 被引量：1
2肖驰夫,黄建波,周忠武.浅议基于分解产物分析的SF6电气设备故障检测方法[J].中国设备工程,2022(7):163-164. 被引量：3
3常硕,梁杰,姜久超.基于模拟退火算法的水电站电气装置故障运行状态自动捕捉方法[J].水利水电技术（中英文）,2022,53(3):110-118. 被引量：9
4薛志勇.钻井现场电气设备常见故障诊断与排除方法[J].中国设备工程,2022(12):162-164. 被引量：2
5梁欢,张凯,王瑞源,杨子涵,陈科琪.基于图像识别的石油钻井漏层位置精准检测方法[J].中国石油和化工标准与质量,2022,42(12):43-44. 被引量：2
6蔡明,季茜,李培德.一种基于距离相关方法计算非线性相关系数的算法[J].科学与信息化,2022(15):40-43.
7林昕怡,齐媛媛,周琪琪,张璐,陈杉艳.草莓对人类慢性疾病防治作用的研究进展[J].热带农业工程,2022,46(3):4-10.
8兰福全,邹涛,刘伟超.石油钻井机械设备质量控制及现场管理研究[J].中国设备工程,2022(15):38-40. 被引量：3
9王军燕,蒯宏伟,王道静.施工作业现场信息化数据采集,监控及分析[J].微型电脑应用,2022,38(8):105-109. 被引量：2
10崔兵,朱保国,薛启航.浅析石油钻井电气设备漏电故障自动预警方法[J].中国设备工程,2023(11):139-141. 被引量：3

1袁紫微.基于改进遗传算法的冷链物流路径优化[J].山东工业技术,2019(10):216-216. 被引量：2
2严青.大数据在图书馆管理与服务中的实践探索[J].发明与创新（初中生）,2019(2):127-127. 被引量：3
3叶丽.城市冷链物流配送路径优化策略[J].科技风,2019(8):248-248. 被引量：2
4张珏.基于改进的Apriori算法在网络教学平台中频繁访问路径研究[J].无线互联科技,2018,15(20):144-146. 被引量：1
5邹建华.基于混合遗传算法的物流路径优化方法探讨[J].计算机产品与流通,2018,7(12):128-128.
6冀巨海,张璇.考虑取送作业的生鲜农产品配送路径优化模型与算法[J].系统科学学报,2019,27(1):130-135. 被引量：14
7柯研,王希龙,郑钰辉.深度迁移学习简介[J].数码世界,2018(11):37-37.
8秦洪岩,冯瑶.Apriori算法在商业银行功能测试中的应用[J].中国金融电脑,2019(6):58-60. 被引量：1
9刘炎宝,王珂,杨智勇,王思静.考虑碳排放与新鲜度的冷链物流配送路径优化[J].江西师范大学学报（自然科学版）,2019,43(2):188-195. 被引量：16
10谭学怡,蔡文学,赵雅兰.基于非线性能量消耗的电动车配送路径优化[J].物流工程与管理,2019,41(4):95-98. 被引量：2

计算机工程与应用

2019年第11期

浏览历史

内容加载中请稍等...

基于并行Apriori的物流路径频繁模式研究被引量：6

参考文献6

二级参考文献62

共引文献36

同被引文献76

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于并行Apriori的物流路径频繁模式研究 被引量：6

参考文献6

二级参考文献62

共引文献36

同被引文献76

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于并行Apriori的物流路径频繁模式研究被引量：6