当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long sh...当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)网络分别应用在中文地址分词任务中,并采用四词位标注法以及增加未标记数据集的方法提升分词性能。在自建数据集上的实验结果表明,中文地址分词任务应用Bi-LSTM网络结构能得到较好的性能,在增加未标记数据集的情况下,可以有效提升模型的性能。展开更多
由于传统网络入侵检测方法的局限性无法满足当前网络安全需要,为提高网络入侵检测的准确率,引入机器学习算法,提出一种基于BiLSTM(bi-directional long short-term memory)和注意力机制的网络入侵检测方法。利用BiLSTM网络进行长距离依...由于传统网络入侵检测方法的局限性无法满足当前网络安全需要,为提高网络入侵检测的准确率,引入机器学习算法,提出一种基于BiLSTM(bi-directional long short-term memory)和注意力机制的网络入侵检测方法。利用BiLSTM网络进行长距离依赖特征提取,利用DNN(deep neural network)提取更深层次的特征,引入注意力机制增加对特征重要性的计算,通过softmax分类器获得分类结果。使用NSL_KDD数据集作为实验数据,实验结果表明,相比于对比方法,该方法有效提高了入侵检测的准确率,验证了该方法的有效性。展开更多