期刊文献+
共找到32,097篇文章
< 1 2 250 >
每页显示 20 50 100
基于Transformer和Text-CNN的日志异常检测
1
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 TRANSFORMER text-CNN
在线阅读 下载PDF
Method to Remove Handwritten Texts Using Smart Phone
2
作者 Haiquan Fang 《Journal of Harbin Institute of Technology(New Series)》 CAS 2024年第2期12-21,共10页
To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spat... To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spatial Pyramid Pooling(FCN-AC-ASPP).For a picture taken by a smart phone,firstly,the image is transformed into a regular image by the dewarping algorithm.Secondly,the FCN-AC-ASPP is used to classify printed texts and handwritten texts.Lastly,handwritten texts can be removed by a simple algorithm.Experiments show that the classification accuracy of the FCN-AC-ASPP is better than FCN,DeeplabV3+,FCN-AC.For handwritten texts removal effect,the method of combining dewarping and FCN-AC-ASPP is superior to FCN-AC-ASP alone. 展开更多
关键词 handwritten texts printed texts CLASSIFICATION FCN-AC-ASPP smart phone
在线阅读 下载PDF
A Comparative Study of Artificial Intelligence and Translation Software in Chinese-English Translation:A Focus on Literary and Technical Texts
3
作者 LIU Yong-shan 《Journal of Literature and Art Studies》 2024年第9期815-820,共6页
In recent years,the domain of machine translation has experienced remarkable growth,particularly with the emergence of neural machine translation,which has significantly enhanced both the accuracy and fluency of trans... In recent years,the domain of machine translation has experienced remarkable growth,particularly with the emergence of neural machine translation,which has significantly enhanced both the accuracy and fluency of translation.At the same time,AI also showed its tremendous advancement,with its capabilities now extending to assisting users in a multitude of tasks,including translation,garnering attention across various sectors.In this paper,the author selects representative sentences from both literary and scientific texts,and translates them using two translation software and two AI tools for comparison.The results show that all four translation tools are very efficient and can help with simple translation tasks.However,the accuracy of terminology needs to be improved,and it is difficult to make adjustments based on the characteristics of the target language.It is worth mentioning that one of the advantages of AI is its interactivity,which allows it to modify the translation according to the translator’s needs. 展开更多
关键词 Artificial Intelligence translation software literary texts technical texts
在线阅读 下载PDF
From text to image:challenges in integrating vision into ChatGPT for medical image interpretation
4
作者 Shunsuke Koga Wei Du 《Neural Regeneration Research》 SCIE CAS 2025年第2期487-488,共2页
Large language models(LLMs),such as ChatGPT developed by OpenAI,represent a significant advancement in artificial intelligence(AI),designed to understand,generate,and interpret human language by analyzing extensive te... Large language models(LLMs),such as ChatGPT developed by OpenAI,represent a significant advancement in artificial intelligence(AI),designed to understand,generate,and interpret human language by analyzing extensive text data.Their potential integration into clinical settings offers a promising avenue that could transform clinical diagnosis and decision-making processes in the future(Thirunavukarasu et al.,2023).This article aims to provide an in-depth analysis of LLMs’current and potential impact on clinical practices.Their ability to generate differential diagnosis lists underscores their potential as invaluable tools in medical practice and education(Hirosawa et al.,2023;Koga et al.,2023). 展开更多
关键词 IMAGE DIAGNOSIS text
在线阅读 下载PDF
Study on the Textual Coherence Function of Conjunctions in Political Texts and Their Translation Reconstruction
5
作者 Goya Guli Kader Jingwen Qiao Aixia Yang 《Journal of Contemporary Educational Research》 2024年第1期25-30,共6页
The assessment of translation quality in political texts is primarily based on achieving effective communication.Throughout the translation process,it is essential to not only accurately convey the original content bu... The assessment of translation quality in political texts is primarily based on achieving effective communication.Throughout the translation process,it is essential to not only accurately convey the original content but also effectively transform the structural mechanisms of the source language.In the translation reconstruction of political texts,various textual cohesion methods are often employed,with conjunctions serving as a primary means for semantic coherence within text units. 展开更多
关键词 Political texts CONJUNCTIONS textual cohesion Chinese to Russian translation
在线阅读 下载PDF
How are texts analyzed in blockchain research?A systematic literature review
6
作者 Xian Zhuo Felix Irresberger Denefa Bostandzic 《Financial Innovation》 2024年第1期2304-2338,共35页
This paper provides a systematic literature review of text analysis methodologies used in blockchain-related research to comprehend and synthesize existing studies across disciplines and define future research directi... This paper provides a systematic literature review of text analysis methodologies used in blockchain-related research to comprehend and synthesize existing studies across disciplines and define future research directions.We summarize the research scope,text data,and methodologies of 124 papers and identify the two most common combinations of these dimensions:(1)papers that focus on specific cryptocurrencies tend to apply sentiment analysis to instant user-generated content or news articles to discover the correlations between public opinion and market behavior,and(2)studies that examine the broad concept of blockchain with text data from documents published by companies tend to apply topic modeling techniques to explore classifications and trends in blockchain development.We discover five major research topics in the academic literature:relationship discovery,cryptocurrency performance prediction,classification and trend,crime and regulation,and perception of blockchain.Based on these findings,we highlight three potential research directions for researchers to select topics and implement suitable methodologies for text analysis. 展开更多
关键词 Blockchain text analysis Systematic literature review Machine learning algorithm Topic modeling Sentiment analysis
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
7
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 text-to-SQL数据集
在线阅读 下载PDF
基于Self-Attention和TextCNN-BiLSTM的中文评论文本情感分析模型
8
作者 龙宇 李秋生 《石河子大学学报(自然科学版)》 北大核心 2025年第1期111-121,共11页
目前关于中文评论文本的情感分类方法大都无法充分捕捉到句子的全局语义信息,同时也在长距离的语义连接或者情感转折理解上具有局限性,因而导致情感分析的准确度不高。针对这个问题,本文提出一种融合SelfAttention和TextCNN-BiLSTM的文... 目前关于中文评论文本的情感分类方法大都无法充分捕捉到句子的全局语义信息,同时也在长距离的语义连接或者情感转折理解上具有局限性,因而导致情感分析的准确度不高。针对这个问题,本文提出一种融合SelfAttention和TextCNN-BiLSTM的文本情感分析方法。该方法首先采用文本卷积神经网络(TextCNN)来提取局部特征,并利用双向长短期记忆网络(BiLSTM)来捕捉序列信息,从而综合考虑了全局和局部信息,在特征融合阶段,再采用自注意力机制来动态地融合不同层次的特征表示,对不同尺度特征进行加权,从而提高重要特征的响应。实验结果表明,所提出的模型在家电商品中文评论语料和谭松波酒店评论语料数据集上的准确率分别达到93.79%和90.05%,相较于基准模型分别提高0.69%~3.59%和4.44%~11.70%,优于传统的基于卷积神经网络(Convolutional Neural Networks, CNN)、BiLSTM或CNN-BiLSTM等的情感分析模型。 展开更多
关键词 自注意力机制 中文评论文本 深度学习 情感分析
在线阅读 下载PDF
Multilingual Text Summarization in Healthcare Using Pre-Trained Transformer-Based Language Models
9
作者 Josua Käser Thomas Nagy +1 位作者 Patrick Stirnemann Thomas Hanne 《Computers, Materials & Continua》 2025年第4期201-217,共17页
We analyze the suitability of existing pre-trained transformer-based language models(PLMs)for abstractive text summarization on German technical healthcare texts.The study focuses on the multilingual capabilities of t... We analyze the suitability of existing pre-trained transformer-based language models(PLMs)for abstractive text summarization on German technical healthcare texts.The study focuses on the multilingual capabilities of these models and their ability to perform the task of abstractive text summarization in the healthcare field.The research hypothesis was that large language models could perform high-quality abstractive text summarization on German technical healthcare texts,even if the model is not specifically trained in that language.Through experiments,the research questions explore the performance of transformer language models in dealing with complex syntax constructs,the difference in performance between models trained in English and German,and the impact of translating the source text to English before conducting the summarization.We conducted an evaluation of four PLMs(GPT-3,a translation-based approach also utilizing GPT-3,a German language Model,and a domain-specific bio-medical model approach).The evaluation considered the informativeness using 3 types of metrics based on Recall-Oriented Understudy for Gisting Evaluation(ROUGE)and the quality of results which is manually evaluated considering 5 aspects.The results show that text summarization models could be used in the German healthcare domain and that domain-independent language models achieved the best results.The study proves that text summarization models can simplify the search for pre-existing German knowledge in various domains. 展开更多
关键词 text summarization pre-trained transformer-based language models large language models technical healthcare texts natural language processing
在线阅读 下载PDF
Heimtextil grows and starts with over 3,000 exhibitors and design icon Patricia Urquiola
10
《China Textile》 2025年第1期54-55,共2页
On January l4,Heimtextil kicked off the new trade fair year with over 3,000 exhibitors from 65 countries.With steady growth,the leading trade fair for home and contract textiles and textile design is strongly position... On January l4,Heimtextil kicked off the new trade fair year with over 3,000 exhibitors from 65 countries.With steady growth,the leading trade fair for home and contract textiles and textile design is strongly positioned.This makes it a reliable platform for international participants.At the opening,architect and designer Patricia Urquiola presented her installation'among-us'at Heimtextil. 展开更多
关键词 textiles EXHIBITOR text
在线阅读 下载PDF
Heimtextil 2025:以纺织连接世界
11
作者 张娜 《纺织导报》 2025年第2期79-82,共4页
2025年法兰克福国际家用及商用纺织品展览会(Heimtextil 2025)于1月14—17日在德国法兰克福举行,在为期4天的展会期间,来自全球142个国家及地区的展商与观众到场参与,进一步巩固了Heimtextil作为全球首屈一指的家用及商用纺织品与纺织... 2025年法兰克福国际家用及商用纺织品展览会(Heimtextil 2025)于1月14—17日在德国法兰克福举行,在为期4天的展会期间,来自全球142个国家及地区的展商与观众到场参与,进一步巩固了Heimtextil作为全球首屈一指的家用及商用纺织品与纺织设计展会的地位。 展开更多
关键词 德国法兰克福 text 纺织品 展会 HE
在线阅读 下载PDF
基于TextRank和自注意力的长文档无监督抽取式摘要
12
作者 邢玲 程兵 闫强 《计算机应用与软件》 北大核心 2025年第3期274-283,共10页
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA... 针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRAO利用TextRank对句子打分;利用自注意力重新表示每个句子融合整个文档信息的分布式向量,在此基础上计算句子间余弦相似度,作为TextRank边的权重参与迭代计算,给句子打分;将两种得分加权求和作为句子最终得分。两种模型均根据得分对句子进行排序得到候选摘要。为去除摘要冗余性,利用最大边界相关法(Maximal Marginal Relevance,MMR)在候选摘要中选取摘要句子。将提出的两种模型在构建的长文档上进行实验,与TextRank方法相比,所提方法在ROUGE评价指标上有显著提高。 展开更多
关键词 中文长文本摘要 textRank 自注意力机制 分布式向量表示 语义信息 融合文档信息
在线阅读 下载PDF
全球家纺行业的韧性:Heimtextil 2025展览规模创新高
13
作者 钟梦夏 《中国纺织》 2025年第1期96-97,共2页
1月14日至17日,Heimtextil 2025法兰克福国际家用及商用纺织品展览会(以下简称“Heimtextil 2025”)在德国法兰克福展览中心隆重举行。这场为期四天的展会,来自全球142个国家和地区的3000多家展商聚集于此,50000多名观众参与其中,展商... 1月14日至17日,Heimtextil 2025法兰克福国际家用及商用纺织品展览会(以下简称“Heimtextil 2025”)在德国法兰克福展览中心隆重举行。这场为期四天的展会,来自全球142个国家和地区的3000多家展商聚集于此,50000多名观众参与其中,展商数量、观众数量、观众满意度等多项数据再创新记录。 展开更多
关键词 展览规模 家纺行业 法兰克福展览 观众满意度 text 纺织品 He
在线阅读 下载PDF
基于改进TF-IDF的FastText新闻文本分类算法
14
作者 李卫卫 葛欣杭 刘晓丹 《电脑与电信》 2025年第1期27-31,共5页
新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本... 新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本数据,以验证该模型的分类性能。实验结果表明,所提分类模型的财经新闻文本分类精确率达到95.82%,相较于对比方案,最高提升6.91%,证明所提方案具有一定的有效性以及可行性,能够有效提升新闻文本分类效果。 展开更多
关键词 新闻文本分类 Fasttext 特征因子 离散度 改进TF-IDF
在线阅读 下载PDF
针对文本情感分类任务的textSE-ResNeXt集成模型 被引量:8
15
作者 康雁 李浩 +2 位作者 梁文韬 宁浩宇 霍雯 《计算机工程与应用》 CSCD 北大核心 2020年第7期205-209,共5页
针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截... 针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截取语料主要情感部分,针对不同中、英文情感词典进行情感程度关系划分以此获得不同情感程度的子数据集。在textSE-ResNeXt神经网络模型中采用了动态卷积核策略,以此对文本数据特征进行更为有效的提取,模型中融合了SEnet和ResNeXt,有效地进行了深层次文本特征的抽取和分类。将不同情感程度的子集上对textSE-ResNeXt模型采用投票集成的方法进一步提高分类效率。分别在中文酒店评论语料和六类常见英文分类数据集上进行实验。实验结果表明了本模型的有效性。 展开更多
关键词 文本情感分类 textsE-ResNeXt 特征划分 集成模型
在线阅读 下载PDF
A Functionalist Approach to the Translation of Allusions in Chinese Tourism Texts
16
作者 王红霞 《海外英语》 2016年第9期149-151,共3页
Allusions are very common in Chinese tourism texts. When translating them, translators should make the translated version both understandable and acceptable. With Nord's documentary translation and instrumental tr... Allusions are very common in Chinese tourism texts. When translating them, translators should make the translated version both understandable and acceptable. With Nord's documentary translation and instrumental translation, this paper explores how to apply these two translation processes to the translation of allusions in Chinese tourism texts. 展开更多
关键词 ALLUSION tourism text DOCUMENTARY TRANSLATION INSTRUMENTAL TRANSLATION
在线阅读 下载PDF
On Creative Strategies for Translating Guangxi Tourism Texts into English under the Perspective of ASEAN
17
作者 杨建娣 《海外英语》 2016年第7期138-139,143,共3页
Guangxi tourism texts are a kind of tool to show China's image.However,there are still lots of problems despite certain achievements in recent years in Chinese-to-English(C-E) translation of tourism texts.So,how t... Guangxi tourism texts are a kind of tool to show China's image.However,there are still lots of problems despite certain achievements in recent years in Chinese-to-English(C-E) translation of tourism texts.So,how to improve the quality of tourism materials is of great significance practically.The aim is to adopt the"Creation"Thought of Guo Moruo that emphasizes creation,charming translation,having empathy with the source language and experience,aiming at discovering proper and feasible translation standards and strategies and making it better serve for the tourism development between Guangxi and ASEAN countries. 展开更多
关键词 Tourism texts TRANSLATING into ENGLISH Creation THOUGHT Translation STRATEGIES
在线阅读 下载PDF
融合BERT和TextGCN模型的文本分类方法
18
作者 郑磊 黄萍 朱惠娟 《信息与电脑》 2024年第21期19-22,共4页
文本分类涉及人工智能、自然语言处理(Natural Language Processing,NLP)等多个领域,具有重要的学术研究意义和商业应用价值。如何使计算机准确提取到文本中的有效信息,并实现自动分类已成为当前的研究热点。文章提出BERT–Text GCN模型... 文本分类涉及人工智能、自然语言处理(Natural Language Processing,NLP)等多个领域,具有重要的学术研究意义和商业应用价值。如何使计算机准确提取到文本中的有效信息,并实现自动分类已成为当前的研究热点。文章提出BERT–Text GCN模型,将大规模预训练BERT模型和文本图卷积网络Text GCN模型相结合,实现文本分类任务。BERT–Text GCN模型构建一个异构图,通过联合训练BERT模块和Text GCN模块的双向编码器表示,有效地学习图的结构信息和节点间的关联信息,增强文本分类能力。实验表明,BERT–Text GCN模型在文本分类任务中取得了比以往模型更好的分类效果。 展开更多
关键词 文本分类 BERT 词嵌入 text GCN
在线阅读 下载PDF
基于改进TextRank的科技文本关键词抽取方法 被引量:4
19
作者 杨冬菊 胡成富 《计算机应用》 CSCD 北大核心 2024年第6期1720-1726,共7页
针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过... 针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过迭代计算得到词语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘KCore子图得到词语的层级特征,利用平均信息熵特征衡量词语的主题表征能力;最后,在词语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。 展开更多
关键词 科技文本 关键词抽取 textRank K-Core图 平均信息熵
在线阅读 下载PDF
The Organizational Patterns of English and Chinese Texts:A Contrastive Study 被引量:1
20
作者 Liu Lijin, Foreign Languages Training CenterGuangdong University Of FOreign StudiesGuangzhou, P R. China 510421 《现代外语》 CSSCI 北大核心 1999年第4期408-409,共2页
Thispapercontrastivelystudies,basedonthetheoreticframeworkof'topicanalysis'byvanDijkandsomeothers,theunderlyingarrangementpatternsoftopicsofEnglishandChinesetexts.Theoverallobjectiveistoexaminethediscoursepatt... Thispapercontrastivelystudies,basedonthetheoreticframeworkof'topicanalysis'byvanDijkandsomeothers,theunderlyingarrangementpatternsoftopicsofEnglishandChinesetexts.TheoverallobjectiveistoexaminethediscoursepatternsofarepresentativesampleofEnglishandCh... 展开更多
关键词 text TOPIC ORGANIZATIONAL PATTERN CONTRASTIVE study
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部