-
题名基于大数据分析的拉萨市纳木措景区形象感知分析
被引量:1
- 1
-
-
作者
拉巴顿珠
吴翔
珠杰
-
机构
西藏大学信息科学技术学院
西藏大学省部共建西藏信息化协同创新中心
-
出处
《高原科学研究》
CSCD
2021年第3期92-100,共9页
-
基金
西藏自治区自然科学基金项目(XZ2019ZRG-09(Z))
西藏大学培育计划项目(ZDCZJH21-10)
+1 种基金
藏语文传承与发展之藏汉双向机器翻译平台建设项目(藏财预指[2020]1号)
2020年西藏大学大学生创新性实验训练计划项目(2020XCX055).
-
文摘
文章以拉萨市纳木措景区为例,通过搜集和分析各大在线旅游平台的游记类评论文本,分析游客对旅游目的地景区的综合形象感知。结果显示:(1)游客对纳木措景区的整体印象出现频率最高的关键词为海拔、雪山、湖水。(2)游客对景区环境、旅行体验、景区服务3个方面的情感得分较高,且多以积极评论为主。(3)游客对景区厕所、停车场、饮食体验方面的评价普遍偏低,且多以消极评论为主。
-
关键词
大数据
情感分析
形象感知
纳木措
拉萨
-
Keywords
Big data
emotion analysis
Image perception
Namtso
Lhasa City
-
分类号
F592.7
[经济管理—旅游管理]
-
-
题名结合级联技术的藏文预训练命名实体识别模型
被引量:1
- 2
-
-
作者
徐泽辉
珠杰
许泽洲
汪超
严松思
刘亚姗
-
机构
西藏大学信息科学技术学院
省部共建西藏信息化协同创新中心
-
出处
《中文信息学报》
CSCD
北大核心
2023年第11期23-28,共6页
-
基金
西藏大学提升计划项目(ZDTSJH21-07)
西藏大学培育计划项目(ZDCZJH21-10)
+3 种基金
西藏大学珠峰学科建设计划项目(zf22002001)
国家自然科学基金(62066042)
教育部人文社会科学研究项目(21YJCZH059)
2021年西藏自治区高校人文社会科学研究项目(SK2021-24)。
-
文摘
命名实体识别是藏文自然语言处理中的一项关键任务,该文提出了结合三种藏文预训练模型(Word2Vec、ELMo、ALBERT)的Casade-BiLSTM-CRF结构。级联技术(Cascade)将藏文命名实体识别划分为两个子任务(实体边界划分,实体类别判断)分阶段进行,简化了模型结构;使用藏文预训练模型,能更好地学习藏文先验知识。实验表明,Cascade-BiLSTM-CRF模型相比于BiLSTM-CRF模型训练一轮时间缩短了28.30%;而将级联技术与预训练技术相结合,在取得更好识别效果的同时还缩短了模型训练时间。
-
关键词
藏文命名实体识别
级联
预训练
-
Keywords
Tibetan NER
cascade
pre-training
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向语音合成的藏语同音字研究
被引量:2
- 3
-
-
作者
尼玛
珠杰
拉巴顿珠
-
机构
西藏大学信息科学技术学院
省部共建西藏信息化协同创新中心
-
出处
《西藏科技》
2022年第3期67-72,共6页
-
基金
西藏大学研究生高水平人才培养计划项目“面向语音合成的藏语同音字研究”(2019-GSP-S119)
西藏大学校级培育基金项目“藏文预训练技术与应用”(000606941035)。
-
文摘
文章以目前在前端语言模型中较为突出的字音转换问题为研究对象,结合藏语本身特有的语音特点,一是研究了藏语语音结构,以及语音合成中藏语同音字的发音规律。二是较为全面的统计及分析了藏语同音字的发音归类问题,并根据统计及归类结果,把18738个字中除341个字(没有同音字)之外的其余字归类为2539个同音字类别。三是通过拉丁转写方式对同音字定义了读音标记,给出的2880个音素覆盖了所有18738个藏字。
-
关键词
藏语同音字
音素统计
语音合成
-
分类号
H214
[语言文字—少数民族语言]
-
-
题名MP-CMLMs模型的藏汉机器翻译研究
被引量:1
- 4
-
-
作者
严松思
珠杰
汪超
-
机构
西藏大学信息科学技术学院
省部共建西藏信息化协同创新中心
-
出处
《计算机与数字工程》
2023年第2期401-404,410,共5页
-
基金
国家自然科学基金项目(编号:62066042)
教育部人文社会科学研究项目(编号:21YJCZH059)
+4 种基金
2021年西藏自治区高校人文社会科学研究项目(编号:SK2021-24)
西藏大学提升计划项目(编号:ZDTSJH21-07)
西藏大学培育计划项(编号:ZDCZJH21-10)
西藏大学珠峰学科建设计划项目(编号:zf22002001)
西藏大学高水平人才培养计划项目(编号:2020-GSP-S176)资助。
-
文摘
论文使用mask-predict解码扩展CMLMs模型,研究了藏汉神经机器翻译方法。并且针对该模型进行改进。在不同领域藏汉数据集上,经过实验,与非自回归模型NAT和标准的Transformer模型进行比较,在不降低解码速度的情况下,与非自回归模型相比提升了4个BLEU以上;与标准的Transformer模型相比能够达到甚至超过Transformer模型性能,同时解码速度更快。
-
关键词
汉藏神经机器翻译
非自回归模型
掩码预测
-
Keywords
Chinese-Tibetan neural machine translation
non-autoregressive model
mask-predict
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名藏文虚词知识融合的藏汉机器翻译方法研究
- 5
-
-
作者
严松思
珠杰
汪超
刘亚姗
许泽洲
徐泽辉
-
机构
西藏大学信息科学技术学院
-
出处
《中央民族大学学报(自然科学版)》
2024年第1期20-27,共8页
-
基金
国家自然基金项目(62066042)
教育部人文社会科学研究项目(21YJCZH059)
+4 种基金
2021年西藏自治区高校人文社会科学研究项目(SK2021-24)
西藏大学提升计划项目(ZDTSJH21-07)
西藏大学培育计划项目(ZDCZJH21-10)
西藏大学珠峰学科建设计划项目(zf22002001)
西藏大学2020级高水平项目(2020-GSP-S176)。
-
文摘
针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer模型和mBART模型上进行了实验,使用轮数集成和不同网络结构集成来提高最终模型的泛化能力。对比实验证明,藏文虚词知识融合算法与模型集成策略可以提升藏汉机器翻译的翻译效果,最高可以达到38.05个BLEU。
-
关键词
藏文虚词知识融合
机器翻译
模型集成
-
Keywords
knowledge fusion of Tibetan function words
machine translation
model integration
-
分类号
TP391
[自动化与计算机技术]
-