• 全国中文核心期刊
  • 中国人文社会科学核心期刊
  • 中文社会科学引文索引(CSSCI)来源期刊
  • 国家社会科学基金学术期刊资助入选期刊
公众号 二维码

形式语义知识驱动的中文伪情感句智能识别模型

周红照

周红照. 形式语义知识驱动的中文伪情感句智能识别模型[J]. 外国语, 2023, 46(3): 13-20.
引用本文: 周红照. 形式语义知识驱动的中文伪情感句智能识别模型[J]. 外国语, 2023, 46(3): 13-20.
ZHOU Hongzhao. An Intelligent Recognition Model for Chinese Pseudo-sentiment Sentences Driven by Formal Semantic Knowledge[J]. Journal of Foreign Languages, 2023, 46(3): 13-20.
Citation: ZHOU Hongzhao. An Intelligent Recognition Model for Chinese Pseudo-sentiment Sentences Driven by Formal Semantic Knowledge[J]. Journal of Foreign Languages, 2023, 46(3): 13-20.

形式语义知识驱动的中文伪情感句智能识别模型

基金项目: 

国家社会科学基金项目“中文情感计算的形式语义逻辑研究” 22CYY023

详细信息
    作者简介:

    周红照,博士,副教授。研究方向:计算语言学

  • 中图分类号: H030

An Intelligent Recognition Model for Chinese Pseudo-sentiment Sentences Driven by Formal Semantic Knowledge

  • 摘要:

    情感因子(情感词、情感短语、情感句式)是情感句的必要不充分条件,有效鉴别包含情感因子但并不表达情感意义的“伪情感句”,是过滤噪声、提升情感句识别准确率的关键一环。本文首先基于语料归纳和同义词扩展,总结出七类鉴别“伪情感句”的语义特征——主观愿望类、主观猜度类、假设让步类、目的计划类、疑问询问类、建议要求类、客观指涉类;然后将每一类型的具体词语添加到语义词典中,赋予其xjc(情感消解词语)的语义标记,制定“情感消解因子+情感因子=伪情感句”等情感消解规则,取消受情感消解因子语义管辖的情感因子的情感倾向;最后用Python将情感词典、语义词典、情感消解规则等知识本体编程实现为中文情感分析系统CUCsas的伪情感句过滤模块,实验准确率为91.0%,召回率为87.7%,F1值为89.3%。

    Abstract:

    Sentiment factors, including sentiment words, phrases and structures, are necessary but not sufficient conditions for identifying sentiment sentences."Pseudo-sentiment sentences" contain sentiment factors but do not convey any sentiment meanings, and the effective identification of such sentences is a crucial step in improving the accuracy of sentiment sentence recognition.In this paper, we first summarize seven types of semantic features for identifying pseudo-sentiment sentences based on corpus induction and synonym expansion, namely subjective desire, subjective conjecture, hypothesis and concession, purpose and plan, question and inquiry, suggestion and request, and objective reference.Next, specific words (tokens) for each type are added to the semantic lexicon, given the semantic mark of "XJC" (sentiment dissolving word), and sentiment dissolving rules such as "sentiment dissipation factor + sentiment factor = pseudo-sentiment sentence" are formulated to eliminate the sentiment bias of sentiment factors governed by sentiment dissolving factors.Finally, knowledge ontology (sentiment lexicon, semantic lexicon, and sentiment dissolving rules) is programmed in Python to implement the pseudo-sentiment sentence filtering module of CUCsas, a Chinese sentiment analysis system.The experimental accuracy, recall rates, and F1 value is 91.0%, 87.7%, and 89.3%, respectively.

  • 从1950年图灵测试开始,让机器“善解人意”便成为人工智能孜孜以求的诗与远方(白硕2018)。近年来,随着人工智能的三驾马车——数据、算力、模型迅猛发展,自然语言理解开始从语言客观意义的理解,进入语言主观意义理解的深水区。情感分析(sentiment analysis)是一项让计算机自动理解文本所蕴含情感信息的语义计算工程,包括情感句识别、情感极性判定、情感对象抽取、情感原因发现四项由浅至深的计算任务(Pang & Lee 2008)。情感分析在竞选预测、用户推荐、网络舆情监测、文献声誉追踪等诸多领域发挥关键作用,持续成为自然语言理解领域的研究热点。本文聚焦其中最为基础的情感句识别任务。

    情感句识别指让计算机自动识别出混合文本中带有褒义或贬义情感倾向的句子,是一项情感句/非情感句的二元分类任务。按逻辑思维与算法路径,世界各语言的情感句识别方法大致归纳为基于理性主义的词典-规则符号法和基于经验主义的机器学习模型法。

    1) 基于理性主义的词典-规则符号法:包括知识建模→知识表示→知识推理三个阶段。知识建模阶段主要借助褒贬义词词典、同义词词典等词汇资源,辅以情感新词发现和语境相关型情感词抽取,完成情感极性(褒义、贬义、中性、褒贬混合),情感强度(强、中、弱),情感属性(领域属性、主题属性、搭配属性等)和情感实例(具体词语)的知识本体建模;知识表示阶段通过定义形式符号与逻辑运算规则,把知识本体转化为机器可读的情感词典,词条格式为“词形词性情感值”,例如“点赞v 0.5”,或转化为短语和句子情感值计算规则,例如“颜值+高=#2:0.5”“油耗+高=#2:-0.5”;知识推理阶段通过编程研制推理机,把情感词典和规则程序实现为情感句自动识别软件(侯敏等2013丁晟春等2014周红照等2016吴鹏等2017Fu et al.2017Bang & Virach 2018Meskele & Frasincar 2020)。其中,情感词典是情感词典匹配法的核心资源,目前世界各语言基本都已建立其通用型情感词典,如汉语HowNet情感词典、英语SentiWordNet、波斯语CNRC,现正逐渐深入到医疗、金融、旅游、体育、汽车、书评、影评、文献等领域型情感词典的自动构建。

    2) 基于经验主义的机器学习模型法:包括训练语料标注→机器学习模型训练→未标注语料识别三个阶段。训练语料为机器模型提供数据支撑,最起码需要标注句子是情感句(YES)或非情感句(NO),还可增加词性、极性、句法关系、语义角色等更为丰富的标注信息;机器学习模型训练阶段利用Word2Vec模型进行词嵌入(Word Embedding)或采用N元语法(N-gram)模型设计不同的特征模板,对文本进行向量化表征,通过实验对比和反复调试,确定模型的维度和参数、窗口区间、系数值、权重值、置信度阈值等具体指标;未标注语料识别阶段即运用训练好的机器学习模型,完成未标注语料中的句子是否属于情感句的二元分类(Chen et al.2017陈珂等2018Nguyen & Nguyen 2018Zhang et al.2019国显达等2020刘彤等2021Singh et al.2022)。目前,常用的机器学习模型有支持向量机(SVM)、朴素贝叶斯(NB)、条件随机场(CRF)、卷积神经网络(CNN)等,机器学习模型受训练语料规模和领域影响较大,结果可解释性较差,持续改进能力较弱。

    最近,研究者还针对幽默、反讽、隐式情感句识别等边缘问题开展了初步研究(张瑾晖等2022潘宏鹏等2022王素格等2022)。上述研究无疑为情感句识别这项自然语言处理工程奠定了语言学基础,并且提供了可落地的人工智能技术实现方案。然而,现有各种方法的着眼点都是“情感句应该具备什么语言特征”,关注的是情感句的“必要条件”;缺少从“情感句不应该包含什么语言特征”的逆向角度,双向与全局地思考问题,情感句识别系统缺少“伪情感句”过滤机制,因此情感句/非情感句的分类条件尚不够充分。

    伪情感句是指包含情感因子(情感词、情感短语、情感句式)但并不表达情感倾向的句子(周红照等2014)。例如:讲好中国故事,传播好中国声音,展示真实、立体、全面的中国,是加强我国国际传播能力建设的重要任务(人民网2022年6月17日)。句子虽然包含褒义情感词“好”,但并未表达褒义情感倾向。由此可见,情感因子不是情感句的充分条件。若情感分析软件仅仅根据句子含有情感因子,就判断其为情感句,则可能会判断错误。因此,需要找到帮助计算机智能识别“伪情感句”的形式特征,给情感分析软件增添伪情感句过滤模块,以此提升情感句识别的准确率。

    本文拟基于对中文倾向性分析评测(COAE)语料、国际自然语言处理与中文计算会议(NLPCC)情感分析评测语料和中国传媒大学媒体语言语料库(MLC)等的调查统计,抽象概括、精确描写识别伪情感句的形式语义特征,创建面向中文伪情感句识别的语义词典和规则库,研发语言知识驱动、推理过程可解释的“中文伪情感句智能过滤模块”,以期填补当前情感句识别软件无法鉴别“伪情感句”的漏洞,提升情感句识别的准确率。

    句子虽然包含情感因子,却不表达情感倾向,原因何在?答案显然不在情感因子本身,而在句中与情感因子发生组合关系的其他成分,是其他成分影响了情感因子,使情感因子原本所具有的情感倾向在语境中消失了。周红照等(2014)提出了“评价消解词”概念,我们对其扩充完善,把具有消解情感因子情感倾向功能的词、短语和句式统称为“情感消解因子”。基于大规模语料的调查统计,共归纳概括出七种语义类型的情感消解因子:主观愿望类、主观猜度类、假设让步类、目的计划类、疑问询问类、建议要求类、客观指涉类。下面以源自媒体网站的七个真实例句(带单下划线的是情感因子,带双下划线的是情感消解因子),来直观具体地阐释情感消解因子对情感因子的语义消解机制及其背后的语言学机理。

    (1) 外交部:希望美国政府采取切实有效措施解决国内枪支暴力问题(主观愿望类)

    (2) 因为开发商有做到明码标价,所以目前还无法判定有违规行为。(主观猜度类)

    (3) 如果父母做错了,该不该向孩子道歉?(假设让步类)

    (4) 公司2022年目标是改善经营质量,不片面追求收入规模。(目的计划类)

    (5) 国人消费观念已大变样——理性消费还是经济减退(疑问询问类)

    (6) 疫情防住、经济稳住、发展安全,这是党中央的明确要求。(建议要求类)

    (7) 近年来,家庭暴力案件的不断曝光,让人们意识到家暴并不是“家务事”,《反家庭暴力》更是对此作了明确规定,让家暴这个“隐秘的角落”不再隐秘。(客观指涉类)

    例(1)—例(7)虽然包含“切实、有效、违规、错、改善、理性、减退、防住、稳住、安全、家暴、家庭暴力”等情感词语,但并未表达对“美国政府、开发商、父母、公司、国人消费观念、疫情、经济、发展”等对象的褒贬评价,因此属于“伪情感句”。情感句与伪情感句均包含情感因子,本质区别在于:情感句中的情感因子表达了情感主体对情感对象的褒贬评价,即情感因子的情感概念意义在语境中彰显了情感评价的语用意义;而伪情感句中的情感因子并未表达情感主体对情感对象的褒贬评价,即情感因子的情感概念意义没有彰显情感评价的语用意义,而是彰显了其他类型的语用意义,确切地说是指称意义,即指称其语义概念内容本身,未对其他事物做出主观评价。例句中的情感词语在语境中只彰显了其情感概念意义,直观地说,只指称其在词典中的释义。问题是怎样让计算机像人一样识别和理解句中的情感因子实际表达的是指称意义而非评价意义呢?计算机工作的基本方式是“条件→动作”偶对,要想让计算机准确做出上述例句属于伪情感句的动作判断,必须明确告诉它伪情感句的判断条件。就目前情感人工智能技术而言,“条件”获取主要有两种方法,一是基于语言知识进行理性推理的“小而美”的符号规则方法,二是基于语言大数据进行概率统计的“大而强”的机器学习模型方法。鉴于缺乏大规模中文情感标注数据集,机器模型对小样本处理能力较弱、可解释性不足等问题,本文采用了符号规则的方法,其核心任务是给出伪情感句的语言学理论解释和形式语义标记。

    例(1)—例(7)分别代表伪情感句的七种类型,例句中情感因子潜在的褒贬评价语用功能之所以没有彰显,语言学理论解释如下:美国哲学家Morris(1938:8)把符号学划分为符形学、符义学和符用学;胡裕树和范晓(1985)明确区分了语法研究的三个不同平面——句法平面、语义平面和语用平面。从上述七个例句可以发现,语义和语用的确属于两个不同的平面,情感语义≠情感语用:同一情感语义在不同语境中可以彰显不同的语用功能,情感语用功能只是情感语义语用功能之一种(是否为常规性、惯常性语用功能有待实证考察)。情感因子在语境中彰显何种语用功能,取决于与之相搭配的词语及其所处句法格式、语义框架和篇章结构,就本文所研究的“伪情感句”而言,伪情感句中的情感因子所彰显的语用功能是指称功能。例(7)是较为典型的例证,句中的情感名词“家庭暴力、家暴”的语用功能是充当说话者所谈论的话题,是说话者旨在陈述和说明的对象,按照英国语言学家Halliday(2014: 105)功能语法中的术语来讲,即作为已知信息,充当句子的话题主位(topical theme)。情感因子指称用法的最典型用例是用作辞书中被释的词目,例如:【家暴】家庭暴力的简称。// 【家庭暴力】指……的行为。(《现代汉语词典》第7版,第623、624页) 例(1)—例(6)中的“切实、有效、违规、减退”等情感因子虽然是形容词或动词,但同样是用作客观指称,而非主观评价,因为其受到了表主观愿望的词“希望”、表主观猜度的短语“无法判断”、表疑问询问的句式“是……还是……”等情感消解因子的语义管辖,情感因子在句子中呈现的语义状态是“未发生、未实现、不确定”。倘若把“希望、无法判断、是……还是……”等情感消解因子删掉,使句子变为*外交部:美国政府采取切实有效措施解决国内枪支暴力问题// *因为开发商有做到明码标价,所以目前还有违规行为。// *国人消费观念已大变样——理性消费经济减退那么,“切实、有效、违规、理性、减退”的语义特征就随之变化为“已发生、已实现、已确定”,其语用功能就不再纯是指称了,而是对“美国政府、开发商、消费观念、经济”的褒贬评价了。

    由此推论:正如美国语言学家布龙菲尔德(1980: 196)所提出的,语法结构具有层次性,语义结构和语用结构也具有层次性,下层的语义和语用结构需要服从于上层的语义和语用结构。当表达褒贬评价的下层语义和语用结构与表达主观愿望、主观猜度、疑问询问等的上层语义和语用结构发生矛盾时,下层结构中情感因子的语用功能要由评价功能调整为指称功能。需要特别指出的是,判断上述七种伪情感句的形式语义标记,不仅仅是例句中加双下划线的那一个词、短语或句式,而是与之具有相同语义特征,同处一个语义场的一组词、短语和句式。这些词、短语和句式具有将其语义管辖范围内情感因子的褒贬评价功能转变为不带有情感倾向的客观指称功能的作用,我们将其统一命名为“情感消解因子”。

    我们借助《哈工大信息检索研究室同义词词林扩展版》,构建了共计包含368个词、短语和句式的中文情感消解因子知识本体库(见下页表 1所示)。

    表  1  中文情感消解因子知识本体库
    类型 示例 数量
    主观愿望类 祝、祝愿、但愿、希望、盼望 30
    主观猜度类 猜、猜想、很难说、不确定、无法判定 56
    假设让步类 如果、假如、即使、哪怕、万一 44
    目的计划类 打算、为了、要想、目标是、以…为目标 41
    疑问询问类 如何、怎样、能不能、是…还是…、情感词语A+不+情感词语A 62
    建议要求类 建议、呼吁、要求、亟需、推动|增强|改善|努力实现… 42
    客观指涉类 指、定义、关于、面对、情感词(+的|之)+抽象概括性名词 93
    下载: 导出CSV 
    | 显示表格

    我们首先把下页表 1中的情感消解词语收录到中文情感分析系统CUCsas的语义词典中,赋予其情感消解的语义标记“xjc”;然后在短语和句子情感值计算规则库中制定*/xjc+*/vl=#2:0或*/vl+*/xjc=#1:0的情感消解规则(=左边是规则匹配条件,=右边是规则匹配成功后执行的操作,vl是情感词典中赋予情感词语的情感标记,#N表示规则左部的第N项),将受情感消解词语语义管辖的情感词语的情感值变为0,实现对“伪情感句”的智能识别和过滤。对于句式型情感消解因子,我们根据情感消解句式的模标词语和模槽限制,在短语和句子情感值计算规则库中编写相应的情感消解规则。下面我们以例(8)、例(9)分别说明上述两种不同的处理策略。

    (8) 干部面对腐败有三种选择:不想、不敢、不能

    (9) 人教版数学教材插图引争议,是网友过度解读还是作者别有用心

    计算机鉴别例(8)是伪情感句的基本流程:①分词标注。“面对”是语义词典中的词,分词标注时除了赋予其动词词性标记v,同时还赋予其情感消解语义标记xjc——面对/v/xjc,“腐败”是情感词典中的词,分词标注时除了赋予其形容词词性标记a,同时还赋予其情感语义标记vl及情感词典中记录的情感强度值-0.5——腐败/a/vl: -0.5;②规则匹配。“面对/xjc+腐败/vl”满足情感消解规则“*/xjc+*/vl=#2:0”左部的匹配条件,系统自动执行规则右部的操作,把#2(规则左部的第2项“腐败”)的情感值重新赋值为0——腐败/a/vl: 0;③输出结果。系统输出该句不是情感句的判断结果——NO,完成伪情感句的鉴别。

    计算机鉴别例(9)是伪情感句的基本流程:①编写规则。在短语和句子情感值计算规则库中编写句式型情感消解规则“是/v+#[*/!w]+*/vl+#[*/!w]+还是/c+#[*/!w]+*/vl=#3:0 #7:0”(#[*/!w]是越过项,表示可以任意越过“!w”——除标点符号之外的内容);②分词标注。例(9)分词标注结果为“人/n教版/b数学/n教材/n插图/n引/v争议/v,/w是/v网友/n过度/a/vl: -0.75解读/v还是/c作者/n别有用心/ia/vl: -0.635?/w”;③情感消解。“是/v网友/n过度/a/vl: -0.75解读/v还是/c作者/n别有用心/ia/vl: -0.625”满足情感消解规则“是/v+#[*/!w]+*/vl+#[*/!w]+还是/c+#[*/!w]+*/vl=#3:0 #7:0”左部的匹配条件,系统自动执行规则右部的操作,把#3(过度)和#7(别有用心)的情感值重新赋值为0;④输出结果。系统输出该句不是情感句的判断结果——NO,完成伪情感句的鉴别。

    为了检验基于形式语义特征建立的中文伪情感句识别语义词典与规则的可靠性,我们从《现代汉语常用词表》(第2版)中选取了使用频率最高的10大情感名词(朋友、人才、英雄、成果、优势、敌人、罪、友谊、机遇、智慧)、10大情感动词(支持、反对、批评、促进、值得、破坏、满意、犯罪、改善、感谢)、10大情感形容词(美、强、成功、认真、伟大、乱、积极、好、先进、文明)作为测试词,从中国传媒大学MLC《新闻联播》语料库、北京大学CCL《人民日报》语料库、北京语言大学BBC微博语料库中分别检索30个测试词出现的9000个句子(300句/词)作为测试语料,以国际普遍采用的准确率(P)、召回率(R)、F1值为评价指标,实验检验基于368个情感消解因子、用Python编程实现的中文情感分析系统CUCsas“伪情感句智能识别模块”的性能,得到下页表 2的实验结果。

    表  2  中文伪情感句智能识别实验结果
    测试语料 语料规模 准确率(P) 召回率(R) F1值
    MLC《新闻联播》 9000句 91.2% 88.6% 89.9%
    CCL《人民日报》 9000句 91.4% 88.1% 89.7%
    BBC微博 9000句 90.4% 86.5% 88.4%
    下载: 导出CSV 
    | 显示表格

    实验结果显示:CUCsas系统“伪情感句智能识别模块”在27000句《新闻联播》《人民日报》和微博测试语料上的总体准确率为91.0%,召回率为87.7%,F1值为89.3%,基本可以满足实用化要求,并且各项指标测试结果在不同领域语料上的变化幅度微小,证明语义词典和情感消解规则具有良好的领域适应性,基本契合中文伪情感句的语言表达规律。我们接下来将根据实验结果的反馈情况,特别是系统识别错误和未召回的伪情感句,修正完善语义词典和规则,重点解决以下两大“伪情感句”识别难题。

    第一,隐式伪情感句识别。

    (10) 老板用你的时候你就是人才,不用你的时候就变成裁人!

    (11) 提出新观念,就要准备受人批评

    隐式伪情感句指形式语义标记缺省或难以查找的伪情感句。语言界和翻译界普遍认同“形合与意合是英汉两种语言最重要的区别特征”(张思洁、张柏然2001)。汉语重意合不重形合,词语或语句之间的连接主要依仗的不是显性的关联词或形态手段,而是隐性的内在语义逻辑关系,因此存在较多的省略现象。例(10)和例(11)虽然分别含有褒义词“人才”和贬义词“批评”,但两者均未表达褒贬评价,属于伪情感句。然而,句中并未出现中文情感消解因子知识本体库中的特征词,所以系统无法识别其为伪情感句。隐式伪情感句的识别需要基于大规模语料的深入考察,研究制定全面系统、具体可操作的解决方案。

    第二,反式伪情感句识别。

    (12) 活动怎么可以这么给力啊,支持支持!!!

    (13) 这样可有效防止电磁干扰改善MODEM与电脑的工作状态。

    反式伪情感句指包含伪情感句形式语义特征的情感句。事物是普遍性与特殊性的统一,伪情感句也不例外,目前的伪情感句识别规则主要处理的是普遍的、常见的、大概率问题,但难免会存在特殊和例外情况。例(12)“怎么+给力”、例(13)“逗号+改善”均符合伪情感句识别规则的条件要求,但实际上,例(12)“怎么可以这么给力”并非表疑问询问,而是表肯定强调;例(13)“改善MODEM与电脑的工作状态”并非表建议要求,而是受承前省略的“这样可有效”的语义管辖,表确定性陈述。目前的规则库尚未考虑强调句式、承前省略等反式伪情感句情形,故将例(12)和例(13)错误地识别为了伪情感句。

    本文以中文伪情感句智能识别为研究目标,结合了基于语言数据的经验方法与基于语言规则的理性方法。我们首先从计算语言学角度对中文伪情感句知识本体进行了系统考察,提出了情感消解因子的概念,归纳总结出情感消解因子的七种语义类型——主观愿望类、主观猜度类、假设让步类、目的计划类、疑问询问类、建议要求类、客观指涉类。接下来,我们阐释了情感消解因子对情感因子的语义消解机制及其背后的语言学机理,并且精准指出帮助计算机自动识别伪情感句的形式语义特征,建立了共计包含368个词、短语和句式的中文情感消解因子知识本体库。最后通过定义形式语义符号与逻辑运算规则,将其转化为机器可读的语义词典和情感消解规则库,并编程实现为中文情感分析系统CUCsas的“伪情感句智能识别模块”,在27000句测试语料上取得了F1值89.3%的良好实验结果。本研究实践表明:在目前缺乏大规模中文情感标注数据集、缺少对深度学习端到端的“黑盒式”运算理性解释的背景下,从数据中挖掘和提炼语言知识,研发形式语义知识驱动、推理过程可理解、可持续升级改进的“小而美”的系统,对于“伪情感句”识别这样的微观情感计算任务,具有良好的适用性和可行性。接下来,我们将深入研究隐式和反式伪情感句这两类边缘现象,为中文伪情感句智能识别工程提供更加充分的语言学理据支撑,进一步提升系统性能。

  • 表  1   中文情感消解因子知识本体库

    类型 示例 数量
    主观愿望类 祝、祝愿、但愿、希望、盼望 30
    主观猜度类 猜、猜想、很难说、不确定、无法判定 56
    假设让步类 如果、假如、即使、哪怕、万一 44
    目的计划类 打算、为了、要想、目标是、以…为目标 41
    疑问询问类 如何、怎样、能不能、是…还是…、情感词语A+不+情感词语A 62
    建议要求类 建议、呼吁、要求、亟需、推动|增强|改善|努力实现… 42
    客观指涉类 指、定义、关于、面对、情感词(+的|之)+抽象概括性名词 93
    下载: 导出CSV

    表  2   中文伪情感句智能识别实验结果

    测试语料 语料规模 准确率(P) 召回率(R) F1值
    MLC《新闻联播》 9000句 91.2% 88.6% 89.9%
    CCL《人民日报》 9000句 91.4% 88.1% 89.7%
    BBC微博 9000句 90.4% 86.5% 88.4%
    下载: 导出CSV
  • [1]

    Bang, T. S. & S. Virach. Sentiment classification for hotel booking review based on sentence dependency structure and sub-opinion analysis[J]. Ieice Transactions on Information and Systems, 2018, 101(4): 909-916. http://www.jstage.jst.go.jp/article/transinf/E101.D/4/E101.D_2016IIP0038/_pdf

    [2]

    Chen, T., Xu, R., He, Y. & X. Wang. Improving sentiment analysis via sentence type classification using BiLSTM-CRF and CNN[J]. Expert Systems With Applications, 2017, (72): 221-230. http://eprints.aston.ac.uk/29427/1/Sentiment_analysis_via_sentence_type_classification_using_BiLSTM_CRF_and_CNN.pdf

    [3]

    Fu, X., Liu, W., Xu, Y. & L. Cui. Combine HowNet lexicon to train phrase recursive autoencoder for sentence-level sentiment analysis[J]. Neurocomputing, 2017, (214): 18-27. http://www.onacademic.com/detail/journal_1000039836970710_28ff.html

    [4]

    Halliday, M. A. K. & C. Matthiessen. Halliday's Introduction to Functional Grammar (4th ed. )[M]. Oxon: Routledge, 2014.

    [5]

    Mekel, D. & F. Frasincar. ALDONAr: A hybrid solution for sentence-level aspect-based sentiment analysis using a lexicalized domain ontology and a regularized neural attention model[J]. Information Processing and Management, 2020, 57(3): 102211. doi: 10.1016/j.ipm.2020.102211

    [6]

    Morris, C. W. Foundations of the Theory of Signs[M]. Chicago: Chicago University Press, 1938.

    [7]

    Nguyen, H. & M. L. Nguyen. A deep neural architecture for sentence-level sentiment classification in Twitter social networking[J]. Computational Linguistics, 2018, (1): 15-27. http://doc.paperpass.com/patent/arXiv170608032.html

    [8]

    Pang, B. & L. Lee. Opinion Mining and Sentiment Analysis[J]. Foundations and Trends in Information Retrieval, 2008, 2(1-2): 1-135. http://www.cs.cornell.edu/Info/People/cardie/papers/oxford-handbook-ch39.pdf

    [9]

    Singh, A., Saha, S., Hasanuzzaman, M. & K. Dey. Multitask learning for complaint identifcation and sentiment analysis[J]. Cognitive Computation, 2022, 14(1): 212-227. doi: 10.1007/s12559-021-09844-7

    [10]

    Zhang, Y., Zhang, Z., Miao, D. & J. Wang. Three-way enhanced convolutional neural networks for sentence-level sentiment classification[J]. Information Sciences, 2019, (477): 55-64.

    [11] 白硕. 自然语言处理技术简介[EB/OL]. 阡寻科技微信公众号, 2018-01-06.
    [12] 布龙菲尔德. 语言论[M]. 北京: 商务印书馆, 1980.
    [13] 陈珂, 梁斌, 柯文德, 许波, 曾国超. 基于多通道卷积神经网络的中文微博情感分析[J]. 计算机研究与发展, 2018, 55(5): 945-957. https://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ201805006.htm
    [14] 丁晟春, 孟美任, 李霄. 面向中文微博的观点句识别研究[J]. 情报学报, 2014, 33(2): 175-182. doi: 10.3772/j.issn.1000-0135.2014.02.007
    [15] 国显达, 那日萨, 崔少泽. 基于CNN-BiLSTM的消费者网络评论情感分析[J]. 系统工程理论与实践, 2020, 40(3): 653-663. https://www.cnki.com.cn/Article/CJFDTOTAL-XTLL202003009.htm
    [16] 侯敏, 滕永林, 李雪燕, 陈毓麒, 郑双美, 侯明午, 周红照. 话题型微博语言特点及其情感分析策略研究[J]. 语言文字应用, 2013, (2): 135-143. https://www.cnki.com.cn/Article/CJFDTOTAL-YYYY201302018.htm
    [17] 胡裕树, 范晓. 试论语法研究的三个平面[J]. 新疆师范大学学报(哲学社会科学版), 1985(2): 7-15+30. https://www.cnki.com.cn/Article/CJFDTOTAL-SJHY200002010.htm
    [18] 刘彤, 刘琛, 倪维健. 多层次数据增强的半监督中文情感分析方法[J]. 数据分析与知识发现, 2021, 5(5): 51-58. https://www.cnki.com.cn/Article/CJFDTOTAL-XDTQ202105007.htm
    [19] 潘宏鹏, 汪东, 刘忠轶, 李轲. 考虑反讽语义识别的协同双向编码舆情评论情感分析研究[J]. 情报杂志, 2022, 41(5): 99-105+111. https://www.cnki.com.cn/Article/CJFDTOTAL-QBZZ202205016.htm
    [20] 王素格, 王敏, 廖健, 陈鑫. 融合上下文信息的隐式情感句判别方法[J]. 山西大学学报(自然科学版), 2022, 45(2): 380-386. https://www.cnki.com.cn/Article/CJFDTOTAL-SXDR202202015.htm
    [21] 吴鹏, 刘恒旺, 沈思. 基于深度学习和OCC情感规则的网络舆情情感识别研究[J]. 情报学报, 2017, 36(9): 972-980. https://www.cnki.com.cn/Article/CJFDTOTAL-QBXB201709011.htm
    [22] 张瑾晖, 张绍武, 林鸿飞, 樊小超, 杨亮. 基于多粒度语义交互理解网络的幽默等级识别[J]. 中文信息学报, 2022, 36(3): 10-18. https://www.cnki.com.cn/Article/CJFDTOTAL-MESS202203002.htm
    [23] 张思洁, 张柏然. 形合与意合的哲学思维反思[J]. 中国翻译, 2001, 22(4): 13-18. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGFY200104003.htm
    [24] 周红照, 侯敏, 滕永林. 评价知识本体研究与规则实现[J]. 现代图书情报技术, 2016, (10): 25-32. https://www.cnki.com.cn/Article/CJFDTOTAL-XDTQ201610004.htm
    [25] 周红照, 侯明午, 颜彭莉, 张叶青, 侯敏, 滕永林. 语义特征在评价对象抽取与极性判定中的作用[J]. 北京大学学报(自然科学版), 2014, 50(1): 93-99. https://www.cnki.com.cn/Article/CJFDTOTAL-BJDZ201401014.htm
  • 期刊类型引用(0)

    其他类型引用(1)

表(2)
计量
  • 文章访问数:  407
  • HTML全文浏览量:  36
  • PDF下载量:  226
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-08-18
  • 刊出日期:  2023-05-19

目录

/

返回文章
返回