An Analytic Approach for Exploring the Meaning Construction of Discourse Objects in the Framework of Lexical Item
-
摘要:
话语对象指话语中有关事物、特征、状态、行为和过程的具体或者抽象的概念(Teubert 2010),其意义可以由词项来表述。研究的主要目的是要形成用词项构建话语对象意义的方法和路径。具体而言,就是以“美国新冠病毒话语”为语料,探讨如何在词项框架下建构话语对象virus的意义。研究发现,以话语对象virus为搭配核,能够扩展出大量的表述清晰的词项,它们有的相对独立,有的交错重叠,共同围绕该话语对象交织成一幅复杂的意义网络图。这个意义网络图可以清晰地展现美国在线报刊杂志在建构话语对象virus时,使用的各种意义表述和呈现形式以及隐含的态度意义。另外,在建构话语对象意义时,词项分析的步骤变得更加灵活,分析的精细度更高。该研究为建构语料库驱动的话语分析的工作路径带来启示;意义网络图对于设计计算机自动提取词项的伪算法也有一定的参考价值。
Abstract:Teubert (2010) defined discourse objects as any concrete or abstract concepts of entities, properties, states, actions and processes which are talked about in discourse and presented by lexical items.This research aims to establish an analytic approach for constructing the meaning of discourse objects in the framework of lexical items proposed by Sinclair (2004a).To be specific, this research attempts to scrutinize how the meaning of COVID-19 virus is constructed in the "American COVID-19 virus discourse".With "virus" as the core, we can find many different lexical items.Some are independent but most of them are partially overlapped and interwoven into a complex semantic web.From the web, we can clearly see how the discourse community of American online newspapers and magazines constructs the meaning of virus in COVID-19 discourse.Moreover, we can also detect the attitudinal meanings hidden behind the lexical items of virus.In addition, when dealing with the meaning of discourse subjects, the model of lexical items becomes more flexible in actual operation.This study is significant in that it would shed light on designing approaches to corpus-driven critical discourse analysis and the pseudo-codes in automatic retrieval of lexical items from a corpus.
-
Keywords:
- discourse object /
- lexical item /
- COVID-19 virus
-
1. 引言
Teubert(2010: 180)认为,话语包含许多话语对象(discourse objects),即用来表达有关事物、特征、状态和过程的具体或者抽象的概念,话语对象的意义由话语中一切与之相关的表述来呈现。Teubert的话语分析不同于Baker(2006)提出的基于语料库的批评话语分析(Corpus-based Critical Discourse Analysis,简称CCDA)。具体表现为:1)目的不同,CCDA旨在解读话语背后的政治和社会意识形态,而Teubert则要解读和建构话语本身的意义;2)方法不同,CCDA主要采用关键词和搭配分析(如Stubbs 1996;Baker et al.2008;王琦2019;张瑞华、李顺然2020),而Teubert则提出通过词项(lexical items)来分析话语对象的意义。Teubert的思想可用来指导建构语料库驱动的话语分析,但遗憾的是,他没有清晰地界定词项,只是模糊地指出词项是一个词或者多个词,并且没有确立有效的分析路径。
Sinclair(2004a)采用最大描写路径(maximal approach),整合了词语、语法、语义和语用,界定了话语文本中的基本意义单位,即词项,并且给出了一套完整的描写框架。本文将该框架应用于话语对象的意义建构,形成描写话语对象意义的方法和路径。基于“新冠病毒语料库”,本文将通过分析美国新冠病毒话语中话语对象virus的意义,解读美国在线媒体是如何通过话语来建构新冠病毒的意义和态度。
2. 词项分析框架
意义研究是描写语言学的根本任务。传统的语义研究采用了最小描述路径(minimal approach),把意义与尽可能最短的语言片段关联,认为该语言片段应该具有最小变异性。因此,一个英语单词就是一个意义单位。Sinclair(2004b:273)认为最小描述路径导致语言歧义,甚至语言错误。例如,英语单词kick表示“踢”,bucket表示“水桶”,但kick the bucket却跟“踢水桶”没有任何关系,而表示“死翘翘”。换言之,假设语言中同一个语言符号(通常情况下指一个单词)可能会指代不同意义(Saussure 1959),但一定要通过各种不同的独特方式,在更大范围的文本语境中来实现(Sinclair 2004b: 274)。
因此,Sinclair(2004b:280)主张使用最大描述路径,最大限度地扩展意义单位的规模,将所有相关的型式包括进来,而这些型式皆与核心词语(也可能是个搭配)关联(甄凤超2019;李文中2021)。实际上,Sinclair(1966)从最初的搭配研究就开始践行意义分析的最大描述路径,并在其词项(lexical items)理论中不断实践与完善(Sinclair 2004a,2004c)。在Sinclair看来,一个词项就是一个意义单位,通常由一个以上的单词共同构成。具体而言,词项指一种向心式结构(endocentric structure),包含了两个或者多个邻近型符,彼此在意义上关联,并且由一个核将其聚集在一起,共同形成一个完整的意义单位(Sinclair 2004c:119)。Sinclair(2004a)基于长期的真实语言数据观察,描绘出词项分析框架。
词项分析框架包括五个成分:搭配核(core)、词语搭配(collocation)、类联接(colligation)、语义倾向(semantic preference)和语义韵(semantic prosody),对应了词语、语法、语义和语用。其中,搭配核和语义韵是必要项,其他为可选项。也就是说,搭配核是词项中最稳定的成分,语义韵则限制了词项的边界并且表达了词项具有的态度义(attitudinal meaning);而搭配、类联接和语义倾向不一定要出现在所有的词项中,因为有时候单个单词也可能会成为一个词项。词项分析基于索引行,通常以搭配核为节点词(node word),在其左右的一定跨距内,逐步进行搭配、类联接、语义倾向和语义韵的分析,分析越往外围走,抽象度会越高。
词项分析框架的最大特点是,所有的分析环节都依赖于文本本身,并且将意义置于具体的共文中(cotext)。遗憾的是,到目前为止,这种分析方法还没有被广泛应用于话语分析中,原因是研究者认为词项分析聚焦于某一两个具体的词,太过微观,无法从宏观上把控整个话语的内容和主题。虽然这种观点有其合理性,但词项分析能够给话语研究者一个“拉近镜头”、深入文本仔细观察的机会,并且这种分析综合了词语、语法、语义和语用态度等多个维度。话语中话语对象的意义描写虽微观,而不同的话语对象汇集在一起就能描绘出语篇的意义和价值取向。
3. 语料和方法
本研究使用杨百翰大学Mark Davis教授团队建设的“新冠病毒语料库”(The Coronavirus Corpus,https://www.english-corpora.org/corona/)。建设该语料库的主要目的是真实记录2020年新冠疫情爆发以来引发的社会、文化和经济影响。该语料库是在线实时监控语料库,语料取自20个不同国家公开发表的在线英语报刊杂志,目前已经发布的库容为6亿多形符,并且每天以3百万~4百万词的速度在增长。语料库设置了国别和时间选项。本研究选择美国子库,时间跨度为2020年1月到9月,库容约3千万形符。
在新冠病毒话语中,单词virus是个绝对高频率出现的词,在我们调察的美国子库中,它的出现频率高达137372次,是此类话语的重要话语对象。本研究以virus为对象,探讨美国社会在新冠疫情中如何建构“病毒”的意义及其表述和呈现形式。具体方法是以virus为搜索词,在新冠病毒语料库-美国子库中提取索引行,以virus为搭配核,进行词项分析,描写virus意义单位的型式特征,分析其语义倾向和态度义。
4. 数据发现与分析
首先,以virus为节点词向左观察,发现在左1的位置上经常出现冠词the,有时也会出现a,但a(或an)经常出现在左2的位置上,与节点词virus之间用形容词隔开。因此,我们把the或者a(an)记作virus的搭配词,即the virus或者a(an)adj.virus。我们对这两种搭配分别进行词项分析。
4.1 由the virus构成的词项
观察搭配the virus左1的位置,发现经常出现of、for、to、about、from、against等。根据Sinclair(2004a)的分析步骤,此处由于变化较多,需使用类联接的描写途径,记作介词。至此,词项扩展为prep.+ the virus。我们在数据分析过程中发现,由于这个类联接是个有限的词集,可尝试分析每一个介词的情况。其中,介词of高频次出现。我们以of the virus为基础,继续向左观察,发现出现大量的名词,并且在意义上表现出明显的特征,因此我们做语义倾向分析。经过观察,可分成如下几类意义:
(1) 爆发义(OUTBREAK)①,表示新冠病毒疫情的发生。这类的名词有outbreak、arrival、emergence、assault、resurgence、presence等。
(2) 源头义(ORIGIN),表示新冠病毒发生的范围。这类的名词有origin、center、epicenter、source、chain、coverage等。
(3) 传播义(SPREAD),表示新冠病毒的肆虐。这类的名词有spread、transmission、circulation、development、transfer、growth、replication等。
(4) 影响义(EFFECT),表示新冠病毒给人和社会带来的各种危害及其程度。这类的名词有effect、risk、danger、threat、impact、severity、magnitude、victim等。
(5) 行动义(ACTION),表示人们针对新冠病毒开展各种活动。这类的名词有detection、handling、extraction、diagnosis等。
(6) 事例义(CASE),这类名词类似于“壳名词”,不表示具体含义,如case、nature、aspect、sign、evidence、incidence、report等。
(7) 认知义(PERCEPTION),表示人类对新冠病毒的认识。这类的名词有knowledge、concern等。
我们继续向左观察,发现有大量的动词、形容词、副词和名词出现。另外,我们还发现,上述不同语义倾向在共现词上会存在差异。由于变化形式多样,并且许多词具有明显的态度意义,因此适合做语义韵的分析。
OUTBREAK + of + the virus
我们从与该序列共现的词当中推测出如下3种语义韵:1)恐慌。具体展示为以下一些表达,如worried、fearful、could be devastating、wartime、serious、deadly、died、danger等。2)努力设法控制。具体展示为以下一些表达,如grapple with、tackle、help to cope with、is battling、control等。3)谴责。具体展示为以下一些表达,如irresponsible、not enough、ill-equipped to deal with、lack等。另外,该序列的一部分会向右扩展变成OUTBREAK + of + the virus + in + PLACE。
ORIGIN + of + the virus
我们从与该序列共现的词当中推测出如下3种语义韵:1)未知。具体展示为以下一些表达,如unknown、uncertain、difficult to determine、there isn’t quite enough evidence to pin、no clear、there is still a lot to learn、mysteriously等。2)重要性。具体展示为以下一些表达,如exceptionally important、more important、pinpoint、need to locate、aim at finding等。3)科学性。具体展示为以下一些表达,如complex scientific、a matter of science、epidemiological fact、academic paper、theories、analysis、laboratory等。
SPREAD + of + the virus
我们从与该序列共现的词当中推测出如下2种语义韵:1)努力制止。具体展示为以下一些词,如effort、measures、activities、try、action、attempt、stop、slow、handle、control、reduce、prevent、slow down等。2)恐惧。具体展示为以下一些词,如fear about、afraid of、fail、concern about。表示第一种语义韵的频数要远远高出第二种语义韵。另外,该序列可以向右扩展成为SPREAD + of + the virus + in/among + PLACE/PEOPLE。
EFFECT + of + the virus
我们从与该序列共现的一些词中推测出4种语义韵:1)难以预测。具体展示为以下一些表达,如too early to understand、very hard to estimate、not known等。2)因不确定而恐惧。具体展示为以下一些表达,如new、terrible toll、fearful、fuel fears、worst、the uncertainty、fear of the unknown等。3)努力战胜。具体展示为以下一些表达,如struggling、hope to slow、an effort to slow、fight to stop、minimize、help等。4)对政府的不作为导致疫情扩散表示谴责。具体体现在以下一些表达中,如react to、reinforce、increase、wider spread、severely underestimated、didn’t act quickly enough to halt等。
ACTION + of + the virus
我们从与该序列共现的一些词中推测出2种语义韵:1)谴责。具体展示为以下一些表达,如criticism、whitewash、strongly criticized、critical、frustrating、complaints、skeptical、question、critique等。2)困难。具体展示为以下一些表达,如difficult、not easy、slow、hard等。
CASE + of + the virus
我们从与该序列共现的一些词中推测出2种语义韵:1)确定。具体展示为以下一些表达,如confirm、report、identify、detect、positive、announce等,动词多数用现在完成体。2)加强检测。具体展示为以下一些词,如evaluate、analyze、measure、test、emphasize、understate等。该序列可以向右扩展成CASE + of + the virus + in/on + PLACE/TIME。
PERCEPTION + of + the virus
我们从与该序列共现的一些词中推测出2种语义韵:1)因欠缺而恐慌。具体展示为以下一些表达,如limited、do not know、unclear等。2)因增加而有希望。具体展示为以下一些表达,如evolve、grows everyday、greater、more、expand、scientific等。
从上面的分析可以看出,序列of + the virus经过扩展之后形成的词项,在语义和态度义上存在着变化,或者说,这些变化是围绕序列of + the virus建构的语义群,也是美国在线报刊杂志话语社团在使用序列of + the virus所构成的词项时建构的意义。当然,这些单位在语义倾向和态度义上存在着重叠,共同构成一个复杂的网络,如图 1所示。不同的语义序列(具体展示为of左一名词位置上的不同语义倾向)在语义韵上出现重叠,也就是说,可以用不同的语义序列来传达相同的语义韵,如序列OUTBREAK + of + the virus + in + PLACE与序列SPREAD + of + the virus + in/among + PLACE/PEOPLE都会传递一种表达恐惧的语义韵。
序列the virus左1位置上除了介词of之外,还出现了其他的介词,如for、to、about、from、against等,但它们和the virus一起形成的词项在语义上较为简单,没有介词of那么复杂。序列for the virus左1的位置上基本上只有两个形容词,即positive和negative,并且positive占绝大多数,再往左则出现动词test,往右则部分出现介词in或者on,紧跟着表达时间或者地点的名词。因此,该序列可以记作TEST + positive/negative + for + the virus + in/on + TIME/PLACE。在这个序列的周围会出现一些数字,序列中动词也多数用现在完成体或者过去时,因此,整个序列传递一种“客观陈述事实”的语义韵。另外,positive高频率出现也反应出美国疫情持续增长的现状。
序列to + the virus左1位置上出现了一些变化形式,可做语义倾向分析。1)暴露义,表示接触病毒,主要使用动词expose的被动语态或者名词exposure,周围会出现damage、risk、worry、fear、potential等词语,该序列记录成EXPOSE + to + the virus,表达一种“危险”的语义韵。2)相关义,表示与病毒或者疫情相关,主要使用related、linked、connected、connection、attributed等词语,周围会出现death、funerals、fatality等词语,该序列记录为RELATE + to + the virus,表达一种“受死亡阴影笼罩”的语义韵。3)易受伤害义,表示某些人群容易受到病毒侵害,主要使用形容词vulnerable、immune、susceptible,动词succumb等,周围会出现more、especially、particularly、the most等,该序列记录为VULBERABLE + to + the virus,表达一种“更加、尤其”的语义韵。
序列about + the virus左1位置上也出现一些变化形式,可做语义倾向分析。1)担忧义,表示面对病毒表现出的担心、忧虑,主要使用concern、worry、talk、nervous、anxiety等,该序列记录为CONCERN + about + the virus,表达一种“焦虑”的语义韵。2)信息义,表示对病毒讯息的了解,主要使用information、questions、know、statement、misinformation、data等,周围会出现so little、don’t know、false、distort、critical、new、up-to-date等,该序列记录为INFORMATION + about + the virus,表达两种语义韵,一种是“缺乏”,一种是“希望”。
序列from + the virus左1位置上主要有两种语义倾向,一种是“死亡义”,主要使用death、died、fatalities、death rates、suffer、sick等,周围会出现一些数字和表示程度的词,如more than、at least、total、almost,该序列记录为DEATH + from + the virus,表达一种“强调”的语义韵;另外一种是“复原义”,主要使用recover、stay away、mitigate、immune等,周围会出现hope、expect、more than、nearly、majority等,该序列记录为RECOVER + from + the virus,表达一种“希望”的语义韵。
序列against + the virus左1位置上也主要有两种语义倾向,一种是“战斗义”,主要使用fight、battle、war、defense、guard、protect等,周围会出现long、boost、crucial、take several months、far from over、grow longer等词语,该序列记录为FIGHT + against + the virus,表达一种“艰难、持久”的语义韵;另外一种是“免疫义”,主要使用immunity、vaccine、precaution、antibodies、success等,周围会出现effective、protection、successful、better、efficacy、unclear等词语,该序列记录为IMMUNITY + against + the virus,表达一种“乐观”的语义韵。
我们把除了of之外的其他几种序列整合在一起,绘制出一个词项网络图(如图 2所示),能够更加直观地观察the virus的其他词项所建构的意义网络。如果把序列N + of + the virus整合进来,由the virus这个搭配核触发的词项网络将更加复杂。
4.2 由a/an+ adj. + virus构成的词项
当virus左边用不定冠词a/an来修饰时,中间会出现形容词,因此我们将序列记录为a/an + adj.+ virus,其中,a/an是virus的搭配词,adj.是该序列中的类联接成分。虽然形容词的变化形式较多,但它们也受到该序列的语义限制,因此我们对这个位置上的形容词做语义倾向分析,主要分成如下几类:
(1) 新义,表示这是一种新型病毒。这类的词有new、brand-new、novel、foreign、never-before-seen、mystery、mysterious等。
(2) 致命义,表示这是一种危险系数很高的病毒。这类的词有deadly、killer、deadlier、dangerous、serious、life-altering、horrible、virulent、lethal、severe、worsening、catastrophic等。
(3) 传染义,表示这是一种传播速度很快的病毒。这类的词有contagious、infectious、pandemic、fast-spreading、highly-contagious、worldwide、transmissible、fast-moving、rampant、global等。
(4) 命名义,表示试图界定这种新型病毒。这类的词有Chinese、Chicago、government-created、Corona、SARS、SARS-like、bat、pneumonia-like、flu-like等。
(5) 定性义,描写这种新型病毒的特征。这类的词有foodborne、microscopic、respiratory、gastrointestinal、seasonal、natural、permanent、unseen、untreatable等。
沿着序列a/an + adj.+ virus向左观察,紧邻着的是一个类联接,即介词,具体包括of、with、from、to、by、about、as等,因此,该序列可以扩展至prep.+ a/an + adj.+ virus。我们接下来挑选一些出现频次相对较高的介词进行观察分析。
of + a/an + adj.+ virus
该序列左1的位置有一个明显的类联接,即名词,序列可以扩展为N + of + a/an + adj.+ virus。我们对该位置上的名词进行语义倾向的分析,主要包括:1)爆发传播义。主要使用如下一些词,如outbreak、arrival、spread、emergence、transmission、spreadability等。2)报道义,表示对新型病毒的新闻报道。主要使用如下一些词,如case、report、news、story、discovery、murmur等。3)源头义。主要使用如下一些词,如center、epicenter、origin、source等。4)危害义。主要使用如下一些词,如risk、threat、death、impact、effect等。5)认知义,表示对新型病毒的认知。主要使用如下一些词,如fear、identification、vision、speculation、background等。需要指出的是,这些词有时候会出现在该序列右边,并且几个语义倾向同时出现,如a case of a new virus spreading,但以出现在序列左边为主。另外,在该序列周围,名词China、Chinese city、Wuhan,动词happen、emerge、appear以及介词in、from等高频次出现,可以看出美国社会舆论将这种新型病毒甩锅给中国的倾向性,这也是该序列构成词项的主要语义韵特征。
with + a/an + adj.+ virus
该序列左1的位置主要以动词为主,可以做类联接分析,即V + with + a/an + adj.+ virus。该位置上的语义倾向也比较简单,主要有两类:1)解决义。主要使用的词有deal、grapple、work、cope等。当该类语义倾向出现时,周围会出现we、the world、you,并且现在进行时频繁出现,表达出一种有决心战胜疫情的语义韵。2)感染义。主要使用的词有infected、sicken、fall ill、suffer等。当该类语义倾向出现时,周围会出现数字以及risk、death等词,多数情况下属于客观陈述。当表示源头义的词语出现时,China和Wuhan也会同时出现。
from + a/an adj.+ virus
该序列左1的位置主要以名词为主,有时候也会出现动词,可以做类联接分析,即N + from + a/an + adj.+ virus。该位置上的语义倾向则更简单,主要表示死亡义,如death、death toll、infection、dying等。另外,周围经常出现China和表示报道义的动词,说明该序列构成的词项主要用来介绍早期中国有关病毒的报道,并且主要关注了病毒的致死率,呈现出一种恐慌的语义韵。
to + a/an + adj.+ virus
该序列在语料库中出现的总频次虽然比较少,但在左1的位置上词性变化比较多,不适合做类联接分析。该位置上的语义倾向也较为丰富,主要包括:1)反应义。表示人类对新型病毒做出的反应。主要使用的词有response、respond、adapt、change等。2)相关义。主要使用的词有related、linked、attributes等。3)感染义。主要使用的词有victim、succumb、immunity等。该序列构成的词项呈现出一种中立客观的语义韵。
by + a/an + adj.+ virus
该序列左1位置上主要以动词为主,可以用类联接V来表示,即V + by + a/an + adj.+ virus。该位置上的语义倾向主要有两种:1)致使义,表示由病毒导致的病症、疫情等。主要使用的词有caused、sparked等。周围共现的其他词有illness、pneumonia、disease、outbreak等。2)破坏或者感染义,表示病毒的危害。主要使用的词有infected、sickened、invaded、threatened、disrupted、hit、destroyed、stricken、impacted等。这个序列构成的词项呈现出一种危险恐慌的语义韵。
我们把序列a/an + adj.+ virus构成的词项放在一起,绘制出一张网络图(如图 3所示)。从图中可以看出,尽管各个单位之间有些成分会相互交错,但意义单位的走向和脉络是清晰的,各个成分的线性关系也是清楚的。
5. 讨论
CCDA使用的关键词和搭配词分析属于粗线条的、碎片化的,严重脱离了文本语境,只能从宏观上把握文本的主题和大致的语义区块划分,研究者要用定性分析,将客观的数据统计与主观的意识形态分析统一起来,最终验证某种假设。实际上,这种研究范式只碰触了文本数据的冰山一角,尚未真正深入文本内部,更无法考察意义如何在文本中产生。
许多研究者认为,深入解读适合在单一或少量的文本里展开,并不适合语料库研究,因为语料库由大量的不同文本构成,语料库研究的核心技术“上下文关键词检索”(KWIC)实际上是不同文本之间的互文性解读。我们从以下两个方面解决这个问题:首先,要使用专门用途语料库,如美国新冠病毒语料库,该语料库收集的文本在主题和来源上都高度一致,能够形成一个特定的话语集。其次,分析路径必须高度依赖对文本的观察,不能脱离文本做主观判断,如词项分析通过严格的路径,观察语言如何在线性维度上建构意义。
实际上,本研究呈现的是一种语料库驱动的话语分析研究范式,与CCDA不同,在研究开始之前,做最小的假设,不会从语言直觉中寻找任何重要的证据。从特定话语中的话语对象入手,通过描写话语对象所在词项的型式、语义和态度义,分析该话语社团是如何针对话语对象展开讨论的,即如何建构特定话语的意义。因此,意义分析是语料库驱动话语分析的目的,而CCDA的目的是研究各种社会问题,数据只是用来验证假设。由于词项分析也涉及态度义,因此完全可以研究话语社团在建构话语对象意义时所持的态度和立场。在美国新冠病毒话语中,virus是个重要的话语对象,美国特定话语社团(这里指在线期刊杂志话语社团)是如何建构virus的意义,以及表达其态度和立场呢?从本研究的数据分析来看,首先,由virus这个搭配核构成的不同词项所表达的意义和态度是不一样的,这些意义和态度正是美国在线期刊杂志话语社团在谈及新冠病毒时所讨论的意义和所持的立场。其次,由virus构成的所有词项形成一个巨大的语义网络,在这个网络中,不同的词项,有的相对独立,有的相互交错和重叠,但意义的走向和脉络却非常清晰。
与Sinclair(2004a)的词项分析相比,本研究更具“拉近镜头”的效果,这完全是出于语料库驱动的话语分析的需要,因为在研究特定话语的意义时,越具体细致,越能看出话语文本是如何通过具体的语言表达形式来建构意义的。如果按照Sinclair(2004a)的做法,冠词the、a、an会记作搭配核virus的搭配词,而to、of、with、for等则会通过类联接的形式写进词项,而不对每个介词分别进行分析。在词项的更外围的地方,由于出现的词性变化更多,通常进行语义倾向的分析,最后再从更为扩展的语境中,寻找语义韵的证据。显而易见,这种分析适合找到搭配核virus的不同词项,但是在捕捉词项内部意义变化和走向时则会显得较为粗糙,不够精细。当然,Sinclair(2004a)的研究目的是在通用语料库中发现词项,而本研究的目的是探讨特定话语中的重要话语对象的意义建构以及表述和呈现形式,当然分析越细致越好。需要指出的是,细致程度也是有限制的,在分析数据时,我们发现,搭配the virus左面出现的介词是个有限集,并且每种介词左面出现的词不管是在词性还是在语义上都会有所差别,因此我们才对每个介词进行了分别描写,研究结果证明我们的研究方向是正确的。
另外,与Sinclair(2004a)的分析不同,本研究没有严格按照搭配、类联接、语义倾向和语义韵的顺次依次从搭配核向外展开,如在分析a/an + adj.+ virus序列时,就先做了类联接的分析,即形容词,然后才把a/an记作搭配。另外,有时候我们会对词项中的同一个成分做不同层面的分析,同样以a/an + adj.+ virus为例,我们对virus左1位置上的词,不仅做了类联接分析,而且做了语义倾向的分析,因为我们观察数据时发现,该位置上出现了较为明显的语义限制,不是所有的形容词都能够填充到这个位置。这是对Sinclair(2004a)词项分析的灵活应用,适合于开展语料库驱动的批评话语分析研究。
6. 结语
词项分析的优势在于能够深入文本,观察大量文本数据,将频繁出现的语言序列特征用一个完整的描写框架统一起来,共同形成一个完整的意义单位。研究语篇的意义,需要从最基本的意义单位开始,这些意义单位又以各种方式联结在一起。所谓话语对象,就是与某类话语语篇内容高度相关的概念,是被重复使用的概念,话语语篇会围绕这些话语对象展开,因此,话语对象是研究某类话语语篇意义的很好的切入点。在新冠病毒话语中,virus就是个重要的话语对象,通过研究virus构成的词项的意义,能够直观地了解某个话语社团如何诠释virus的意义。需要指出的是,受研究篇幅的限制,本研究没有穷尽virus所有的词项,如序列V + the virus构成的词项,但可以想象,如果将virus所有的词项描写出来,词项网络图将会更加庞大和复杂。最后,本研究绘制出的词项网络图对于计算机自动提取词项具有一定的启示。
① 用大写字母描写语义倾向,目的是与搭配词区分开。
-
[1] Baker, P. Using Corpora in Discourse Analysis [M]. London: Continuum, 2006.
[2] Baker, P., Gabrielatos, C., Khosravinik, M., Srzyzanowski, M., McEnery, T. & R. Wodak. A useful methodological synergy? Combining critical discourse analysis and corpus linguistics to examine discourses of refugees and asylum seekers in the UK press[J]. Discourse & Society, 2008, 19(3): 273-306.
[3] De Saussure. Course in General Linguistics[M]. New York, Toronto & London: McGrow-Hill Book Company, 1959.
[4] Sinclair, J. Beginning the study of lexis[C]// Bazell, C., Catfor, J., Halliday, M. & R. Robins. In Memory of J.R. Firth. London: Longman, 1966.
[5] Sinclair, J. Trust the Text [M]. London: Routledge, 2004a.
[6] Sinclair, J. New evidence, new priorities, new attitudes[C]// Sinclair, J. How to Use Corpora in Language Teaching. Amsterdam: John Benjamins, 2004b.
[7] Sinclair, J. Progress and prospects in corpus linguistics[J]. 现代外语, 2004c, (2): 113-128.
[8] Stubbs, M. Text and Corpus Analysis[M]. Oxford: Blackwell, 1996.
[9] Teubert, W. Meaning, Discourse and Society [M]. Cambridge: Cambridge University Press, 2010.
[10] 李文中. 接着做: 扩展意义单位分析[J]. 当代外语研究, 2021, (6): 13-26. https://www.cnki.com.cn/Article/CJFDTOTAL-HSSZ202103019.htm [11] 王琦. "一带一路"英文媒体中的中国企业形象——语料库辅助下的批评话语分析[J]. 当代外语研究, 2019, (3): 99-113. https://www.cnki.com.cn/Article/CJFDTOTAL-KJYY201903011.htm [12] 张瑞华, 李顺然. 国内基于语料库的批评话语分析研究综述[J]. 当代外语研究, 2020, (6): 101-110. https://www.cnki.com.cn/Article/CJFDTOTAL-KJYY202006012.htm [13] 甄凤超. Sinclair语料库语言学视阈下的语言教学难题及解决途径[J]. 语料库语言学, 2019, (2): 56-65. https:# -
期刊类型引用(9)
1. 左慧芳. 基于扩展意义单位模型的老年人媒介形象分析. 长沙大学学报. 2024(03): 15-23 . 百度学术
2. 甄凤超. 复合词项语义韵研究再探. 外语教学与研究. 2023(01): 41-52+159 . 百度学术
3. 苏杭,叶军,张钰卿. 局部语法框架下中美媒体新冠疫情话语表征分析. 外语与外语教学. 2023(01): 12-23+144 . 百度学术
4. 刘传江,谢芳. 学术英语词表验证的共选路径——以“common”为例. 中国ESP研究. 2023(01): 55-66+129 . 百度学术
5. 刘运锋. 扩展意义单位再审视. 外国语(上海外国语大学学报). 2023(04): 17-26 . 百度学术
6. 范晨曦,杨洪娟. 基于语料库的“命运”一词的英译研究. 英语广场. 2023(22): 50-54 . 百度学术
7. 邓素兰. 语料库驱动下的英语动词配价结构研究. 萍乡学院学报. 2023(04): 77-81 . 百度学术
8. 胡文飞,刘亚兰. 语义韵视域下汉英词典文化词的记忆研究. 外语教学理论与实践. 2023(06): 31-41 . 百度学术
9. 张瑞华,刘泽蕊. 中西媒体关于“数字经济”的话语建构对比研究. 外国语言与文化. 2022(03): 133-145 . 百度学术
其他类型引用(1)