研究方法专题 | 文本分析法_文本分析的研究方法
文本分析法
文本分析法(Textual Analysis)指的是从文本的表层深入到文本的深层,从而发现那些不能为普通阅读所把握的深层意义。文本分析是自然语言处理(Natural Language Processing, NLP)领域的一个重要分支,是指对文本数据或语料库内的语料进行分析,最终提取出给定语料的各种信息,包括关键词、词向量等内容的计算机技术,在一些文献中也将这一领域的相关技术纳入自然语言处理预训练技术之中。
Part 01.
文本分析法的类型
1.描述型文本分析:在研读文本的基础上对文本进行描述、比较、阐释和评价的研究方法。
赵勇对文学作品《明朝那些事儿》所做的文本分析,主要以描述和举例说明的方法,分析作品中所采用的文学性写作手法,如戏仿、戏说、反讽、征引、调侃、挪用、庄词谐用、今词古用等等。也有研究者用这种方法对政策类文本进行分析,如范国睿基于中国40年教育改革政策文本进行分析,考察教育制度的变迁。
2.统计型文本分析:对文本进行分类和统计,在此基础上,进行描述、比较和评价性分析。
喻国明对6000余条网络谣言所做的文本分析,使用了人工编码、关键词提取、分类、文本描述等方法,对谣言的分类、叙事结构、场景构筑、关键词、标题特征等进行分析。陈雅赛对新冠疫情爆发初期的256条网络谣言所做的文本分析,根据谣言发布时间、内容、发布平台、辟谣回应、辟谣者身份构建类目,分析突发公共卫生事件网络语言传播特点。
3.计算型文本分析:通过文本分析软件,机器学习和自然语言处理算法,对大量文本进行分析处理。
刘玉林、菅利荣在分析电商平台的用户评论时,采用Python抓取电商平台用户评论数据,通过数据清洗,对文本进行处理,去重、提取目标文本、创建特征数据,用文本情感分析模型进行分析,判断电商在线评论的情感倾向和情感变化。
Part 02.
主要的分析结构
1. “新批评”法
新批评法是现代英美文学批评中最有影响的流派之一,兴盛于20世纪四五十年代,后来渐趋衰落,但仍然是文学批评的一种基本方法。新批评法提出了“语境”的概念,所谓“语境”指某个词、句或段与它们的上下文的关系,正是这种上下文确定了该词、句或段的意义。新批评法的具体方式就是“细读”,通过细读来捕捉词句中的言外之意、暗示和联想等,
2. “符号学”分析法
符号学中的“符号”指“携带意义的感知:意义必须用符号才能表达,符号的用途是表达意义”。丁和根将传播符号学的研究覆盖范围归纳为三个方面:一是研究大众传播中符号与符号的组织关系,如大众传播语言组织规律,文本和话语的结构,语言符号和非语言符号的搭配等;二是研究大众传播符号的意指作用,能指与所指关系的发生即意义的生成和传达等问题;三是研究大众传播符号与符号使用主体之间的关系,着重探讨媒介话语背后所隐含的社会认知和意识形态因素。
3. “叙述学”分析法
叙事学(narratology)产生于20世纪60年代,于1985年被引入中国。它可分为“经典”与“后经典”两个不同派别。经典叙事学旨在对叙事作品的构成成分、结构关系和运作规律等展开科学研究;后经典叙事学则将注意力转向了结构特征与读者阐释相互作用的规律,关注作者、文本、读者与社会历史语境的交互作用。
4. 文本功能分析框架(纽马克)
英国实践型翻译理论家彼得·纽马克将文本分为三种类型:表达型、信息型和呼唤型。他同时强调,文本类型的划分并非固定不变,大多数文本通常兼具两种或以上的功能,只是某一功能占主导地位。他主张针对不同类型的文本,应采用相应的分析方法。
Part 03.
经典案例分析
标题:《镜像苏州:市民参与和话语重构——对UGC视频和网友评论的文本分析》
作者:杜丹
来源:《新闻与传播研究》2016年8月
摘要:在网络社交平台上,UGC(user-generated content,用户生成内容)视频的制作是市民主动参与城市形象塑造的一种文化实践。与官方和商业制作的城市形象宣传片相比,市民的影像生产与话语表达重塑了城市的形象,对主流生产的文本形成呼应或挑战。文章以苏州为个案,对优酷网中13部记录该城市景观的UGC视频及围绕这些视频的网友评论文本展开分析,发现:UGC视频的生产者运用重构参与式场景、强化被忽略的细节和重塑"异见"时空的空间生产策略,创造性地表征自身所处的城市空间。作为一种参与式文化实践,网民的话语构成了城市形象议题在网络空间中的公共表达,他们通过对官方和商业资本的认同、嬉戏、协商或对抗,维系了自身与城市的亲密关系,重新定义了城市的自我认同。
关键词:城市形象;参与式文化;市民参与;话语;
研究设计
1. 研究对象的确定:
本研究采用 “目的性抽样”的方法采集文本,并针对它们展开文本分析。文本内容包括:
?UGC视频:首先,将考察个案的内容界定为网民拍摄的现代城市空间中典型的地标性建筑或大型公共场所 ( 如东方之门、金鸡湖城市广场等) 、苏式传统文化的视觉呈现 ( 如狮子林、苏绣等) 以及生活在其中的人们日常生活的影像记录。其次,在综合浏览的基础上,依据视频的播放量、评论量等线上数据指标来缩小抽样研究的范围,以此选取了 2007 年以来,在优酷网中由个人创作和发布的记录苏州城市景观的 UGC 视频共 13 部,其中,网民原创视频 11 部,包括记录城市典型地标性景观的视频 6 部,记录苏式传统文化的视频 3 部,记录城市市民日常生活的视频 2 部。另外,与这些原创视频不同的是 2 部网友二次生产的视频,它们由网民通过拍摄、剪辑和文字等拼贴而成。
?网友评论:对网友评论的采集主要以这些视频的跟帖评论为样本,本文主要聚焦了 2 个非常流行的视频,它们的特别之处在于促使了大量网友参与城市形象话题的讨论,一个是 《实拍苏州标志性建筑 “东方之门”貌似秋裤遭网友吐槽 “秋裤楼”》,另一个是 《苏州金鸡湖音乐喷泉》。
?参考系:由于官方城市形象宣传片和标志性建筑的商业宣传片主要在电视、户外显示屏等大众媒体中播放,是苏州城市形象塑造的重要媒介,其播放会对观看者产生举足轻重的影响,并构成本文所分析的 UGC 视频可采用的参照系,因此,本研究采集了2007 年至今由主流媒体发布的苏州官方城市形象宣传片 10 部和 “苏州东方之门”城市地标性建筑商业宣传片 1 部作为关键个案进行比较研究。
2. 文本特征提取
?视频文本:
?评论文本:将评论按情感态度分为“赞扬”“批评”“中立”和“其他”四类,通过随机抽样确保数据的随机性和可比较性。(如表3)
? 参照系文本:
3. 对文本进行分析
·根据城市形象所具有的 “可识别”和 “惹人注意”的特征,并结合网络空间中的讨论热点,本研究主要聚焦 “东方之门”、金鸡湖和苏州园林,围绕它们的视频文本作为 “表意时刻”,并结合主流形象宣传片,对 UGC 视频文本中形象的符号表征及其空间生产策略进行比较分析。
结论:
(1)UGC视频文本重构参与式的城市空间
(2)UGC视频文本强化被主流忽略的细节
(3)UGC视频文本重塑“异见”时空
·根据表三中网友对UGC视频《苏州金鸡湖音乐喷泉》评论的态度分布,对其评论内容进行分析。
结论:
(1)市民参与城市形象塑造
(2)话语构成公共表达
(3)市民对城市形象的态度差异较大
(4)民间话语力量的增强
研究结果
1.市民参与式文化的兴起
2.多元主体话语的互动与协商
3.城市形象话语的多样化与动态性
Part 03.
文本分析法优缺点
1.优点
(1)非介入性:文本分析主要依赖于现成的文本信息,避免了研究者对研究对象的干扰。
(2)超时空性:文本分析可以跨越时间和空间的限制,通过线上或线下的资料收集进行研究,且研究时长可以持续。
(3)综合性:文本分析结合了定性研究和定量研究的特点,既包括主观因素较多的定性研究,也包括需要充足客观事实支撑的定量研究。
(4)低成本性:与其他研究方法相比,文本分析法对时间、精力和经费等资源的消耗相对较少,对研究条件的要求较低。
(5)可证实性:文本分析需要学术经验和客观科学的证据支撑,并应经过系统化的调查取样。
(6)归纳性:文本分析不是研究者自己事先对假设的演绎与阐释,而是对现有文本材料的归纳分析,强调多维度地深入文本材料,自下而上地浓缩、建构出一套理论框架。
2.缺点
(1)采用个案研究,样本量少,代表性低
(2)其研究结果的外在效度不高
本文转自 | 未来传播研究实验室