Jump to content

10. 基于语料库的公文数字缩略语识别研究——从“三严三实”谈起


1 Screenshot

About This File

《中文教学现代化学报》期刊 第六期


论文作者

孙启高

作者地址

文学与新闻传播学院, 山东大学, 济南市, 山东省, 250100

电子信箱

sqg712@sohu.com

摘要

本文从“三严三实”导入,论述了公文数字缩略语在公文中的重要功能,以及公文数字缩略语识别对公文自动理解和办公自动化的重要意义。对公文数字缩略语进行识别,主要运用二元相关性理论,建立 1200 多万字的当代汉语政教类公文抽样语料库,在对语料库进行分词、标注等加工的基础上,对其中“数词+名词”和“数词+动词”模式的二元相关性组合进行了抽样统计分析,以此为基础对公文数字缩略语进行识别和抽取实验,获得了比较理想的结果,为缩略语的自动识别和公文自动理解提供了新的思路和方法。

关键词

公文 语料库 数字缩略语 二元相关性 识别

×
×
  • Create New...