《中文教学现代化学报》期刊 第六期
论文作者
											孙启高
										
									
								
									
										作者地址
											文学与新闻传播学院, 山东大学, 济南市, 山东省, 250100
										
									
								
									
										电子信箱
											sqg712@sohu.com
										
									
								
									
										摘要
											本文从“三严三实”导入,论述了公文数字缩略语在公文中的重要功能,以及公文数字缩略语识别对公文自动理解和办公自动化的重要意义。对公文数字缩略语进行识别,主要运用二元相关性理论,建立 1200 多万字的当代汉语政教类公文抽样语料库,在对语料库进行分词、标注等加工的基础上,对其中“数词+名词”和“数词+动词”模式的二元相关性组合进行了抽样统计分析,以此为基础对公文数字缩略语进行识别和抽取实验,获得了比较理想的结果,为缩略语的自动识别和公文自动理解提供了新的思路和方法。
										
									
								
									
										关键词
											公文 语料库 数字缩略语 二元相关性 识别
										
									
								
							 
	