匿名信汉字输入法判定——刑警学院

贡献者:🦩🦩小鹤音形养老中 类别:简体中文 时间:2024-04-06 23:28:15 收藏数:7 评分:0
返回上页 举报此文章
请选择举报理由:




收藏到我的文章 改错字
本文探索了不同输入法产生的言语错误类型,把握其规律,为打印匿名信所用输入法的判定提供依据。方法:
对拼音输入法、五笔输入法、手写输入法的言语错误类型进行比较分析和分类统计。结果与结论:
不同输入法的言语错误类型不尽相同,根据文字材料中错别字的类型与特征,可以推断打字者
所用的汉字输入法,这对某些案件的侦查具有缩小范围的作用。作者简介:欧阳国亮,中国刑警学院教授,
主要从事言语识别与鉴定分析,痕迹检验的教学与办案工作。
打印形成的匿名信给检验鉴定工作带来了诸多麻烦,一是这类信没有手写字迹,造成排查嫌疑人困难;
二是国内打印机具、打印材料及文字字库都比较单一,造成确定打印来源困难,这都给案件的办理增加了难度。
但从另一个角度看,凡是打印的文件,就不得不涉及汉字输入法。我国的汉字输入法相比
其他国家而言种类要多,大致可分为三大类:形码类(如五笔、郑码、虎码等)、拼音类(如全拼、各种双拼)、
音形类、手写类。不同的人,对这三类输入法的掌握及使用情况有所不同,匿名信制作者也不例外。
这就为我们推断匿名信制作者使用的输入法提供了可能。一、判定汉字输入法的侦查学价值。
对于某些打印类匿名信案件,如果能判定出该信制作者所用的汉字输入法,
那么对整个案件的侦查来说有其特殊的价值。这种价值主要表现在两个方面:(一)
可以推断匿名信制作者的汉字录入习惯,从而缩小侦查范围。个人使用汉字输入法具有很强的稳定性,
也就是说某个人习惯使用一种输入法后,在很长的一段时间内都会选择这种输入法,从而形成既定的习惯。
对于某些案件而言,在嫌疑对象较多的情况下,如果能够根据文中的言语特征判定出匿名
信作者的汉字录入习惯,那么就可以起到缩小侦查范围的作用。如东北某县一散步虚假恐怖信息案,
犯罪嫌疑人制作了多封匿名信邮寄往学校、政府机关,造成不良影响。警方经过对信纸、信封、
信文打印痕迹进行分析,初步判定该系列匿名信出自该县教育局人事股。但人事股有七、八个人,
难以确定具体是何人作案,于是将匿名信送至我部门。在检验过程中,我们发现信文有几处错别字比较扎眼:
“响应号召”打成了“相应号如”,“联合签名”打成了“联合答名”。这应该是五笔输入法输错字根所致,
因为“召”和“如”的字根分别是“VKF”“VKG”,
“签”和“答”的五笔字根分别是“TWGI”和“TWG”,它们的字根都非常接近,
据此判定匿名信制作者使用的是五笔字型输入法。经警方进一步调查,平时人事股只有曲某一人有五笔打字习惯。
事后,曲某对匿名信事件供认不讳,交代了作案的动机和过程。(二)
有助于推断匿名信制作者的年龄及文化水平,为案件侦查提供线索。
有些汉字输入法跟文化水平及年龄有较大的关系,如文化水平中上者中一般对拼音输入法较为熟悉,
而年龄较大者或者文化水平较低的人,一般习惯使用手写输入法。前几年,山西一铁路公安部门联系到笔者,
表示他们一部门领导连续两年收到匿名恐吓信,给其身心带来很大影响。尽管多次进行了排查,
但由于恐吓信系打印形成,没有发现特殊线索。于是希望我们能对匿名信做进一步分析,协助调查。
我们对检材进行分析后发现,信文中出现了较多的错别字,量化统计后发现这些错别字多为笔画多的复杂字形,
如“道德败坏”写成“道徝败坏”,“世事繁杂”写成“世事擎杂”等。我们对这些字进行了反复的录入实验,
实验结果表明无论是拼音还是五笔均不可能出现上述错别字,只有手写输入法会造成这种识别错误(下文将论述)
。据此我们推断匿名信制作者使用了手写输入法,
同时结合信文内容多涉及内部事情以及多处言语表达错误等情况,进一步推断匿名信制作者应该是一名文化水平
不高的老年人。建议以此作为线索,重点排查内部文化水平不高但已退休的人员。不久嫌疑人聂某浮出水面,
该嫌疑人年龄65岁,两年前退休,因对退休后的待遇问题不满,于是想出了恐吓领导的办法以发泄情绪。
综上所述,判定打印类匿名信所使用的汉字输入法,
可以用来推断匿名信作者的文字录入习惯及年龄甚至文化水平,进而为案件的侦查侦破工作起到缩小范围、
提供侦查线索的作用。二、各种汉字输入法的判定。
为什么根据言语特征就能够判断作者所用的汉字输入法呢,原理又是怎样的?
这是因为今天的电脑普遍使用拼音输入法、五笔字型输入法、手写输入法等。
匿名信制作者在运用这些输入法输入汉字的过程中,难免会造成一些言语错误,如错别字、错误词语、标点等。
输入法的不同,造成的言语错误类型也会有所不同,比如五笔输入法造成形近别字,
拼音输入法容易造成音近别字等。这些言语错误,可作为判定匿名信作者使用何种输入法的基本根据。(一)
五笔字型输入法的判定。五笔字型输入法是一种非常高效的汉字输入法,它将文字拆分为不同的字根,
因此重码率低,使用者较多。运用五笔字形输入法录入汉字容易产生的错别字有三类:一是形近别字。
如“进入”打成“进人”,“休息”打成“体息”,“窍门”打成“窃门”等。这些字都是由于形体过于相近,
录入者一时不注意输入识别码或者选错词条造成的。二是偏旁部首相同的别字。如“信息”打成“停息”,
“团结”打成“图结”,“营运”打成“管运”等。这类错别字的形体差别较大,但因偏旁部首相同,而且结构
相近,运用五笔输入法录入时容易输错字根从而造成错别字。三是字根部件相似的别字。
如“学生”打成“沉重”,这是因为“学”与“沉”都有三点和“冖”的字根部件,只是位置不同。此外,
“生”与“重”在字根部件上也有很大的相似性。
运用五笔输入法录入“学生”“沉重”这两个词语时输入的字根都是“IPTG”,稍不注意就会造成错词。
判定匿名信作者使用的输入法是否为五笔输入法,主要看文中的错别字(或打错的词语)是否属于上述三类。
尤其是第三类,价值非常高。此外,五笔输入法打错的字或词,很容易导致整个句子不通顺,
如“这件事我不想让它变得热搞(闹)”“一把手大变样,沉(学)习作风大变样”“如(召)集上访群众”。
因此,在检验分析匿名信时,凡是碰到这种情况时,首先应该考虑该字是否由五笔输入法录入,
同时要注意结合五笔字根的特点予以辨别,不能当成普通的错别字来看待。必要的时候,
应该在电脑上用五笔输入法自己试验几次,检验一下错别字是不是因为它与本字在字根上趋同造成的。
拼音输入法略,详见完整论文。三、判定汉字输入法需要注音的问题(一)注重言语特征的数量(二)
注意甄别形近别字(三)注意区别对待方音别字(四)注意结合言语识别方法进行综合识别
声明:以上文章均为用户自行添加,仅供打字交流使用,不代表本站观点,本站不承担任何法律责任,特此声明!如果有侵犯到您的权利,请及时联系我们删除。
文章热度:
文章难度:
文章质量:
说明:系统根据文章的热度、难度、质量自动认证,已认证的文章将参与打字排名!

本文打字排名TOP20

登录后可见