联系方式

  • 电话:020-29013651
  • 业务热线:18620037053
  • QQ:2607120400
  • 地址:广州白云区太和镇和虎路25号
当前位置:ag电子游戏 > 印刷常识 >

印刷中使用扫描仪的OCR识别软件识别出来的文字

使用扫描仪的OCR识别软件识别出来的文字有乱码,原因是什么?影响识别方法的因素有哪些?
出现乱码的原因很多,譬如:①文字的方向不对,我们可以调整文字方向以减少这种现象的发生;②定义的文字
 
属性(简体、繁体、纯英文、手写体等)与原稿不符;③如果字旁有辅助线,字体为斜体或艺术字等此类原稿
 
也不能被正确识別,可能出现乱码;④文字原稿的扫描分辨率设置不当;⑤原稿不清晰,譬如:传真件、油印试
 
卷、报纸等。可以适当地调节图像的对比度或亮度以得到较好的扫描效果,提高识别率。 _
现在通过扫描方法进行汉字识别的技术已经非常成熟,扫描的文字稿质量好的话,准确率可达95%以上。有时
 
会出现准确率较低的情况,这时主要是因为有以下因素的影响:文字中有线条干扰,这时就会出现识别率低;文
 
字的字距太密;文字的行距太密;文字的扫描质量太差,字不清楚,断线画的地方多;针对以上情况可在
 
Photoshop中删除干扰的因素,并调整字距、行距。