图书数字化加工流程方案

2025-10-27 15:26:34

1、  图书的主要类型为地方志和地名志,图书的出版日期跨度比较大,有70、80年代的图书,以90年代以后的图书为主。也有比较古老的书籍,这些古老的书籍数字化是非常要注意的,需要用到专业的古籍数字化设备。

图书数字化加工流程方案

2、现在的图书馆数字化和以往的不太一样,甚至说是区别很大因为以往的数字化图书都是要把书拆开一页一页的扫描完成后在把书装订好还回去,这是很麻烦步骤,并且如果是量比较大的话这种方法是不可取的。

现代的图书馆数字化都不是之前的高速扫描仪一张一张的扫描了,如今采用的都是非接触式不拆书的扫描设备比如book2net、iscan等等甚至有全自动的扫描机器人kabis可以帮助您来扫描完成成册的图书,一本成册的图书那简直是在谈笑风声间完成。

图书数字化加工流程方案

3、图书内容的分类

一本书分为四个部分正文、前言、图片和后记四个部分。

1)正文

从正文的第一页到正文的最后一页的所有图书页。

2)前言

正文第一页之前的所有文字页。

3)图片

 书中不算页码的所有图片。

 4)后记

正文最后一页到图书结束的所有文字页。

图书数字化加工流程方案

4、  命名规则

  正文命名为图书名

  -0001

  ;

  前言命名为图书名

  -0002

  ;

  图片命名为图书名

  -0003

  ;

  后记命名为图书名

  -0004

  ;

  例如:书名为北京市志,一本书按规则将分别命名为:

  正文部分为北京市志

  -0001

  ;

  前言部分命名为北京市志

  -0002

  ;

  图片部分命名为北京市志

  -0003

  ;

  后记部分命名为北京市志

  -0004

  。

图书数字化加工流程方案

5、扫描时注意阀值,对比度,亮度这三个方面值的调整。这三个值的设置

关系到扫描图像的质量和对后期

OCR

文字处理环节有较大的影响。同时要

注意图书页码的顺序,不要缺页,没有重复页码的出现

6、图像处理及质检

1、图像处理

  使用专业的书刊扫描仪图像可以自动处理,图像处理环节主要是对扫描的图像进行去黑边、去杂点、校正的处理,保证阅读,同是也是为下一环节OCR文字处理做准备,提高文字识别的正确率。

2、图像质检

  本环节是对图像处理环节的结果进行质检,进一步保证图像的质量和页码的正确性和对应关系,同时也是进一步提高OCR文字处理环节的文字的识别率。注:如图像处理环节对图像的处理达到标准,此环节可以省略。

图书数字化加工流程方案

7、数据的保存一定要合理把建立好的目录按时间或者是什么分类进行配置后储存到相应的管理软件中就可以了

图书数字化加工流程方案

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢