档案数字化

点击图片查看原图

单价：	￥49800.00
品牌：	文通销售支持廖仁君 13146317170
销量：	累计出售 0 件
评价：	已有 0 条评价
更新：	2015-07-07
数量：	件库存99999件

公司基本资料信息

北京文通科技有限公司(OCR事业部)
已缴纳 0.00 元保证金
联系人廖仁君(先生) 销售经理
会员 [当前离线] [加为商友] [发送信件]
邮件
电话
手机
地区北京-海淀区
地址北京市海淀区北四环西路9号银谷大厦1609室

商品详情
评价详情(0)
交易记录(0)

档案数字化----文通TH-OCR资料数字化系统

立即购买

一、软件简介

北京文通科技有限公司作为一家拥有自主知识产权，以清华光学字符识别TH-OCR及手写识别两大核心技术为先导的独立软件开发商及行业解决方案提供商，一直致力于文字识别技术的发展。依托清华大学强大的技术后盾，沉淀、积累了卓越的识别技术，为我国信息化建设做出了巨大的贡献。

文通TH-OCR资料数字化系统是一套专业的档案、图书、期刊、报纸等纸介质文档以及电子版图像资料的数字化加工工具。

二、详细介绍

2．1拓扑结构

2．4．1图像处理

倾斜校正
去噪声点
去装订孔
滤除颜色及灰度化、二值化

2．4．2版面分析、识别、校对、生成双层PDF文件

2．4．2．1版面分析

可以对档案、图书、公文、报纸等进行自动版面分析。将版面分为横排文本、竖排文本、图像、表格四种类型。用户也可以根据需求，进行手动版面分析。

2．4．2．2识别核心

识别核心
文通TH-OCR资料数字化系统内置文通科技最新研发的高性能文字识别引擎，识别率达99.8%以上。
Unicode编码
采用UNICODE国际编码标准。系统可在一个统一的平台下，同时处理包括中文、日文、韩文、英文在内的多种文字的识别和校对修改。
XML技术
系统基于开放式的XML数据结构，可以对数据进行扩充和再定义。支持第三方开发厂商方便地进行文档数据的转换、迁移和再利用。
识别语言种类
简体多体、繁体多体、简体全字集、繁体全字集、纯英文、日文、韩文。

2．4．2．3校对

2．4．2．3．1横向校对

1.在识别结果区域中，通过人工逐字逐句比较识别结果与原始图像，找到错误的地方并修改。
2.浮动跟踪条可以提高横向校对的速度，它是将识别的原始图像块跟踪显示在识别结果上，使识别结果与原始图像一一对应的显示，直观、方便、快捷

2．4．2．3．2集字校对(纵向校对)

1.查错率高，集字校对编辑器把识别结果相同的文字对应的图像显示在一起。由于少数错误的字与大量正确的字有差别，可以比较容易地发现错字，不易漏掉错误。
2.集字校对编辑器重新组织文字顺序，不会使校对人员陷入到识别文字的故事情节中。
3.校对效率高，不易疲劳。
4.把集字校对的结果与传统方法校对的结果进行比较、综合，就能得到最高的查错和纠错效果，得到尽可能低的错误率和最好的最终结果。

2．4．2．3．3双路校对

对一次识别结果进行两路的校对,分别为一路校对和二路校对,最终两个人的结果会进行双路的比对.一路和二路的识别采用横向校对方式.双校比对每行文字,如果两次校对结果不一样会反红显示.

2．4．2．4生成双层PDF文件及多种文件格式

识别结果经修改编辑后，可根据需要将文档存为RTF、双层PDF、 TXT格式。

导出为双层PDF格式
导出为RTF格式
导出为TXT格式

2．4．3题录数据录入

题录著录：根据题录项要求录入题录数据

-----咨询来电：13146317170 廖仁君； QQ:121176730 微信：13146317170

供求通

推广服务

档案数字化

档案数字化----文通TH-OCR资料数字化系统

平台客服