obsidian-notes/代码/合同识别工具.md

11 lines
566 B
Markdown
Raw Permalink Normal View History

2024-04-15 03:19:57 +00:00
---
title: 合同识别工具
updated: 2022-07-26 07:39:28Z
created: 2022-07-26 05:57:57Z
---
报价支撑需要扫描合同,扫描件包含多份合同,需手动分割并以合同号命名。可考虑使用软件自动化处理。
# 思路
第一步转化为图片便于OCR识别不同合同关键字为【合同号XXX所名】需全字匹配避免合同附页被分割
第二步,获取合同号。经观察样本,首页合同号可能比较模糊,可通过识其它页的合同号提升准确度
第三步,提取页面、重命名。