OCR 기술로 언어 번역 개발 지원 - 사전 펜 - 뉴스

OCR이란 무엇입니까?

광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 형식으로 변환하는 프로세스를 말합니다. 예를 들어 양식이나 영수증을 스캔하면 컴퓨터는 스캔한 내용을 이미지 파일로 저장합니다. 텍스트 편집기를 사용하여 이미지 파일의 텍스트를 편집, 검색 또는 계산할 수 없습니다. 그러나 OCR을 사용하여 이미지를 텍스트 문서로 변환하고 콘텐츠를 텍스트 데이터로 저장할 수 있습니다.

png

OCR이 중요한 이유는 무엇입니까?

대부분의 비즈니스 워크플로에는 인쇄 매체를 통해 정보에 액세스하는 작업이 포함됩니다. 종이 양식, 송장, 스캔한 법률 문서 및 인쇄된 계약서는 모두 비즈니스 프로세스의 일부입니다. 이렇게 방대한 문서를 저장하고 관리하려면 많은 시간과 공간이 필요합니다. 종이 없는 문서 관리 추세에도 불구하고 문서를 이미지로 스캔하는 것은 여전히 어려운 일입니다. 이 프로세스는 사람의 개입이 필요하고 번거롭고 느립니다.

또한 문서 내용의 디지털화는 텍스트가 숨겨진 이미지 파일로 이어질 수 있습니다. 워드 프로세서는 텍스트 문서와 같은 방식으로 이미지의 텍스트를 처리할 수 없습니다. OCR은 텍스트 이미지를 다른 상용 소프트웨어에서 분석할 수 있는 텍스트 데이터로 변환하여 이 문제를 해결합니다. 그런 다음 데이터를 사용하여 작업을 분석하고 개선하며 프로세스를 자동화하고 생산성을 높일 수 있습니다.

7d9be6872456af033802d073206010b

OCR은 어떻게 작동합니까?

이미지 획득

스캐너는 문서를 읽고 해당 문서를 이진 데이터로 변환합니다. OCR 소프트웨어는 스캔한 이미지를 분석하여 밝은 영역을 배경으로, 어두운 영역을 텍스트로 분류합니다.

전처리

OCR 소프트웨어는 먼저 이미지를 정리하고 읽기 준비 과정에서 오류를 제거합니다. 여기에 사용되는 몇 가지 청소 기술이 있습니다.

정렬 문제를 해결하기 위해 스캔하는 동안 스캔한 문서의 약간의 오프셋 수정 또는 기울어짐.

노이즈를 제거하거나 디지털 이미지에서 반점을 제거하거나 텍스트 이미지의 가장자리를 부드럽게 합니다.

이미지의 테두리와 선을 정리합니다.

다국어 OCR 기술로 스크립트 인식

텍스트 인식

텍스트 인식을 위해 OCR 소프트웨어에서 사용하는 두 가지 주요 유형의 OCR 알고리즘 또는 소프트웨어 프로세스는 패턴 일치 및 기능 추출입니다.

패턴 매칭

패턴 일치는 문자 이미지(글리프라고 함)를 분리하고 저장된 유사한 글리프와 비교합니다. 패턴 일치는 저장된 글리프가 입력 글리프와 유사한 글꼴 및 크기를 가진 경우에만 작동합니다. 이 방법은 알려진 글꼴로 입력된 문서의 스캔 이미지에 적합합니다.

특징 추출

기능 추출 세그먼트 또는 글리프를 선, 닫힌 루프, 선 방향 및 선 초점과 같은 기능으로 분해합니다. 그런 다음 이러한 기능을 사용하여 저장된 다양한 글리프 중에서 가장 적합하거나 가장 근접한 일치를 찾습니다.

사후 처리

분석 후 시스템은 추출된 텍스트 데이터를 컴퓨터 파일로 변환합니다. 일부 OCR 시스템은 스캔 문서의 사전 및 사후 스캔 버전이 포함된 주석이 달린 PDF 파일을 생성할 수 있습니다.

OCR 기술은 언어 번역 개발을 돕습니다.