상위 목록: 하위 목록: 작성 날짜: 읽는 데 3 분 소요

Document Recognition

명함이나 문서의 크기를 변환 후 해당 문자를 인식합니다.

동영상이나 이미지에서 코너 검출(Corner Detector)하여 벡터의 내적(Dot Product)을 사용해 사각형을 검출합니다.

이후, 기하학적 변환(Warp Perspective)을 이용하여 검출하기 쉬운 이미지로 변경합니다.

검출용 이미지를 Tesseract 라이브러리를 이용하여 문자를 검출하며 foreach문과 유니코드 등을 이용하여 문자들에서 유의미한 데이터(이름, 전화번호, 상호명 등)를 얻어냅니다.



Step 1

  1. 관심 채널
  2. 이진화 적용 & 캐니 엣지
  3. 코너 검출
  4. 벡터 내적을 통하여 사각형 파악



Step 2

  1. 검출 좌표 저장
  2. 기하학적 변환



Step 3

  1. tesseract 라이브러리
  2. 영문자 판독



Step 4

  1. foreach문
  2. 아스키 코드 & 유니 코드

댓글 남기기