OCR

준비중

OCR

ClientProgrammer 2022. 6. 26. 19:09

지인을 통해 OCR 관련하여 알게 되어 관련 프로젝트를 해보려한다.

일단 OCR은

Optical character recognition ( 광학 문자 인식) 이라고 하는데, 광학이라는 말 부터 좀 어렵고 쉽게 얘기하자면

이미지로 되어있는 텍스트를 컴퓨터가 인식 할 수 있는 문자열로 바꿔주는 행위이다.

이 OCR을 위한 라이브러리 중 예전엔 tesseract 이 유명했고 최근엔 좀 더 인식률이 좋은 abbyy를 많이 사용한다고 한다.

실제로 다른 블로거가 비교해둔 같은 이미지를 텍스트로 변환 실험에서 abbyy가 인식률이 확연히 좋았다.

각설하고 개발 과정은

1.그들의 샘플 소스를 우리의 깃허브에서 받고,

https://github.com/abbyy/cloudsdk-demo-dotnet

GitHub - abbyy/cloudsdk-demo-dotnet: C# Demo applications

C# Demo applications . Contribute to abbyy/cloudsdk-demo-dotnet development by creating an account on GitHub.

github.com

2.그들의 홈페이지에 가입해서 개발자 계정을 받고

https://cloud.ocrsdk.com/Account/Welcome

3.빌드하면 페이지, 필드 전환 테스트 해 볼 수 있다.

비용

[기울기보정]

OCR 기준선탐색

https://www.koreascience.or.kr/article/JAKO200729264790692.pdf

opencv 기울기보정

https://ko.quish.tv/how-automatically-deskew-text-image-using-opencv

opencv 기울기보정 ( 기울기찾기, 회전하기, 여백없애기 )

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=tommybee&logNo=221424592334

https://github.com/sbrunner/deskew

opencv 기울기보정

https://ansan-survivor.tistory.com/316

opencv 기울기보정

https://blog.naver.com/PostView.nhn?blogId=tommybee&logNo=221925606566&from=search&redirect=Log&widgetTypeCall=true&directAccess=false

opencv 기울기보정

https://bkshin.tistory.com/entry/OpenCV-14-%EC%9D%B4%EB%AF%B8%EC%A7%80-%EB%92%A4%ED%8B%80%EA%B8%B0%EC%96%B4%ED%95%80-%EB%B3%80%ED%99%98-%EC%9B%90%EA%B7%BC-%EB%B3%80%ED%99%98

opencv 영상처리

https://github.com/engineerjkk/Image_Processing

나무위키

https://namu.wiki/w/OCR

고서 스캔 경우의 수

https://pinedance.github.io/blog/2016/06/10/%EC%8A%A4%EC%BA%94-%EC%9D%B4%EB%AF%B8%EC%A7%80-%EB%AC%B8%EC%84%9C-%ED%9D%91%EB%B0%B1-%EB%A7%8C%EB%93%A4%EA%B8%B0

opencv 알고리즘별 강의

https://076923.github.io/posts/Python-opencv-28/

보정관련 키워드

opencv probabilistic hough transform

Deskew

추가로 기준선 작업과 이미지 핸들링 좀 더 해서 기본 샘플 만들어보자

[클라이언트 포인트]

여러번 잔 작업 하는것을 자동화 : 기울기 조절을 완벽에 가깝게 해 줬으면 함

하나의 툴로 모든 작업을 컨트롤 하길 원함

CRDT 실시간 협업 편집툴 관련 알고리즘

https://hackerwins.github.io/2019-04-16/co-editor

로컬피씨를 FTP 서버로

https://takim0070.tistory.com/10

판심찾기는 따로 library를 못 찾아서 직접구현.

수평선 긋기를 이용하고, 수평선들 중 센터에 그어진 선들 중 가장 긴것을 판심기준선으로 만들고, 길게 늘려줌.

로테이션2

https://stackoverflow.com/questions/63164341/improving-image-deskew-using-python-and-opencv