OCR
지인을 통해 OCR 관련하여 알게 되어 관련 프로젝트를 해보려한다.
일단 OCR은
Optical character recognition ( 광학 문자 인식) 이라고 하는데, 광학이라는 말 부터 좀 어렵고 쉽게 얘기하자면
이미지로 되어있는 텍스트를 컴퓨터가 인식 할 수 있는 문자열로 바꿔주는 행위이다.
이 OCR을 위한 라이브러리 중 예전엔 tesseract 이 유명했고 최근엔 좀 더 인식률이 좋은 abbyy를 많이 사용한다고 한다.
실제로 다른 블로거가 비교해둔 같은 이미지를 텍스트로 변환 실험에서 abbyy가 인식률이 확연히 좋았다.
각설하고 개발 과정은
1.그들의 샘플 소스를 우리의 깃허브에서 받고,
https://github.com/abbyy/cloudsdk-demo-dotnet
GitHub - abbyy/cloudsdk-demo-dotnet: C# Demo applications
C# Demo applications . Contribute to abbyy/cloudsdk-demo-dotnet development by creating an account on GitHub.
github.com
2.그들의 홈페이지에 가입해서 개발자 계정을 받고
https://cloud.ocrsdk.com/Account/Welcome
3.빌드하면 페이지, 필드 전환 테스트 해 볼 수 있다.
비용
[기울기보정]
OCR 기준선탐색
https://www.koreascience.or.kr/article/JAKO200729264790692.pdf
opencv 기울기보정
https://ko.quish.tv/how-automatically-deskew-text-image-using-opencv
opencv 기울기보정 ( 기울기찾기, 회전하기, 여백없애기 )
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=tommybee&logNo=221424592334
https://github.com/sbrunner/deskew
opencv 기울기보정
https://ansan-survivor.tistory.com/316
opencv 기울기보정
https://blog.naver.com/PostView.nhn?blogId=tommybee&logNo=221925606566&from=search&redirect=Log&widgetTypeCall=true&directAccess=false
opencv 기울기보정
opencv 영상처리
https://github.com/engineerjkk/Image_Processing
나무위키
고서 스캔 경우의 수
opencv 알고리즘별 강의
https://076923.github.io/posts/Python-opencv-28/
보정관련 키워드
opencv probabilistic hough transform
Deskew
추가로 기준선 작업과 이미지 핸들링 좀 더 해서 기본 샘플 만들어보자
[클라이언트 포인트]
여러번 잔 작업 하는것을 자동화 : 기울기 조절을 완벽에 가깝게 해 줬으면 함
하나의 툴로 모든 작업을 컨트롤 하길 원함
CRDT 실시간 협업 편집툴 관련 알고리즘
https://hackerwins.github.io/2019-04-16/co-editor
로컬피씨를 FTP 서버로
https://takim0070.tistory.com/10
판심찾기는 따로 library를 못 찾아서 직접구현.
수평선 긋기를 이용하고, 수평선들 중 센터에 그어진 선들 중 가장 긴것을 판심기준선으로 만들고, 길게 늘려줌.
로테이션2
https://stackoverflow.com/questions/63164341/improving-image-deskew-using-python-and-opencv