문서 처리가 많은 업무 환경에서 효율성을 달성하는 중요한 기능 중 하나로 OCR(Optical Character Recognition)이라고 하는 문자 인식을 들 수 있다. 요즘 꽤 많은 문서들이 애초부터 전자 파일 형태로 만들어지기 때문에 활용 빈도가 줄 것 같기는 하지만, 은근히 절실하게 필요하면서도 불편한 것이 또 이 OCR 기능이다.
초창기 스캐너가 보급되기 시작할 때에는 번들로 OCR 프로그램을 끼워주기도 했고, 시간이 지나면서 더 완벽한 기능이 나올 것으로 예상도 했지만, 특히 한글 환경에서는 아직도 아쉬움이 많다.
아무튼, 특정 문서에 OCR 기능을 적용해 컴퓨터에서 인식 가능한 문자 형태로 변환할 때 기본적으로 스캐너(scanner)를 이용하게 된다. 간혹 디지털카메라(디카)로 문서를 촬용해 적용하기도 하지만, 결과물의 질이 아주 좋지 않다.
최근 보급이 많이 되고 있는 아이폰(iPhone) 등 스마트폰에서 사용할 수 있도록 OCR 앱도 여러 개 있다. 그런데 대부분 성능이 좋지 않고, 그나마 영어 등 몇 가지 국제적 언어만 지원하기 때문에 한글(Korean)을 처리하는 앱은 거의 없다. 있는 경우도 제한적으로 몇 글자나 한두 단어 정도만을 처리하는 것이 고작이다.
그래도 조금 쓸만한 아이폰 앱(4와 3GS 지원)으로 TextGrabber가 있다. 이 분야에서 꽤 유명한 ABBYYiTunes Preview의 TextGrabber 페이지로 가기
바로 문서를 촬영해 인식할 수도 있고, 찍어 놓은 사진을 불러와 처리할 수도 있다. 영어와 한글 문서를 동시에 처리할 뿐만 아니라 그 이상 여러 개의 언어를 동시에 지정해 인식하게 할 수도 있다.
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
같은 이미지여도 잘라내는 영역의 크기에 따라 결과가 달라지기도 한다.
빛이 잘 드는 밝은 곳에서 문서와 평행하게 사진을 찍는 것이 중요하다. 비교적 잘 된다. PC에서 사용하는 왠만한 프로그램에 뒤지지 않아 보인다. 원본 사진과 변환한 결과는 자동으로 저장되어 나중에 다시 찾아볼 수 있으며, 이메일이나 문자로 전송할 수도 있다. 단, 원본에 표(table)가 있는 경우는 포기하는 것이 좋다. 표 안에 있는 내용은 인식하지만 표 형태를 유지할 수는 없다.
현재 한글, 영어, 독일어, 불어 등 60개 이상의 언어를 지원한다.
|
![]() | 이 저작물은 크리에이티브 커먼즈 코리아 저작자 표시-비영리-변경 금지 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다. |