2021-01-16 11:40 (토)
[PASCON 2020] 엘세븐시큐리티 “OCR 성능↑, 문서·이미지 속 개인정보 정교하게 인식…외부 유출 차단”
상태바
[PASCON 2020] 엘세븐시큐리티 “OCR 성능↑, 문서·이미지 속 개인정보 정교하게 인식…외부 유출 차단”
  • 길민권
  • 승인 2020.11.13 02:35
이 기사를 공유합니다

머신러닝 기법 적용, 이미지에서 문자 더욱 정확히 추출
PASCON 2020에서 엘세븐시큐리티 최복희 대표는 ‘이미지 보안과 이미지 문서의 디지털화’를 주제로 키노트 발표를 진행하고 있다.
PASCON 2020에서 엘세븐시큐리티 최복희 대표는 ‘이미지 보안과 이미지 문서의 디지털화’를 주제로 키노트 발표를 진행하고 있다.

데일리시큐 주최 하반기 최대 정보보안&개인정보보호 컨퍼런스 PASCON 2020이 11월 10일 더케이호텔서울 가야금홀에서 방역수칙 준수하에 성황리에 개최됐다.

이번 PASCON 2020에서 엘세븐시큐리티 최복희 대표는 ‘이미지 보안과 이미지 문서의 디지털화’를 주제로 키노트 발표를 진행했다.

한편 엘세븐시큐리티는 게시판의 게시글, 첨부파일, 문서뿐만 아니라 이미지 속 개인정보를 인식해 외부 유출을 차단하는 ImageOCR & OCR Filtering V2.0 솔루션을 전남도청, 전남교육청, 광주광역시 교육연구정보원, 서울성북구청, 장흥군청등에 공급하는 등 조달쇼핑몰을 통한 발주건을 기준으로 이미지 개인정보 차단 솔루션 분야 시장 점유율 1위를 기록했다.

이 제품의 가장 핵심이 되는 기술은 이미지에서 문자를 추출하는 OCR(Optical Character Recognition : 광학적문자인식)모듈이며, 이 모듈은 최근 이슈가 되고 있는 4차산업의 기본이 되는 기술이기도 하다. OCR 모듈을 통하여 다양한 보안제품과 연동을 통하여 개인정보 뿐만 아니라 기업체의 내부정보유출차단과 RPA (Robotic Process Automation : 로봇프로세스자동화)에도 접목이 되고 있다. 엘세븐시큐리티는 머신러닝 기법을 적용하여 이미지에서 문자를 더욱 정확히 추출할 수 있도록 OCR의 성능을 꾸준히 업그레이드 하고 있다.

이미지에서 문자를 추출하기 위해서는 다양한 전처리 과정이 필요한데, 이미지에서 글자 색과 배경 화면을 분리하고 글자의 기울어진 각도를 보정하여 문자를 추출한다. 따라서 배경색과 글자색이 비슷하거나 홀로그램이 있는 곳에 글자가 쓰여져 있다면 문자 추출에서 오탐이 발생할 확률이 높다. 이런 오탐을 줄이기 위하여 다양한 전처리 알고리즘을 사용하고 있다.

엘세븐시큐리티에서 개발한 이미지 문자추출 모듈인 ImageOCR은 GS인증을 받았고 글자의 인식율이 90 ~ 95%이상이며 문자의 추출 속도가 빠르다는 것이다. 타사의 제품들보다는 가격이 저렴하고 멀티코어의 사용을 통하여 응답속도가 10배이상이 빠르다. 엘세븐시큐리티가 개발사이기에 다양한 커스터마이징을 통하여 다른 보안 장비들과도 연동을 하고 있다.

엘세븐시큐리티 PASCON 2020 전시부스
엘세븐시큐리티 PASCON 2020 전시부스

최복희 대표는 “제품 특성상 홈페이지 시스템 앞단에서 실시간 개인정보를 탐지해야 하므로 응답속도의 저하 없이 웹서비스를 하는 것이 중요하다”며 “대용량 트래픽 처리가 가능하도록 다양한 기술을 적용, 국내에서 처리량이 가장 큰 개인정보차단 솔루션”이라고 말했다.

이미지에서 개인정보를 차단하는 것뿐 아니라 서버내의 개인정보를 스캔 할 수 있는 ImageScanner도 개발되어 서버내의 문서중에서 이미지로 된 주민등록증이나 인감증명서, 가족 관계 증명서 등이 포함되어 있다면 탐지하여 관리자에게 알려주는 기능을 하고 있다. 이 외에도 정해진 PDF로 된 문서에서 텍스트를 추출하여 DB화를 할 수 있는 이미지 문서 디지털화 제품도 개발이 완료되어 이미지 분석을 통한 다양한 사업을 펼치고 있다.

PASCON 2020 최복희 대표 키노트 강연 현장.
PASCON 2020 최복희 대표 키노트 강연 현장.

엘세븐시큐리티 측은 “제품 특성상 홈페이지 시스템 앞단에서 실시간 개인정보를 탐지해야 하므로 응답속도의 저하 없이 웹서비스를 하는 것이 중요하다”면서 “앞으로 OCR 모듈은 모든 분야에서 일반화되는 기술로 인식될 것이고 누가 더 많은 학습을 하고 좋은 알고리즘으로 개발 했느냐에 따라 사업의 성공을 좌우하게 될 것이다. 정부에서도 뉴딜 정책에 따라 AI 기술의 발전에 많은 예산을 투입하고 있기에 AI를 통한 OCR 기술의 발달은 우리의 생활과 업무 환경을 크게 바꾸어 놓을 것”이라고 밝혔다.

최복희 대표의 PASCON 2020 발표자료는 데일리시큐 자료실에서 다운로드 가능하다.

PASCON 2020 전시장 전경
PASCON 2020 전시장 전경

★정보보안 대표 미디어 데일리시큐!★