OCR(9)
-
논문) β-Skeleton 그래프와 GCN을 활용한 문서 읽기 순서 예측
해당 글은 ChatGPT 4o With canvas로 만들었습니다. 문서를 파싱하는 것까지는 많은 오픈 소스랑 논문들이 있지만, 이 순서를 잘 정리해 주는 방법에 대한 것들은 많이 찾아보기가 어려웠다. 그래서 곰곰이 생각했을 때 각각의 파싱 된 결과를 노드로 생각하고 그것을 읽는 순서를 엣지로 정의하면 좀 더 쉽게 풀리지 않을까 싶은 생각에 시도했다가 생각보다 잘 되지 않았다.그래서 Reading Order에 대한 논문을 찾던 도중 구글에 다니는 분들이 쓴 논문이 있어서 살펴봤다. 내용중에서 그래프랑 이미지를 같이 쓰는 것과 초기 edge를 어떻게 정의하는지가 눈에 띄었다.문서 읽기 순서 예측의 중요성문서 내의 텍스트가 어떤 순서로 읽혀야 하는지 예측하는 것은 매우 중요한 과제입니다. 특히, 다중 열 ..
2024.10.12 -
vFlat 후기
책 산 것을 보여주려고 vFlat으로 사진을 찍다가 내용이 vFlat 내용들이 많아져서 vFlat 후기로 작성 시작 사진을 찍으면 크게 3단계의 보정 과정이 있는 것 같다. 곡면 보정, 색상 보정, 손가락 지우기 그리고 옵션으로 OCR도 있다. 기타 등등 이 회사는 이 제품을 웬만하면 다 딥러닝으로 하는 것 같은데, 대단한 팀인 것 같다. 어떻게 손가락이라는 것을 인식해서 지우게 했을까? 보통 양 사이드에 있으니까 그쪽 부분이랑 살색이면 지우기를 한 것일까? 먼가 여러 개를 테스트해보고 느낀 점은 다음과 같다. 글씨 라인을 넘어가면 제거하는 방식이 있을 것 같다 생각했는데, 라인이 일직선으로 잘리지 않아 보여서 이 방식은 아닌 것 같다. 색깔을 통해서 제거하는 방식이 있는 것 같다. 그렇게 생각한 이유는..
2020.04.02 -
[Review] Character Region Awareness for Text Detection - (1)
네이버 크로버에서 쓴 OCR논문이다. 요즘 OCR 관련 상위에 있는 팀이기 때문에 열심히 배워야겠다. Abstract 최근에 Scene text detection은 Neural Network를 기반으로 한 방법이 급상승하고 있다. 이전 논문들은 엄격한 word-level로 박스를 만드는 것이 때문에 임의의 모양으로 있는 text 영역을 표현하기에는 어려웠다. 본 논문에서는, 문자 사이의 각 문자와 affinity을 탐구함으로써 텍스트 영역을 효과적으로 검출할 수 있는 new scene text detection 방법을 제안한다고 한다. 결국 chr들을 잘 잡은 다음에, 다시 잘 word로 바꿔주는 것 같다. 각각의 character level annotation의 부족을 극복하기 위해, 제안된 프레임워크..
2019.06.16 -
What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 2
https://data-newbie.tistory.com/156 What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 1 https://arxiv.org/abs/1904.01906 https://github.com/clovaai/deep-text-recognition-benchmark?fbclid=IwAR1JQZMgF39xFWbiZUNFmvbgyPX1x6hKkFmqSSbG4szytZUFqYuKa7m3nNc 갓 네이버에서 OCR 관련 논문을 내주셨.. data-newbie.tistory.com 앞 장에서 STR에 대해서 살펴보고 이제는, 대망의 실험!! 4. Experiment and..
2019.05.30 -
What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 1
https://arxiv.org/abs/1904.01906 https://github.com/clovaai/deep-text-recognition-benchmark?fbclid=IwAR1JQZMgF39xFWbiZUNFmvbgyPX1x6hKkFmqSSbG4szytZUFqYuKa7m3nNc 갓 네이버에서 OCR 관련 논문을 내주셨다. 열심히 읽고 또 읽자 일단 Scene text recognition은 최근에 방법론을 제안하는 논문이 많이 나왔다고 한다. 그렇지만, 각 논문들이 기술의 한계를 뛰어넘을 정도로 선보였지만 , 실제 공정한 비교는 잘 안 돼있다고 한다. 이 논문에서는 3가지 점을 기여했다고 하는데, 1. train과 evaluation 셋의 불일치성에 대해서 조사하고 , 그러한 불일치성으로 인한 ..
2019.05.30 -
Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 2
https://data-newbie.tistory.com/151 Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 1 https://arxiv.org/abs/1806.02559 https://arxiv.org/abs/1903.12473 https://github.com/whai362/PSENet https://github.com/liuheng92/tensorflow_PSENet CNN 발전으로 장면 텍스트 감지는 잘하고 있지만, 산업.. data-newbie.tistory.com 4. Experiment CTW1500, Total- Text, ICDAR 2015 and ICDAR 2017 MLT, 일단 학습 도중에서 모..
2019.05.29 -
Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 1
https://arxiv.org/abs/1806.02559 https://arxiv.org/abs/1903.12473 https://github.com/whai362/PSENet https://github.com/liuheng92/tensorflow_PSENet CNN 발전으로 장면 텍스트 감지는 잘하고 있지만, 산업에서 쓰기에는 여전히 2가지 문제가 있다고 합니다. 1. 최신 논문에서는 임의의 박스로 잡아주는데, 그러다 보니 부정확한 위치에 잡히게 된다. 2. 2개의 글자 객체가 서로 가깝게 있는 경우 2개를 포함하게 감지한다는 것이 문제가 된다. 1번째 문제는 Segmentation-based approach로 해결할 수 있지만, 여전히 2번째는 문제가 됩니다. 저자는 이 2가지 문제를 해결하기 위해..
2019.05.28 -
Augmentation for small object detection
최근에 OCR을 공부를 해야 해서, 일단 논문은 거의 안 읽고.... 일단 구현하고 Pretrained 하는 데 초점을 맞추고 있는데요. 실제로 타겟이 굉장히 작은 것들이 포함되어있어서 얘네들이 이미 가진 툴에서 너무 작아서 없애버리는 기분을 느껴서 찜찜하고 애네를 어떻게 Augumentation을 해야 하나 찾다고 우연히 이 논문을 발견돼서 읽어보기로 했습니다. 여기서는 MS COCO 데이터를 사용하고 실제로 머 확인을 해보니 작은 Ground-truth 객체와 예측을 한 것에서 threshold가 굉장히 낮다고 합니다. 이 저자들은 2가지로 추측했다고 합니다. 작은 이미지 만이 작은 개체를 포함하고 있으며, 작은 개체가 포함 된 각 이미지 내에서도 충분히 나타나지 않습니다. 그래서 제안한 방법은 다음..
2019.05.18 -
annotation 2가지 tool 소개
최근에 OCR을 맡게 되어서, 데이터를 생성하기 위해서 annotation 작업을 해야 했습니다. 그래서 몇 가지 알아본 것을 소개하고자 합니다. 저는 처음에 VGG annotator를 사용했는데요. 이것을 제가 쓰지 않은 이유는 html로 사용해야 돼서 삼성 노트북 펜을 쓰지 못해서 안 했습니다. 왜냐면 저는 이것을 버스 타면서 할 거라서요.... 시간을 최대한 효율적으로 쓰기 위해 다른 툴을 찾아 떠났습니다. 그러다가 찾은 것이 labelimg라는 툴이었습니다 이것은 삼성 노트북 펜으로 쭉 그으면 잘 되더라고요!! 그래서 이것을 선정해서 열심히 그리고 있습니다. garbage in garbage out을 막기 위해 열심히 `잘` 그리려고 노력하고 있습니다ㅎㅎㅎㅎ 이상입니다. (tkffuwntpdy b..
2019.05.16