관심있는 주제/OCR(7)
-
[Review] Character Region Awareness for Text Detection - (1)
네이버 크로버에서 쓴 OCR논문이다. 요즘 OCR 관련 상위에 있는 팀이기 때문에 열심히 배워야겠다. Abstract 최근에 Scene text detection은 Neural Network를 기반으로 한 방법이 급상승하고 있다. 이전 논문들은 엄격한 word-level로 박스를 만드는 것이 때문에 임의의 모양으로 있는 text 영역을 표현하기에는 어려웠다. 본 논문에서는, 문자 사이의 각 문자와 affinity을 탐구함으로써 텍스트 영역을 효과적으로 검출할 수 있는 new scene text detection 방법을 제안한다고 한다. 결국 chr들을 잘 잡은 다음에, 다시 잘 word로 바꿔주는 것 같다. 각각의 character level annotation의 부족을 극복하기 위해, 제안된 프레임워크..
2019.06.16 -
What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 2
https://data-newbie.tistory.com/156 What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 1 https://arxiv.org/abs/1904.01906 https://github.com/clovaai/deep-text-recognition-benchmark?fbclid=IwAR1JQZMgF39xFWbiZUNFmvbgyPX1x6hKkFmqSSbG4szytZUFqYuKa7m3nNc 갓 네이버에서 OCR 관련 논문을 내주셨.. data-newbie.tistory.com 앞 장에서 STR에 대해서 살펴보고 이제는, 대망의 실험!! 4. Experiment and..
2019.05.30 -
What is wrong with scene text recognition model comparisons? dataset and model analysis (네이버 논문) - 1
https://arxiv.org/abs/1904.01906 https://github.com/clovaai/deep-text-recognition-benchmark?fbclid=IwAR1JQZMgF39xFWbiZUNFmvbgyPX1x6hKkFmqSSbG4szytZUFqYuKa7m3nNc 갓 네이버에서 OCR 관련 논문을 내주셨다. 열심히 읽고 또 읽자 일단 Scene text recognition은 최근에 방법론을 제안하는 논문이 많이 나왔다고 한다. 그렇지만, 각 논문들이 기술의 한계를 뛰어넘을 정도로 선보였지만 , 실제 공정한 비교는 잘 안 돼있다고 한다. 이 논문에서는 3가지 점을 기여했다고 하는데, 1. train과 evaluation 셋의 불일치성에 대해서 조사하고 , 그러한 불일치성으로 인한 ..
2019.05.30 -
Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 2
https://data-newbie.tistory.com/151 Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 1 https://arxiv.org/abs/1806.02559 https://arxiv.org/abs/1903.12473 https://github.com/whai362/PSENet https://github.com/liuheng92/tensorflow_PSENet CNN 발전으로 장면 텍스트 감지는 잘하고 있지만, 산업.. data-newbie.tistory.com 4. Experiment CTW1500, Total- Text, ICDAR 2015 and ICDAR 2017 MLT, 일단 학습 도중에서 모..
2019.05.29 -
Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 1
https://arxiv.org/abs/1806.02559 https://arxiv.org/abs/1903.12473 https://github.com/whai362/PSENet https://github.com/liuheng92/tensorflow_PSENet CNN 발전으로 장면 텍스트 감지는 잘하고 있지만, 산업에서 쓰기에는 여전히 2가지 문제가 있다고 합니다. 1. 최신 논문에서는 임의의 박스로 잡아주는데, 그러다 보니 부정확한 위치에 잡히게 된다. 2. 2개의 글자 객체가 서로 가깝게 있는 경우 2개를 포함하게 감지한다는 것이 문제가 된다. 1번째 문제는 Segmentation-based approach로 해결할 수 있지만, 여전히 2번째는 문제가 됩니다. 저자는 이 2가지 문제를 해결하기 위해..
2019.05.28 -
Object Detection에서 Data Augumentation Tool 소개
https://blog.paperspace.com/data-augmentation-for-bounding-boxes/?fbclid=IwAR132UulElBLFflTPa8aF0S-zREgXr3rgh4SrGKelsds_Mld_S4MNt9a7xQ Data Augmentation For Bounding Boxes: Flipping How to adapt major image augmentation techniques for object detection purposes. We also cover the implementation of horizontal flip augmentation. blog.paperspace.com
2019.05.23 -
Augmentation for small object detection
최근에 OCR을 공부를 해야 해서, 일단 논문은 거의 안 읽고.... 일단 구현하고 Pretrained 하는 데 초점을 맞추고 있는데요. 실제로 타겟이 굉장히 작은 것들이 포함되어있어서 얘네들이 이미 가진 툴에서 너무 작아서 없애버리는 기분을 느껴서 찜찜하고 애네를 어떻게 Augumentation을 해야 하나 찾다고 우연히 이 논문을 발견돼서 읽어보기로 했습니다. 여기서는 MS COCO 데이터를 사용하고 실제로 머 확인을 해보니 작은 Ground-truth 객체와 예측을 한 것에서 threshold가 굉장히 낮다고 합니다. 이 저자들은 2가지로 추측했다고 합니다. 작은 이미지 만이 작은 개체를 포함하고 있으며, 작은 개체가 포함 된 각 이미지 내에서도 충분히 나타나지 않습니다. 그래서 제안한 방법은 다음..
2019.05.18