Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 2

2019. 5. 29. 01:02관심있는 주제/OCR

728x90

https://data-newbie.tistory.com/151

 

Shape Robust Text Detection with Progressive Scale Expansion Network - 리뷰 - 1

https://arxiv.org/abs/1806.02559 https://arxiv.org/abs/1903.12473 https://github.com/whai362/PSENet https://github.com/liuheng92/tensorflow_PSENet CNN 발전으로 장면 텍스트 감지는 잘하고 있지만, 산업..

data-newbie.tistory.com

4. Experiment

CTW1500, Total- Text, ICDAR 2015 and ICDAR 2017 MLT,

일단 학습 도중에서 모든 데이터 셋에서 blurred 텍스트 영역은 무시했다고 한다.

lambda : 0.7 

OHEM의 negative-positive ration는 3을 설정

1. 0.5 , 1.0 , 2.0 , 3.0 으로 Rescale 한다.

2. -10도 , 10도 를 horizontally flipped 그리고 회전 

3. 640 x 640 랜덤 샘플하고 변경된 이미지에서 Crop을 해준다.

 

4.3. Ablation Study

Can kernels be used as the final result

커널의 목적은 대략 텍스트 인스턴스를 찾고 서로 밀접하게 서있는 텍스트 인스턴스를 분리하는 것입니다.

그러나 최소 규모의 커널들은 모든text 객체를 다루지 않는다.

Influence of the minimal kernel scale

Influence of the kernel numbers.

Influence of the backbone

Detecting Oriented Text.

Detecting Oriented Text Detecting MultiLingual Tex

결론 Conclusion

PSENet은 성공적으로 글자 객체를 성공적으로 detect한다.

점진적으로 작은 커널에서 큰 커널로 다양한 semantic segmentation들에서 탐지된 영역을 확장시켰다.

우리의 방법론은 여러가지 결과에 대해서 Robust하다고 한다.

 

추후에는 end-to-end 방식으로 고안해본다고 함.

 

 

 

728x90