2019. 5. 29. 01:02ㆍ관심있는 주제/OCR
https://data-newbie.tistory.com/151
4. Experiment
CTW1500, Total- Text, ICDAR 2015 and ICDAR 2017 MLT,
일단 학습 도중에서 모든 데이터 셋에서 blurred 텍스트 영역은 무시했다고 한다.
lambda : 0.7
OHEM의 negative-positive ration는 3을 설정
1. 0.5 , 1.0 , 2.0 , 3.0 으로 Rescale 한다.
2. -10도 , 10도 를 horizontally flipped 그리고 회전
3. 640 x 640 랜덤 샘플하고 변경된 이미지에서 Crop을 해준다.
4.3. Ablation Study
Can kernels be used as the final result
커널의 목적은 대략 텍스트 인스턴스를 찾고 서로 밀접하게 서있는 텍스트 인스턴스를 분리하는 것입니다.
그러나 최소 규모의 커널들은 모든text 객체를 다루지 않는다.
Influence of the minimal kernel scale
Influence of the kernel numbers.
Influence of the backbone
Detecting Oriented Text.
Detecting Oriented Text Detecting MultiLingual Tex
결론 Conclusion
PSENet은 성공적으로 글자 객체를 성공적으로 detect한다.
점진적으로 작은 커널에서 큰 커널로 다양한 semantic segmentation들에서 탐지된 영역을 확장시켰다.
우리의 방법론은 여러가지 결과에 대해서 Robust하다고 한다.
추후에는 end-to-end 방식으로 고안해본다고 함.