A Chat with Andrew on MLOps: From Model-centric to Data-centric A 간단 정리

2021. 3. 29. 08:52관심있는 주제

728x90

간단하게 영상의 그림을 일부 중요하다고 생각되는 부분들을 캡처하고, 교수님이 말하고자 하는 내용에 대해서 나름 정리해봤다. 실제로 한 번 보는 것을 더 추천드리고, 그냥 빠르게 보고 싶으신 분은 참고만 하시면 될 것 같습니다 :)


mlops에 대한 Andrew NG 교수님의 강의


www.youtube.com/watch?app=desktop&v=06-AZXmwHjo&feature=youtu.be


데이터 품질이 좋은 게 최고라는 의미...
 

data centric 관점의 사람들은 PREP에 더 집중하는 반면, model-centric은 ACTION에 집중함.

현재 많은 논문들이 ACTION 관점에서 작성이 되고 있음. 

하지만 결국 말하고자 것은 아무리 모델을 최신 것을 사용해도 위에 그림처럼 데이터 품질의 초점을 맞춰야 성능 개선이 더 쉽지만, 다들 데이터는 안 보고 모델만 신경 쓰고 있다.

 

 

 

작은 데이터일수록 품질을 더 좋게 해야하는 이유! (어중간하게 크다면 좋은 데이터만 뽑아서 하는게 차라리 나을 수도 있다는 말)

 

그러므로 Andrew NG 교수님이 말하고자 하는 것은 AI를 사용하면 정말 데이터는 중요한 것이기 때문에 우리가 만드는 AI Software는 데이터 수집도 다 포함이 되어야 한다는 의미

 

 

즉 결론적으로 Andrew NG 교수님이 생각하는 관점은 현재 Model-centric과 Data-centric이 있고, 실제로 성능 개선을 하기 위해서 데이터 품질이 중요하다는 것이다. 그러나 현재 많은 논문들은 model-centric 관점에서 작성이 되고 있다. 

그리고 AI Software는 기존의 전통적인 Software와는 달라야 한다고 말하고 있음. 기존의 Software 같은 경우 데이터는 고려하지 않았지만, 이제 AI Software는 데이터 자체가 모델의 성능과 직접적으로 연관성이 있기 때문에 좋은 데이터를 뽑아주는 것도 다 포함이 되어야 한다고 말하고 있다. 

728x90