pandas describe에 결측데이터 개수 포함해서 표현해보기
2020. 4. 8. 19:20ㆍ분석 Python/Pandas Tip
pandas에서 요약 통계를 적을 때 결측에 대한 정보는 제공하지 않는다.
des1 = data[fac_col].astype(str).describe()
des1
그래서 다음과 같은 방법으로 결측에 대한 정보나 다른 정보를 쉽게 합쳐서 표현할 수 있다.
des1 = data[fac_col].astype(str).describe()
des2 = data[fac_col].isnull().sum().to_frame(name = 'missing').T
pd.concat([des1, des2])
만약 결측률까지 포함시키고 싶다고 하면 다음과 같이 코드를 추가하면 된다.
des1 = data[fac_col].astype(str).describe()
des2 = data[fac_col].isnull().sum().to_frame(name = 'missing').T
des3 = des2/len(data)
des3.rename(index = {"missing" : "missing rate"}, inplace=True)
pd.concat([des1, des2, des3])
728x90
'분석 Python > Pandas Tip' 카테고리의 다른 글
pandas 의 filter 함수로 변수 선택하기 (0) | 2020.05.19 |
---|---|
[ Python ] 정형데이터 용량 줄이는 함수 소개 (연속형, 이산형, 문자형) (0) | 2020.04.12 |
[ Python ] pandas 읽고 쓰기 비교 (to_csv , to_pickle , to_feather) (1) | 2019.12.21 |
[ Python ] Pandas idxmin , idxmax, pd.cut 함수 알아보기 (0) | 2019.10.29 |
[ Python ] modin 으로 pandas 더 빠르게 사용하기 (0) | 2019.09.28 |