pandas describe에 결측데이터 개수 포함해서 표현해보기

2020. 4. 8. 19:20분석 Python/Pandas Tip

728x90

pandas에서 요약 통계를 적을 때 결측에 대한 정보는 제공하지 않는다. 

des1  = data[fac_col].astype(str).describe()
des1


그래서 다음과 같은 방법으로 결측에 대한 정보나 다른 정보를 쉽게 합쳐서 표현할 수 있다.

des1  = data[fac_col].astype(str).describe()
des2 = data[fac_col].isnull().sum().to_frame(name = 'missing').T
pd.concat([des1, des2])

만약 결측률까지 포함시키고 싶다고 하면 다음과 같이 코드를 추가하면 된다.

des1  = data[fac_col].astype(str).describe()
des2 = data[fac_col].isnull().sum().to_frame(name = 'missing').T
des3 = des2/len(data)
des3.rename(index = {"missing" : "missing rate"}, inplace=True)
pd.concat([des1, des2, des3])

 

728x90