pandas describe에 결측데이터 개수 포함해서 표현해보기
·
분석 Python/Pandas Tip
pandas에서 요약 통계를 적을 때 결측에 대한 정보는 제공하지 않는다. des1 = data[fac_col].astype(str).describe() des1 그래서 다음과 같은 방법으로 결측에 대한 정보나 다른 정보를 쉽게 합쳐서 표현할 수 있다. des1 = data[fac_col].astype(str).describe() des2 = data[fac_col].isnull().sum().to_frame(name = 'missing').T pd.concat([des1, des2]) 만약 결측률까지 포함시키고 싶다고 하면 다음과 같이 코드를 추가하면 된다. des1 = data[fac_col].astype(str).describe() des2 = data[fac_col].isnull().sum().t..
[변수 처리] 데이터에서 결측치 잘 만들어보기
·
분석 Python/Data Preprocessing
테스트를 위한 missing data를 만들려고 할 때 수치형 변수는 상관이 없으나 category 변수 같은 경우에는 one hot했을 때도 mssing을 잘 주고 싶어서 시도를 하게 됐다. 지금 해보니 더 쉽게 하는 방법이 있는 것 같은데... 일단 진행을 했으니 공유 No , RAW_Dim = RAW.shape print(No, RAW_Dim) p_miss_vec = p_miss * np.ones((No,1)) Missing = np.zeros((No,RAW_Dim)) for i in range(RAW_Dim): A = np.random.uniform(0., 1., size = [No,]) B = A > p_miss_vec[i] Missing[:,i] = 1.*B missing_RAW = deepc..

AI 도구

AI 도구 사이드 패널

아래 AI 서비스 중 하나를 선택하여 블로그를 보면서 동시에 사용해보세요.

API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
URL과 모델을 입력하세요설정을 저장하려면 저장 버튼을 클릭하세요설정이 저장되었습니다