pandas apply를 사용하여 다중 컬럼(multiple columns) 만들기
2020. 6. 9. 23:43ㆍ분석 Python/Pandas Tip
from sklearn.datasets import load_boston
feature = load_boston()
boston_data = pd.DataFrame(feature.data , columns=feature.feature_names)
boston_data.head()
def f(x, col1 , col2) :
x , y = x[col1] , x[col2]
plus = x+y
minus = x-y
multiply = x*y
return pd.Series([plus,minus,multiply])
from functools import partial
ff = partial(f , col1 = "CRIM", col2="RM")
boston_data[["plus","minus","multiply"]]= boston_data.apply(lambda x : ff(x),axis=1)
boston_data.head()
stackoverflow.com/questions/30026815/add-multiple-columns-to-pandas-dataframe-from-function
추가로 RAY로 연습해보기
속도에서는 의미가 없겠지만, 일단 연습...
import ray
ray.init()
@ray.remote
def ray_f(x, col1 , col2) :
x , y = x[col1] , x[col2]
plus = x+y
minus = x-y
multiply = x*y
return pd.Series([plus,minus,multiply])
results = ray_f.remote(boston_data , col1 = "CRIM", col2="RM")
s = ray.get(results)
pd.DataFrame(s.tolist()).T
728x90
'분석 Python > Pandas Tip' 카테고리의 다른 글
Pandas 중복되는 값의 시작점과 누적후에 끝점 위치 구해보기 (0) | 2020.07.14 |
---|---|
pandas useful tip (0) | 2020.06.25 |
pandas 의 filter 함수로 변수 선택하기 (0) | 2020.05.19 |
[ Python ] 정형데이터 용량 줄이는 함수 소개 (연속형, 이산형, 문자형) (0) | 2020.04.12 |
pandas describe에 결측데이터 개수 포함해서 표현해보기 (0) | 2020.04.08 |