[Vaex 1.0.0-beta.6] Virtual column 생성 후 pandas로 변경하기

2020. 8. 29. 14:18분석 Python/Vaex

728x90

아직 안 되는 게 너무 많아서 일단 되는 것들을 기록해 놓으려고 한다.

 

1. 일단 vaex 를 전 처리하고 list type 인 경우 다시 pandas로 변환할 수가 없다.

 

2. 변수명을 덮어쓰기로 하는 경우 virtual column이 되니 출력하기 위해서는 virtual= True라는 옵션을 사용해야 한다.

 

3. if else 로 나눌 경우 fun과 where를 써야 하는 듯하다.

 

DATA["binding_1"] = DATA.func.where( DATA.overall == 5 , "good","bad")
DATA["binding_2"] = DATA.func.where( DATA.overall > 3 , "good","bad")
DATA.to_pandas_df( virtual=False)

DATA.to_pandas_df( virtual=True)

 

또 다른 기록할 것이 있으면, 계속해서 남길 예정...

 

 

https://github.com/vaexio/vaex/issues/518

 

Adding new virtual column with default value does not work. · Issue #518 · vaexio/vaex

Hi, I am trying to simple add a new column with a default value and I get an error, but I think this should work: In [39]: df = vaex.ml.datasets.load_titanic() In [40]: df Out[40]: # pclass survive...

github.com

 

728x90