2023. 8. 21. 22:32ㆍ분석 Python/Visualization
라이센스 Apache 2.0
패키지 버전 : 2.1.0
python : 3.8, 3.9, 3.10, 3.11
windows 10에서 superset을 아직 지원하지 않기 때문에 도커를 사용해야 한다.
그래서 이 글에서는 windows 10에서 docker를 이용해서 설치하는 것을 해보려고 한다.
일단 docker desktop on windows를 먼저 설치해 보자
Install Docker Desktop on Windows
이 글의 목적은 superset 설치를 하는 것이기 때문에 docker desktop은 아래 문서를 참조해서 설치해 주시기 바란다.
https://docs.docker.com/desktop/install/windows-install/
Install Docker Desktop on Windows
docs.docker.com
Clone Superset's GitHub repository
superset github을 가보면 docker compose yml 파일을 제공하기 때문에 git을 clone 한다.
git clone https://github.com/apache/superset.git
Launch Superset Through Docker Compose
https://github.com/apache/superset/blob/master/docker-compose-non-dev.yml
cd superset
여기서 잠깐 확인을 할 부분이 있다.
이 글에서는 PostgreSQL DB에 데이터를 넣어야 하는데, 이대로 할 경우 안 되는 경우가 있었다.
결론은 postgres db container에 port를 추가해야 한다.
그리고 postgres db에 접속을 하려면 id와 pw를 알아야 하는데, 확인을 해보니 default는. env 파일에 있었다.
기존 db-compose
db:
env_file: docker/.env-non-dev
image: postgres:15
container_name: superset_db
restart: unless-stopped
volumes:
- db_home:/var/lib/postgresql/data
변경 db-compose
port을 5432로 추가했다.
db:
env_file: docker/.env-non-dev
image: postgres:14
container_name: superset_db
restart: unless-stopped
volumes:
- db_home:/var/lib/postgresql/data
ports:
- 5432:5432
https://github.com/apache/superset/blob/master/docker/.env-non-dev
여기에 보면 5432가 있긴 한데,... 그냥 하니까 잘 안돼서 추가했다.
여기를 보면 아시겠지만, USER와 PASSWORD에 대한 기본값이 저장이 되어있어서, 실제 나중에 connection 할 때 필요하다.
# database engine specific environment variables
# change the below if you prefer another database engine
DATABASE_PORT=5432
DATABASE_DIALECT=postgresql
POSTGRES_DB=superset
POSTGRES_USER=superset
POSTGRES_PASSWORD=superset
이렇게 수정을 하고 아래 명령어를 실행하면, 정상적으로 실행된다.
docker-compose -f docker-compose-non-dev.yml pull
docker-compose -f docker-compose-non-dev.yml up
Log in to Superset
아래와 같이 web browser에 입력하면 들어갈 수 있다.
http://localhost:8088
기본적인 id와 pw는 다음과 같다
username : admin
password : admin
이제 DB를 연결하고 파일을 업로드하려면 설정이 필요한데, 설정 방법에 대해서 공유하고자 한다.
PostgresSQL DB 연결
우측 상단에 Settings를 다음과 같이 누르면 아래와 같은 화면이 나온다
Settings > Data > Database Connections
+ DATABASE 클릭
이제 이런 식으로 하면 db를 연결할 수 있고, csv를 업로드하려면 또 하나 해야 하는 작업이 있다.
csv upload 기능 사용하는 옵션
PostgresSQL DB에 edit을 클릭한다.
edit > ADVANCED > Security
- Allow file uploads to database 클릭하기
Upload CSV를 클릭
데이터 상황에 맞게 데이터를 추가해 주면 된다.
시각화
시각화는 자신의 상황에 맞게 잘 그리면 될 것 같다
NEXT
다음에 또 진행하게 된다면 원격 서버에서 superset을 사용할 수 있는 방법을 알아봐야겠다.
'분석 Python > Visualization' 카테고리의 다른 글
[ Python ] jpg, png 를 gif 또는 mp4로 만들기 (0) | 2022.05.22 |
---|---|
pybaobabdt) DT Tree Visualization 해보기 (0) | 2021.12.18 |
python) histogram 알아보기 (0) | 2021.05.01 |
python) treemap 알아보기 (0) | 2021.04.29 |
[Visualization] Learning Curve를 이용하여 시각화하기(Train/Valid) (0) | 2020.12.18 |