Windows 10) Superset Install Guide (locally)

2023. 8. 21. 22:32분석 Python/Visualization

728x90

라이센스 Apache 2.0

패키지 버전 : 2.1.0

python : 3.8, 3.9, 3.10, 3.11

 

windows 10에서 superset을 아직 지원하지 않기 때문에 도커를 사용해야 한다.

2023-08-21 기준

그래서 이 글에서는 windows 10에서 docker를 이용해서 설치하는 것을 해보려고 한다.

 

일단 docker desktop on windows를 먼저 설치해 보자

Install Docker Desktop on Windows

이 글의 목적은 superset 설치를 하는 것이기 때문에 docker desktop은 아래 문서를 참조해서 설치해 주시기 바란다.

 

https://docs.docker.com/desktop/install/windows-install/

 

Install Docker Desktop on Windows

 

docs.docker.com

 

 

Clone Superset's GitHub repository

superset github을 가보면 docker compose yml 파일을 제공하기 때문에 git을 clone 한다.

git clone https://github.com/apache/superset.git

 

Launch Superset Through Docker Compose

https://github.com/apache/superset/blob/master/docker-compose-non-dev.yml

cd superset

 

여기서 잠깐 확인을 할 부분이 있다. 

이 글에서는 PostgreSQL DB에 데이터를 넣어야 하는데, 이대로 할 경우 안 되는 경우가 있었다.

결론은 postgres db container에 port를 추가해야 한다.

그리고 postgres db에 접속을 하려면 id와 pw를 알아야 하는데, 확인을 해보니 default는. env 파일에 있었다.

기존 db-compose

  db:
    env_file: docker/.env-non-dev
    image: postgres:15
    container_name: superset_db
    restart: unless-stopped
    volumes:
      - db_home:/var/lib/postgresql/data

변경 db-compose

port을 5432로 추가했다.

db:
    env_file: docker/.env-non-dev
    image: postgres:14
    container_name: superset_db
    restart: unless-stopped
    volumes:
      - db_home:/var/lib/postgresql/data
    ports:
      - 5432:5432

https://github.com/apache/superset/blob/master/docker/.env-non-dev

여기에 보면 5432가 있긴 한데,... 그냥 하니까 잘 안돼서 추가했다.

 

여기를 보면 아시겠지만, USER와 PASSWORD에 대한 기본값이 저장이 되어있어서, 실제 나중에 connection 할 때 필요하다.

# database engine specific environment variables
# change the below if you prefer another database engine
DATABASE_PORT=5432
DATABASE_DIALECT=postgresql
POSTGRES_DB=superset
POSTGRES_USER=superset
POSTGRES_PASSWORD=superset

이렇게 수정을 하고 아래 명령어를 실행하면, 정상적으로 실행된다.

docker-compose -f docker-compose-non-dev.yml pull
docker-compose -f docker-compose-non-dev.yml up

 

Log in to Superset

아래와 같이 web browser에 입력하면 들어갈 수 있다.

http://localhost:8088

기본적인 id와 pw는 다음과 같다

username : admin
password : admin

 

이제 DB를 연결하고 파일을 업로드하려면 설정이 필요한데, 설정 방법에 대해서 공유하고자 한다.

PostgresSQL DB 연결

우측 상단에 Settings를 다음과 같이 누르면 아래와 같은 화면이 나온다

 

Settings > Data > Database Connections

 

+ DATABASE 클릭

 

 

이제 이런 식으로 하면 db를 연결할 수 있고, csv를 업로드하려면 또 하나 해야 하는 작업이 있다.

csv upload 기능 사용하는 옵션

PostgresSQL DB에 edit을 클릭한다.

 

edit > ADVANCED > Security

  • Allow file uploads to database 클릭하기

Upload CSV를 클릭

데이터 상황에 맞게 데이터를 추가해 주면 된다.

시각화

시각화는 자신의 상황에 맞게 잘 그리면 될 것 같다

 

NEXT

다음에 또 진행하게 된다면 원격 서버에서 superset을 사용할 수 있는 방법을 알아봐야겠다.

728x90