데이터 분석가:Applied Data Analytics/데이터 시각화

클라우드 슈퍼셋 시각화 - 이미지 바로 보이게 하기

데이터분석 2025. 4. 11. 17:48
320x100
728x90

구글코렙에서 작성한 파일을 CSV로 저장하여 100MB이상이므로 구글스토리지에 올려서 빅쿼리에 연결하고 Json키를 만들어서

클라우스 슈퍼셋에 연동한 뒤 위에 화면처럼 선택이 가능합니다.  구글코렙 ~ Json키 발급하고 클라우스슈퍼셋 연동까지는

https://nesaram-health-1story.tistory.com/319 이글을 참고하세요.

 

1. 코호트 재방문 추이 (Line Chart)

Colab 코드

python
복사편집
plt.plot(first_cohort['days_since_first_visit'], first_cohort['n_users'])

Superset 구현

  • Chart Type: Line Chart
  • X-axis: days_since_first_visit
  • Metrics: COUNT_DISTINCT(fullVisitorId) → Label: n_users
  • Dimensions (Group by): first_visit_date
  • 이 설정은 지금 이미지에서 정확히 잘 되어 있음

결과: 각 first_visit_date별로 선 그래프가 그려지고, X축은 첫 방문 이후 며칠이 지났는지를 나타냄


2. 전체 방문 횟수 분포 (히스토그램)

Colab 코드

python
복사편집
plt.hist(df['totalVisits'], bins=30)

Superset 구현

  • Chart Type: Histogram 또는 Bar Chart (Histogram이 없으면 Bar Chart로 유사 구현)
  • X-axis: totalVisits
  • Metrics: COUNT(*)
  • Bins: Superset 기본 Histogram chart에서는 bin 수 조절 가능 (없으면 Bar Chart로 정렬해서 표현)

절차:

  1. Charts > + Chart > Dataset: train_final
  2. Chart Type: Bar Chart
  3. Dimensions: totalVisits (또는 bin 만들고 그걸 group by)
  4. Metrics: COUNT(*)
  5. Sort by: totalVisits

3. 디바이스 카테고리 분포

Colab 코드

python
복사편집
df['deviceCategory'].value_counts().plot(kind='bar')

Superset 구현

  • Chart Type: Bar Chart
  • Dimension: deviceCategory
  • Metrics: COUNT(*)
  • Sort by: 값 내림차순 (Descending)

4. 상위 운영체제 분포

Colab 코드

python
복사편집
df['operatingSystem'].value_counts().head(10).plot(kind='bar')

Superset 구현

  • Chart Type: Bar Chart
  • Dimension: operatingSystem
  • Metrics: COUNT(*)
  • Row Limit: 10
  • Sort by: COUNT DESC

5. 상위 브라우저 분포

Colab 코드

python
복사편집
df['browser'].value_counts().head(10).plot(kind='bar')

Superset 구현

  • Chart Type: Bar Chart
  • Dimension: browser
  • Metrics: COUNT(*)
  • Row Limit: 10
  • Sort by: COUNT DESC

6. 시각화 정리 표

목적Superset 차트 타입X축 / DimensionMetric기타 설정
코호트 재방문 추이 Line Chart days_since_first_visit COUNT_DISTINCT(visitor) Group by: first_visit_date
전체 방문횟수 분포 Histogram 또는 Bar totalVisits COUNT(*)  
디바이스 카테고리 분포 Bar Chart deviceCategory COUNT(*) Sort: 값 기준 내림차순
상위 운영체제 Bar Chart operatingSystem COUNT(*) Row limit 10, Sort DESC
상위 브라우저 Bar Chart browser COUNT(*) Row limit 10, Sort DESC

이제 Superset에서도 Colab에서 그린 EDA 시각화처럼 그대로 만들 수 있다


Superset 대시보드에 이미지 넣는 방법

1. 대시보드 편집 모드로 진입

  1. 상단 메뉴에서 Dashboards → 원하는 대시보드 클릭
  2. 오른쪽 상단 ... (더보기) 클릭 → Edit dashboard 선택

2. Markdown 컴포넌트 추가

  1. 왼쪽 컴포넌트 목록에서 Markdown을 클릭한 후
  2. 원하는 위치로 드래그해서 놓기

3. 이미지 삽입 코드 작성 (Markdown 문법 사용)

Markdown 영역에 아래와 같이 입력:

markdown
복사편집
![설명 텍스트](https://example.com/image.png)

또는 클릭 가능한 이미지로 만들고 싶다면:

markdown
복사편집

이미지 URL은 반드시 외부에서 접근 가능한 이미지 주소여야 해 (예: Imgur, GitHub 이미지 링크 등)


4. 저장

  1. Markdown 블록 아래 Save 버튼 클릭
  2. 전체 대시보드 우측 상단의 Save 클릭하여 변경 내용 저장

이미지가 없거나 직접 올리고 싶다면?

Superset 자체에 이미지를 업로드하는 기능은 없기 때문에 다음 방법 중 하나를 사용해야 해:

  1. Imgur 같은 이미지 호스팅 서비스 사용
    • imgur.com에서 이미지 업로드 후 링크 복사
  2. GitHub에 이미지 업로드 후 raw 링크 사용
    • raw.githubusercontent.com 경로 사용
  3. 자신의 서버나 Notion 이미지 링크 활용
    • 단, 공개적으로 접근 가능한 링크여야 함

예시

이렇게 넣으면 분석 흐름도, 시각화 구조, 로고, 참고 그래프 등을 함께 표시할 수 있어서 발표나 설명 때 유용해.


Notion 페이지를 Superset 대시보드에 표시하는 2가지 방법


1. Notion 페이지 링크를 Markdown에 삽입 (간단한 방법)

방법

  1. Notion 페이지에서 공유 → 웹에서 보기 허용 활성화
  2. 공개 링크 복사
  3. Superset 대시보드에서 Markdown 컴포넌트를 추가하고 아래처럼 입력:
markdown
복사편집
[Notion 문서 보기](https://your-notion-page-url)

또는

markdown
복사편집
🔗 [Retention 분석 기획서 - Notion](https://www.notion.so/your-page-id)

결과

  • 클릭 가능한 텍스트 링크로 표시됨
  • 클릭 시 새 탭에서 Notion 페이지 열림

2. **Notion 페이지를 Superset 대시보드에 iFrame으로 삽입 (일부 환경에서만 가능)

이 방법은 Superset 배포 설정에 따라 막혀 있을 수 있음. Preset 클라우드 버전에서는 보안 상 제한되어 iFrame이 작동하지 않을 수 있어.

방법

markdown
복사편집
<iframe src="https://www.notion.so/your-page-id" width="100%" height="600px"></iframe>

대부분 Superset에서는 Markdown에서 <iframe> 태그는 비활성화되거나 필터링됨.


실무적으로 가장 안정적인 방법

공개된 Notion 페이지 링크를 Markdown에 하이퍼링크로 연결하는 방식

markdown
복사편집
[📄 Notion 분석 문서 보기](https://www.notion.so/your-public-link)

이 방식은:

  • 클릭으로 바로 이동 가능
  • Superset 대시보드에 설명 자료를 연결하는 데 유용

추가 팁

Notion 페이지의 내용을 이미지로 캡처해서 Superset에 삽입하고 싶다면:

  1. Notion 내용 화면 캡처
  2. Imgur 등 이미지 업로드 사이트에 올림
  3. 이미지 URL을 Markdown에 삽입

1. GitHub에 이미지 업로드

방법 A: 웹에서 직접 업로드

  1. https://github.com 로그인
  2. public repository 하나 생성 (예: superset-assets)
  3. Add file → Upload files 클릭
  4. 이미지 파일(.png, .jpg) 선택해서 업로드
  5. Commit changes 버튼 클릭

2. Raw 이미지 링크 복사

  1. 업로드된 이미지 클릭
  2. 이미지가 열리면 오른쪽 상단 "Download" 옆의 "Raw" 클릭
  3. 브라우저에 열린 이미지 주소를 복사
    (보통 다음처럼 생김)
ruby
복사편집
https://raw.githubusercontent.com/username/repo-name/main/images/your_image.png

3. Superset Markdown 컴포넌트에 삽입

대시보드 편집 > Layout elements > Markdown 컴포넌트 드래그해서 추가한 뒤 아래처럼 입력

또는 제목과 함께 사용하고 싶다면:

markdown
복사편집

실제 예시

위처럼 하면 Superset 대시보드에 이미지가 바로 표시돼.


보안 참고

  • GitHub public repo에 올리면 누구나 해당 이미지를 볼 수 있음
  • 민감한 정보가 담긴 이미지일 경우 업로드 주의 필요

마무리

이제 Superset에서 Markdown을 이용해 깃허브 이미지 불러오는 방법까지 완벽하게 알게 됐어.

필요하면:

  • GitHub repo 생성 도움
  • 업로드 예시
  • Markdown 코드 자동 완성 도와줄게

이미지를 올릴 준비가 됐으면, 깃허브 링크만 보내주면 바로 사용 코드 만들어줄게.


Superset에 넣을 GitHub Raw 이미지 URL 얻는 법

현재 화면에서 해야 할 일

  1. 이미지 클릭 완료 상태 (지금처럼 Looker-EDA01.png 화면에 있음)
  2. 이미지 오른쪽 위에 보면 아래와 같은 아이콘이 있어:
    • Download (⬇)
    • 그 옆에 Raw 버튼 (네모 + 화살표 아이콘 모양)
  3. Raw 버튼 클릭
    → 이미지가 새 탭에서 단독으로 열림
  4. 그 새 탭의 주소(URL)를 복사
  5. 예시:

Superset Markdown에 사용하는 방법

복사한 주소를 아래처럼 Superset Markdown 컴포넌트에 삽입:

이렇게 하면 Superset 대시보드에 이미지가 직접 표시됨.


다시 정확하게 말하면 ![다운로드 이미지](깃허브의 이미지주소(깃허브에서 이미지를 새창으로 열기해서 주소를 여기에 복사)

 

여러 이미지 넣고 싶다면

Markdown 안에 여러 줄로 이미지 넣을 수도 있어:

 


Superset에서 대시보드를 JSON으로 Export하는 방법

1. Superset에 로그인

  • Preset 클라우드(또는 자체 Superset 서버)에 로그인합니다.

2. 대시보드 목록으로 이동

  • 왼쪽 사이드바 메뉴에서
    Dashboards 클릭

3. Export할 대시보드 선택

  • 리스트에서 원하는 대시보드를 찾습니다
  • 해당 대시보드 왼쪽 체크박스 클릭

4. Export 메뉴 실행

  • 상단 메뉴 바에서 ⋮ Actions 버튼 클릭
  • Export 선택

5. 파일 다운로드

  • .json 파일이 자동으로 다운로드됩니다
    (예: dashboard_export_2025_04_13_123456.json)