2025/01 46

빅데이터 시대의 가치와 영향변화

인과관계 에서  상관관계의 중요성 확대 :"인과관계는 원인 → 결과" 이며,  "상관관계는 그냥 같이 변할 뿐!" 과거에는 데이터를 분석할 때, "어떤 원인이 결과를 만들었는가?" 에 집중. 빅데이터 시대에는 데이터의 양이 너무 많고, 복잡해서 "정확한 원인을 찾기보다는, 데이터를 활용해 패턴을 찾는 것" 이 더 중요하다. 예를 들면어떤 소비자가 어떤 상품을 많이 사는가?→ 인과관계를 몰라도, 데이터 분석으로 "이 제품을 사는 고객이 저 제품도 산다"는 패턴을 찾을 수 있음.AI가 질병을 예측하는 방법→ AI가 "이런 증상을 가진 사람은 이 질병에 걸릴 확률이 높다"라고 예측하지만,→ 왜 그런지는 모름(인과관계는 불분명).넷플릭스 추천 알고리즘→ "이 영화를 본 사람은 저 영화도 본다." (인과관계는 모..

클래스(Class)와 객체(Object)

클래스는 객체(Object) 를 정의하고 만들기 위한 변수와 메서드의 집합.설계도를 이용해서 다양한 색깔, 사이즈, 디자인의 신발을 만들 수 있다면, 여기서 중요한 것은 하나의 설계도로 여러 제품을 만들 수 있다. 여기서 설계도가 클래스이고 만든 제품이 객체 입니다. 붕어빵을 만드는 틀이 있다면, 클래스는 붕어빵을 만드는 틀이며, 객체는 실제로 만들어진 붕어빵이 됩니다. 클래스의 이름은 대문자로 시작(캐멀 케이스)객체 = 글래스이름() 으로 한후 글래스 사용가능 용어 및 설명클래스(Class)제품의 설계도객체(Object)설계도로 만든 제품속성(Attribute)클래스 안의 변수메서드(Method)클래스 안의 함수생성자(Constructor)객체를 만들 때 실행되는 함수인스턴스(Instance)메모리에 ..

OneDrive 용량 초과 메시지

해결방법  사용량 확인OneDrive 웹사이트(https://onedrive.live.com)에 로그인하여 현재 저장 공간 사용량을 확인한다.불필요한 파일 삭제가장 큰 파일을 우선적으로 삭제하거나 외장 하드 또는 다른 클라우드 서비스로 이동한다.휴지통을 비워서 삭제된 파일이 차지하는 공간도 정리한다.파일 정리 및 압축자주 사용하지 않는 파일을 ZIP 파일로 압축하여 공간을 절약한다.OneDrive에서 로컬 PC로 파일을 이동하여 클라우드 공간을 확보한다.저장 공간 업그레이드Microsoft 365 구독을 통해 용량을 추가 구매할 수 있다.개인 사용자용 요금제를 확인하고 적절한 플랜을 선택한다.공유 파일 관리다른 사용자와 공유한 파일 중 불필요한 것이 있다면 공유를 해제하여 용량을 줄인다.다른 사람이 공유..

정보 2025.01.31

전역 변수(Global variable), 모듈, 패키지, 라이브러리

전체에서 접근할 수 있는 변수를 전역 변수(Global variable)라고 부르고, 전역 변수에 접근할 수 있는 범위를 전역 범위(Global scope)라고 합니다. 함수 안에서 만든 변수는 지역 변수(Local variable)라고 합니다. 지역 변수는 만든 함수 안에서만 접근할 수 있고, 함수 바깥에서는 접근할 수 없다. 지역 변수를 접근할 수 있는 범위는 지역 범위(Local scope) 라고 한다. (출처 : 모두연 교육강의) 변수를 함수 안에서 변경할 수 있는 방법은 함수 안에 global 예약어를 사용하면 된다. 주의할 점은 global 예약어와 할당하는 코드(=)를 같이 쓰면 안된다.name = 'aiffel'  # 전역 변수def hi4():    global name = 'python..

이터레이터, 제너레이터, 데코레이터, 람다, 일급객체

이터레이터, 제너레이터  :  이터레이터는 어떤건지? 왜 쓰고 어떤건지 알고 있어야  데코레이터 : 꾸며주는 역할로 기능이 다양하다. 람다 : 중요해서 집중공부 필요. 전역변수가 뭔지  이터레이터(Iterator) 이터러블 : for 반복자 in 반복할 수 있는 객체# str이 이터러블한지 확인str_ai = 'aiffel'str_ai.__iter__()이터러블하지 않은 경우 : int형 이터러블한 경우 : str, 리스트, 튜플, 셋, 딕셔너리, range() 이터러블 객체는 __iter__() 메서드를 사용할 수 있었는데, 이터레이터는 __next__() 메서드를 사용한다. 이때 __next__() 메서드를 값을 차례대로 꺼내주는 메서드 이터러블 객체: __iter__() 메서드 사용이터레이터: __..

리스트, 딕셔너리, 컴프리헨션

리스트, 딕셔너리, 컴프리헨션이 들어간 짧은 이야기 옛날 옛적, 마법과 기술이 공존하는 세계가 있었다.  이곳에는 데이터를 다루는 데 특별한 재능을 가진 젊은 마법사, 파이(Pi)가 살고 있었다. 파이는 마법으로 살아있는 데이터를 창조할 수 있었는데, 그 중 가장 흥미로운 발명품은 데이터 골렘이었다. 데이터 골렘의 제작 파이는 데이터를 정리하고 분석하는 데 골머리를 앓고 있던 날, 새로운 골렘을 만들기 위해 준비를 시작했다.  먼저 마법 리스트를 사용해 골렘의 재료를 정리했다. 재료 = ["지능", "속도", "호기심", "창의성"] 이 리스트를 기반으로 파이는 딕셔너리로 골렘의 특성을 설계했다. 결과적으로, 골렘의 특성은 다음과 같았다: 골렘의 학습 골렘이 더 효율적으로 데이터를 다룰 수 있도록, 파이..

챗GPT를 더 잘사용하기위한 26가지 프롬프트 원칙

출처 : https://maily.so/saascatch/posts/1do1q0vlrx6 ChatGPT를 더 잘쓰는 26가지 마법의 프롬프트똑똑한 AI 사용법maily.so해당 내용을 다시 정리 했습니다. 1. 텍스트 단락 및 설명 관련특정 주제에 대한 자세한 단락을 작성할 때 필요한 모든 정보를 포함해야 한다.스타일을 변경하지 않고 문법과 어휘를 향상시키며, 원래의 쓰기 스타일을 유지해야 한다.두 개 이상의 파일에 걸쳐 있는 코드를 자동으로 생성하는 프로그램을 작성할 수 있어야 한다.특정 단어, 구문, 문장을 활용하여 일관된 흐름을 유지해야 한다.특정 모델이 따라야 할 요구사항을 명확하게 기술해야 한다.제공된 샘플과 유사한 텍스트를 작성할 때 동일한 형태를 유지해야 한다.2. 프롬프트 형식 및 규칙"단..

데이터 문해력 (저자 : 카시와기 요시키)

실제로 읽고 정리 해보았습니다.책은 한번 읽고 완전히 알수 없다고 생각하여 계속 업그레이드 할 예정이며 이번글에서는 1차로 정리 한 내용입니다.데이터의 문해력 어떻게 보면 ? 데이터는 데이터지 더이상 알게 있을까? 라고 생각할 수 있습니다. 아래는 도서에서 중요하다고 생각되는 내용입니다. (출처 : 데이터 문해력 중) 여러 분야의 현업에 종사하시는 분들이 많으시겠지만 정말 기준, 정답 이 있다면 정말 좋을거 같습니다.여담이지만 공정관리(일정관리)에서도 어려운점이 정해진 기준이나 법칙이 없습니다. 회사마다 다르고 프로젝트 마다 다르고 발주처의 성향에 따라 다르고 결국은 상황이나 환경에 맞는 관리를 한다는게 어렵게 느껴졌었거든요. 제가 생각하는 한가지 돌파구는 그렇다면 여러 프로젝트에 대해 경험해보고 여러환..

파이썬 (변수, 튜플, if문)

변수명 = 변수에 저장할 값aiffel = 'modu'aiffel # 영문자(대, 소문자 구분), 숫자, 언더바(_)만 사용 가능  List_01 = [1, 3, 5]list_01 = [2, 4, 6]List_01 # [Playground] 나만의 변수를 만들어볼까요? 원하는 이름으로 변수를 만들어주세요.park = ('Goodman')park  Q. 다음 중 '틀린' 문장은 무엇일까요? (답은 2개입니다!)① 변수명에는 영문자만 사용할 수 있습니다.② 예약어는 변수명으로 사용될 수 없습니다.③ 변수명의 첫 자리에 숫자가 와도 됩니다.④ __init__은 올바른 변수명입니다.  # 아무 괄호가 없다면 => 튜플# 튜플로 변수에 값을 할당할 수 있습니다. 이를 패킹이라고 합니다.a = 11, 22, 33p..

파이썬 설치

파이썬 설치화면에 Install Now를 클릭하여 설치 시작  파이썬 실행하는 방법중 하나  파이썬 실행하는 방법중 두번째   파이썬 실행하는 방법중 세번째 Jupyter NotebookCommand모드 : M(마크다운 입력창), Y(코드 입력창), X(잘라내기), V(붙여넣기)Edit모드 : 셀에 내용을 입력할 수 있다.pymb확장자로 저장되며 VSC에서도 실행된다. VSC설치하기 파이썬으로 무얼 할 수 있어?웹프로그램밍, 데이터베이스 프로그래밍(데이터베이스에 접근하기위한 도구 제공), 임베디드(파이썬 코드로 드론 제어), 데이터분석(파이썬을 활용한 데이터 분석 대회가 국내외 다수 있다)안드로이드, 아이폰 모바일 프로그램밍은 아직 할수 없다.

파이썬 설치

파이썬 설치화면에 Install Now를 클릭하여 설치 시작  파이썬 실행하는 방법중 하나 파이썬 실행하는 방법중 두번째   파이썬 실행하는 방법중 세번째 Jupyter NotebookCommand모드 : M(마크다운 입력창), Y(코드 입력창), X(잘라내기), V(붙여넣기)Edit모드 : 셀에 내용을 입력할 수 있다.pymb확장자로 저장되며 VSC에서도 실행된다. VSC설치하기 파이썬으로 무얼 할 수 있어?웹프로그램밍, 데이터베이스 프로그래밍(데이터베이스에 접근하기위한 도구 제공), 임베디드(파이썬 코드로 드론 제어), 데이터분석(파이썬을 활용한 데이터 분석 대회가 국내외 다수 있다)안드로이드, 아이폰 모바일 프로그램밍은 아직 할수 없다. 파이썬 학습에 도움되는 사이트 : CodeUp, 백준, 모두의..

미세먼지 수치 1/20일

오늘은 마스크가 도움되는 날이네요미세먼지가 심한날 왜 마스크를 써야하나? 이유를 찾아봤습니다. 1. 미세먼지란 무엇인가?정의: 미세먼지는 공기 중에 떠다니는 매우 작은 입자(먼지)로, 주로 자동차 배출가스, 공장 연기, 황사 등에서 발생함.분류:PM10: 지름 10마이크로미터 이하 입자 → 코나 기관지에서 걸러질 수 있음PM2.5: 지름 2.5마이크로미터 이하 초미세먼지 → 폐 깊숙이, 심지어 혈관까지 침투 가능2. 미세먼지가 우리 몸에 미치는 영향호흡기 질환: 기관지염, 천식, 폐렴, 만성폐질환 유발 및 악화심혈관계 질환: 혈관을 따라 침투해 심장 질환, 고혈압, 뇌졸중 유발 가능성 증가면역력 저하: 장기적으로 면역체계 약화피부 문제: 피부염, 트러블 유발장기적 영향: 암 발생 가능성 증가 (세계보건기..

정보 2025.01.20

데이터 분석가 관련 추천도서

데이터 분석가는 보고서작성, 시각화, 통찰력, 비즈니스/도메인 지식의 능력이 필요하다.여기서 비즈니스/도메인 지식은 특정 산업이나 회사의 주요 활동 영역에 대한 이해를 말하며, 쉽게 말해, “이 회사가 어떻게 돈을 벌고, 고객에게 어떤 가치를 제공하며, 어떤 방식으로 운영되는지”를 아는 것입니다.예를 들어, 편의점에서 수입 맥주 판매 데이터를 분석한다고 할 때, 수입 맥주가 4캔 묶음으로만 기록된다는 점을 모른다면 잘못된 결론을 내릴 수 있습니다. 따라서 이런 산업 특성을 알고 있어야 분석 결과가 실제로 유용해집니다. 이렇게 비즈니스/도메인 지식은 데이터 분석 결과를 실질적으로 활용 가능하게 만드는 핵심 요소입니다.파이썬 머신러닝 판다스 데이터 분석 (개정판)오승환 (지은이)   정보문화사   2024-..

GCP란?

GCP(Google Cloud Platform)는 구글에서 제공하는 클라우드 컴퓨팅 서비스로 쉽게 말하면, 인터넷을 통해 데이터 저장, 애플리케이션 개발, 서버 관리 등의 IT 서비스를 제공하는 플랫폼클라우드란 무엇일까?클라우드는 데이터와 서비스를 내 컴퓨터가 아닌 인터넷(클라우드 서버)에서 제공하는 것을 의미.예시: 구글 드라이브, Gmail, 유튜브도 클라우드 기술을 사용. 파일을 내 컴퓨터에 저장하지 않고 인터넷에서 불러오는것을 말한다.GCP가 무엇을 도와줄까?컴퓨터 없이도 강력한 서버 사용: 내 컴퓨터에서 프로그램을 실행하지 않고, GCP의 강력한 서버를 빌려서 사용.데이터 저장: 대용량 데이터를 GCP 서버에 안전하게 저장하고 관리.애플리케이션 개발: 복잡한 소프트웨어나 앱을 개발할 때 필요한 ..

전자책으로 만드는 월급 외 수익과 새로운 기회

참여비 : 만원 이였습니다. 행사명전자책으로 만드는 월급 외 수익과 새.. 바로가기행사일시2025-01-18 11:00행사장소서울 서대문구 연희로2길 62 한빛미디어 강의실40 (A동 2층) 지도열기 담당자한빛미디어이메일주소event@hanbit.co.kr아래는 이 행사에 참여하고 직접 작성한 내용입니다. 전자책 : 새로운 기회, 성장, 다른기회 종류 : 다양하다 (기술외에 누군가에게 도움을 줄수 있는것) 독자의 입장에 맞춘 작가(취뽀사전) 같은 입장에 사람을 구독자로 취뽀사전 : 과정이 볼만 하다. 사전마케팅(유투브였다) 타겟팅, 내용, 사전마케팅 전자책에서 종이책으로 되었다. 청출어람 전자책 클래스 1기모집(8주) 12/16~12/29 > 안내를 어..

정보 2025.01.18

CTE (Common Table Expression) 란?

CTE (Common Table Expression)란? SQL에서 쿼리를 작성할 때, 복잡한 서브쿼리를 읽기 쉽게 표현하거나 재사용하기 위해 임시적인 이름이 부여된 결과 집합. CTE는 WITH 키워드를 사용하여 정의된다.CTE를 활용하면 쿼리를 단순화하고, 가독성을 높이며, 재사용 가능성을 증가시킬 수 있다.CTE 이름과 별칭에 대소문자가 구분되지 않으므로 컬럼과 다른 이름으로 적용해야됨.  CTE의 주요 특징임시적: CTE는 SQL 문이 실행되는 동안에만 존재합니다. (영구 저장되지 않음)가독성 향상: 복잡한 쿼리를 단계별로 작성할 수 있어 읽기 쉽습니다.재사용 가능: 정의한 CTE는 동일 쿼리 내에서 여러 번 참조할 수 있으며네이밍 가능: CTE는 이름을 부여하여 결과를 참조할 수 있다.CTE 기..

Looker Studio 란?

Looker Studio(구 Google Data Studio)는 데이터를 시각적으로 표현하고, 보고서를 쉽게 작성하고 공유할 수 있도록 도와주는 무료 데이터 시각화 도구다. 데이터를 차트, 그래프, 대시보드 형태로 보여주며, 누구나 직관적으로 데이터를 분석하고 인사이트를 얻을 수 있도록 설계되었다.Looker Studio의 주요 특징 실시간 데이터 연결:Google Analytics, BigQuery, MySQL, CSV 등 800개 이상의 커넥터를 통해 데이터를 통합.데이터 변경 시 자동 업데이트되는 실시간 보고서 제공.사용자 정의 대시보드:KPI를 추적할 수 있는 완전 맞춤형 대시보드 설계.차트, 테이블, 지도 등 30개 이상의 시각화 옵션.팀 협업 최적화:Google Drive처럼 보고서 공유 및..

빅쿼리에서 "(double quotes)와 '(single quotes) 차이는?

각각 다른 용도로 사용됩니다.  1. ' (Single Quotes)문자열 리터럴을 정의할 때 사용합니다.용도 : 문자열 값을 나타냅니다.예시 : SELECT * FROM dataset_name.table_name WHERE column_name = 'example_value';설명 : 'example_value'는 문자열로 간주된다. 문자열 비교, 필터링 시 반드시 사용해야 한다.2. " (Double Quotes)식별자(Identifiers, 예: 컬럼명, 테이블명, 데이터셋명 등)를 정의하거나 예약어를 사용할 때 사용한다.용도 : 컬럼명이나 테이블명이 공백, 특수 문자, 또는 SQL 예약어를 포함할 때.          대소문자를 구분하는 식별자를 사용할 때.예시 : SELECT "Column Na..

A/B 테스트 설계(A/B Test Design) 란?

A/B 테스트 설계는 테스트의 목표를 정의하고, 실험 변수를 설정하며, 데이터를 분석하기 위한 구조를 계획하는 과정을 말하며, 잘 설계된 A/B 테스트는 명확한 결과를 제공하여 비즈니스 성과를 향상시키는 데 기여합니다.A/B 테스트 설계의 주요 단계목표 정의테스트를 통해 무엇을 개선하려는지 명확히 설정합니다.예: 클릭률 증가, 전환율 향상, 구매 완료율 증가 등.변수 선택테스트할 요소(Independent Variable)를 선택합니다.예: 버튼 색상, 문구, 이미지, 레이아웃, 가격 표시 방식 등.Tip: 한 번에 하나의 변수만 변경해야 테스트 결과를 명확히 해석할 수 있습니다.대상 집단 설정테스트에 참여할 사용자 그룹을 정의합니다.균등 분할: A와 B 그룹에 테스트 대상자를 랜덤하게 나누어야 편향을 ..

CPA(Cost Per Action) 란?

디지털 마케팅 및 광고에서 특정 행동(성과)에 대해 비용을 측정하는 성과 기반 광고 모델입니다.CPA는 광고주가 성과(Conversions)에 대해 직접 비용을 지불하는 방식으로, 클릭 수나 노출 수보다 실제 행동에 초점을 맞춥니다.CPA의 주요 요소성과(Action)의 정의CPA에서 정의하는 행동은 광고주의 목표에 따라 다릅니다. 일반적인 예는 다음과 같습니다:구매(Transactions): 제품이나 서비스를 구매.회원가입(Registrations): 이메일 구독, 계정 생성 등.앱 설치(App Installs): 모바일 애플리케이션 다운로드 및 설치.양식 작성(Form Submissions): 상담 신청, 정보 요청 등.CPA 공식CPA = 총 광고 비용성과 수 (Actions)\text{CPA} =..

300x250
SMALL