300x250

2025/03 73

확률과 분포 이해하기 3]

학습목표연속형 확률과 이산형 확률에 대해 이해합니다.다양한 확률의 분포를 알아봅니다.실습 Python 활용 다양한 분포 익히기제이슨을 회사에서 많이 다룬다 SQL이나 파이썬에서 파씽 할 줄 알아야된다.제이슨을 많이 다뤄보면 좋다.JSON (JavaScript Object Notation) 이란?1. JSON의 특징1) 경량 데이터 포맷XML과 비교하여 데이터 표현이 간결하며, 파일 크기가 작음.텍스트 기반이므로 사람이 읽고 이해하기 쉬움.2) 키-값 (Key-Value) 형식Python의 딕셔너리(Dictionary)와 유사한 구조.데이터는 "키(Key)" 와 "값(Value)" 형태로 저장됨.3) 다양한 프로그래밍 언어에서 지원JSON은 Python, JavaScript, Java, C++, PHP, ..

빅분기(빅데이터 분석기사) 시험이란?

빅데이터 분석기사(Big Data Analyst, BDA) 시험은 한국데이터산업진흥원(K-DATA)에서 주관하는 국가기술자격 시험으로, 빅데이터를 활용한 데이터 분석 역량을 검증하는 자격증이다.1. 시험 개요정식 명칭: 빅데이터 분석기사영문 명칭: Big Data Analyst (BDA)주관 기관: 한국데이터산업진흥원(K-DATA)응시 자격: 제한 없음 (누구나 응시 가능)시험 방식: 필기(객관식) + 실기(주관식 및 실습)2. 시험 과목 및 출제 내용1차 필기 시험 (객관식 4지 선다형, 100점 만점, 60점 이상 합격)과목 주요 내용빅데이터 분석 기획데이터 분석 프로세스, 비즈니스 요구 사항 정의빅데이터 탐색데이터 수집, 전처리, 데이터 유형 및 구조 분석빅데이터 모델링통계 기법, 머신러닝, 데이터..

Zotero란?

Zotero의 주요 기능자료 수집: 웹 페이지에서 직접 자료를 저장할 수 있습니다. Zotero Connector를 사용하면 클릭 한 번으로 책, 기사, 웹 페이지 등을 Zotero 라이브러리에 추가할 수 있습니다.조직화: 자료를 컬렉션으로 정리하고 태그를 추가하여 쉽게 검색할 수 있습니다.인용 및 참고문헌 생성: 다양한 인용 스타일을 지원하며, Microsoft Word, Google Docs 등에서 직접 인용을 삽입하고 참고문헌을 생성할 수 있습니다.PDF 관리: PDF 파일을 라이브러리에 추가하고 주석을 달 수 있으며, 관련된 메타데이터를 자동으로 가져올 수 있습니다.동기화 및 협업: Zotero 계정을 만들면 여러 장치 간에 라이브러리를 동기화하고 다른 사용자와 공유할 수 있습니다.설치 방법1. ..

OneTab 설치

OneTab은 브라우저 탭 관리 도구로, 여러 개의 탭을 하나로 모아서 효율적으로 관리하고 시스템 자원을 절약하는 데 도움을 주는 확장 프로그램입니다.1. OneTab 기능탭 통합: 여러 개의 브라우저 탭을 하나의 탭으로 통합하여, 탭을 정리하고 공간을 절약합니다.탭 복원: 나중에 다시 탭을 복원할 수 있으며, 각 탭을 별도로 다시 열거나 한 번에 모두 열 수 있습니다.탭 저장: 탭들을 그룹화하여 저장하고, 필요할 때 복원할 수 있습니다. 이렇게 저장된 탭들은 이후에 언제든지 다시 열 수 있습니다.리소스 절약: 탭을 통합하면 각 탭이 사용하는 리소스(CPU, 메모리 등)를 절약할 수 있습니다.탭 공유: 저장된 탭 목록을 다른 사람과 공유할 수 있는 링크를 생성할 수 있습니다.2. OneTab 설치 방법 ..

Main Quest04 실습-3일차2nd

output_df = pd.read_csv("/content/drive/MyDrive/아이펠_오마카세_프로젝트/output.csv")# 모든 컬럼 표시 옵션 설정 (옵션)pd.set_option('display.max_columns', None)# 데이터셋 상위 5개 행 출력print(output_df.head())# 각 컬럼별 결측치 개수 확인  총3개의 컬럼에서 결측치 발견print("결측치 현황:")print(output_df.isnull().sum())# 중복 데이터 확인 중복데이터 없음print("중복 행 수:", output_df.duplicated().sum())brand_name 컬럼에서 결측치가 가장 많고, sub3_category와 sub4_category도 상당..

보유도서 독서 순서 분석

1. 세상에서 가장 쉬운 통계학입문 - 확률과 분포 강의를 듣고 있는 지금 가장 먼저 읽어야 할 책이다. 중학교 수학 지식만으로도 이해할 수 있게 사칙연산, 제곱, 루트만으로 통계학의 기초를 설명하고 있어, 기술 통계와 추론 통계의 기본 개념, 표준편차, 정규분포, 가설검정, 구간추정 등을 쉽게 설명하여 현재 듣고 있는 확률과 분포 강의의 이해를 크게 도울 것.    2. 누워서 읽는 통계학 - “세상에서 가장 쉬운 통계학입문”에서 배운 기초 개념을 더 확장하고 심화할 수 있다. 통계학의 기본 개념을 쉽게 설명하고 있어 확률과 분포 강의 내용을 보완하는데 도움이 될 것.    3. 데이터 과학을 위한 통계(2판) - 통계학 기초를 다진 후에는 이 책으로 데이터 과학에 필요한 통계 개념을 더 깊이 학습하는..

Obsidian

폴더 만들기왼쪽 사이드바에서 오른쪽 클릭 > '새 폴더' 선택폴더 이름을 입력하고 엔터새 노트 만들기폴더를 선택한 후 상단의 '새 노트' 아이콘 클릭또는 Ctrl+N (Windows) / Cmd+N (Mac) 단축키 사용글 작성하기노트 제목은 파일 이름이 됩니다마크다운 문법을 사용해 내용 작성내용 접기제목 아래 내용을 접으려면 다음과 같이 작성:소제목다른 소제목더 많은 내용`내용 내용 내용`text# 주제미리보기 모드에서 소제목 옆의 화살표로 내용을 접고 펼 수 있습니다링크 만들기[[노트이름]] 형식으로 다른 노트에 링크태그 사용하기#태그이름 형식으로 태그 추가1. Advanced Slides란?Obsidian의 마크다운 문서로 슬라이드를 만드는 플러그인유명한 오픈소스 슬라이드 프레임워크인 Reveal...

Scikit-learn(사이-킷 런), TensorFlow(텐서플로우)

Scikit-learnscikit-learn은 "사이-킷 런"으로 발음합니다. 여기서 'sci'는 'science(과학)'를 의미하며, 'sy-kit learn'으로 발음합니다.많은 사람들이 'scikit'이나 'SciKit', 'sci-kit learn' 등으로 잘못 발음하거나 표기하지만, 정확한 프로젝트 이름은 'scikit-learn(사이킷런)'입니다. 과거에는 'scikits.learn'이나 'scikits-learn'으로 불리기도 했지만 현재는 그렇지 않다.scikit-learn은 파이썬의 대표적인 머신러닝 라이브러리로, 다양한 머신러닝 알고리즘과 모델을 제공.① 기본 개념Estimator (추정기)머신러닝 모델을 의미하며, fit() 메서드를 사용해 학습.예) LinearRegression()..

추천도서 데이터 분석가 2개월후

2개월 동안 Python, SQL, BigQuery, Looker, Notion, GitHub 등을 학습하고, 팀 프로젝트를 통해 Kaggle 데이터를 활용하여 데이터 클리닝, 결측치, 이상치 처리 후 분석에 필요한 컬럼 및 시각화 분석후 발표 및 보고서 작성 경험후 추천 책 입니다.세상에서 가장 쉬운 통계학 입문 (난이도: ★☆☆☆☆)복잡한 공식과 기호를 사용하지 않고, 사칙연산과 제곱, 루트 등 중학교 기초수학만으로 통계학의 기초를 확실히 다질 수 있도록 돕는 입문서입니다.교보문고 링크 누워서 읽는 통계학 (난이도: ★★☆☆☆)다양한 도식화와 수학적 접근의 최소화를 통해 통계학의 기본 개념을 쉽게 이해할 수 있도록 구성된 책입니다.교보문고 링크2단계: 데이터 분석 실무 적용 (중급)A/B 테스트 (난..

로지컬 씽킹(저자:데루야 하나코, 오카다 게이코)

로지컬 씽킹(저자:데루야 하나코, 오카다 게이코)출처 : 알라딘데이터 분석가의 기술적인 부분 외에 기본 논리력을 기를 수 있는 방법은 없을까? 데이터 분석가에겐 파이썬, SQL 같은 하드 스킬도 중요하지만, 데이터를 논리적으로 스토리텔링 할 수 있는 소프트 스킬도 필요하다. 특히 데이터 분석 업무와 컨설팅 펌의 업무를 논리적인 구조와 흐름이 굉장히 유사한데 데이터 분석가는 데이터를 바탕으로 상대방을 논리적으로 설득해야 하는 일이 많다. 처음 논리적 사고를 어떻게 키워야 할지, 어떤 자료를 참고할지 막연하게 느껴지는데, 이 책을 읽어 보길 추천하는 현업 데이터 분석가의 추천글로 읽게 되었다. ‘세계 최강의 지식 상인’맥킨지식 로지컬 씽킹의 기술을 배운다!기획부터 지시와 회의, 보고서, 프레젠테이션, 고객 ..

커리어 관리툴 분석

많이 알고있는 노션, 깃허브, Reddit중에서 분석 결과노션 (Notion) - 95% 추천노션은 내 상황에 가장 적합한 도구같다. 건설 및 플랜트 분야의 풍부한 경력과 현재 데이터 분석 과정을 체계적으로 정리하기에 완벽하다.장점:•데이터베이스 기능을 활용해 프로젝트별, 분야별 경력을 효율적으로 정리 가능.•필터, 그룹, 보기 형태 등을 활용해 27년 경력을 체계적으로 시각화 가능.•데이터 분석 학습 내용을 계층적으로 구조화하여 정리 가능.• 롤업 기능을 통해 프로젝트별 성과나 학습 진행도를 집계하고 요약 가능.활용 방안:• 건설/플랜트 프로젝트 포트폴리오 구축.• 데이터 분석 학습 노트 및 진도 관리.• 경력 전환 과정의 목표 설정 및 달성도 추적.깃허브 (GitHub) - 80% 추천데이터 분석가로..

플랫폼 추천 (경력 정리, 데이터 분석 기록용)

노션 (Notion) - 95% 추천노션은 나의 상황에 가장 적합한 도구. 건설 및 플랜트 분야의 풍부한 경력과 현재 데이터 분석 교육 과정을 체계적으로 정리하기에 완벽하다.장점:• 데이터베이스 기능을 활용해 프로젝트별, 분야별 경력을 효율적으로 정리 가능• 필터, 그룹, 보기 형태 등을 활용해 27년 경력을 체계적으로 시각화 가능• 데이터 분석 과정 내용을 계층적으로 구조화하여 정리 가능• 롤업 기능을 통해 프로젝트별 성과나 학습 진행도를 집계하고 요약 가능활용 방안:• 건설/플랜트 프로젝트 포트폴리오 구축• 데이터 분석 학습 노트 및 진도 관리• 경력 전환 과정의 목표 설정 및 달성도 추적깃허브 (GitHub) - 80% 추천데이터 분석가로 전환하는 과정에서 코드 관리와 포트폴리오 구축에 매우 유용...

데이터 분석가 커리어관리 추천 툴

데이터 분석가를 목표로 하는 사람이 커리어 기록 및 과정을 기록하기에 추천하는 플랫폼 순서를 분석해봤습니다:1. 노션 (90% 긍정):•데이터 분석가 포트폴리오 작성에 최적화된 환경을 제공합니다•문서, 코드, 시각화 자료를 한곳에 체계적으로 정리할 수 있습니다•“한눈에 보기” 항목 등을 통해 알찬 내용 속에 자신을 효과적으로 표현할 수 있습니다•경력, 성과, 프로젝트를 키워드로 태그처럼 정리하기 좋습니다2. 깃허브 (85% 긍정):•코드 기반 프로젝트를 관리하고 버전 관리하기에 최적화되어 있습니다•실제 데이터 분석 코드와 프로젝트를 공개하여 기술력을 증명할 수 있습니다•협업 프로젝트 경험을 보여줄 수 있어 채용 담당자에게 좋은 인상을 줍니다•데이터 분석, 머신러닝 프로젝트를 체계적으로 관리하고 공유할 수..

SMALL