2025/02 57

ADsP의 예상 기출문제

1. 데이터 분석의 정의와 목적은 무엇인가?2. 데이터 사이언스의 주요 구성 요소는 무엇인가?3. 빅데이터의 3V(Volume, Velocity, Variety)에 대해 설명하시오.4. 정형 데이터와 비정형 데이터의 차이점은 무엇인가?5. 데이터 마이닝의 주요 기법들을 나열하시오.6. 회귀분석과 상관분석의 차이점은 무엇인가?7. 단순 회귀분석과 다중 회귀분석의 차이점은 무엇인가?8. 결정계수(R²)의 의미는 무엇인가?9. p-value의 의미와 해석 방법은?10. 가설검정의 기본 절차를 설명하시오.11. 모수적 방법과 비모수적 방법의 차이점은 무엇인가?12. 주성분분석(PCA)의 목적과 활용 사례는?13. 클러스터링의 개념과 주요 알고리즘을 나열하시오.14. K-평균(K-Means) 알고리즘의 동작 원리..

머신러닝(Machine Learning, ML)-실습

해당 실습은 정보문화사의 파이썬 머신러닝 판다스데이터분석 도서를 기반으로 정리 했습니다. # 데이터 통계 요약정보 확인 df.describe()# 누락 데이터 확인 df.isnull().sum()   #결측치가 없다.mpg 0cylinders 0displacement 0horsepower 0weight 0acceleration 0model year 0origin 0name 0dtype: int64# 중복 데이터 확인 df.duplicated().sum()  #중복행이 없다0# 상관계수 분석 - 데이터프레임 corr = df.corr(numeric_only=True) corr# 상관계수 분석 -..

머신러닝(Machine Learning, ML)-용어편

머신러닝과 관련된 개념과 분석방법들에 대해 미리 용어들의 내용을 정리 했습니다.정리하다 보니 너무 내용이 이해가 안되서 다시 아래 □안에 핵심정리로 따로 정리 해보았습니다. 1. 머신러닝 전체 프로세스머신러닝 프로젝트는 보통 다음과 같은 과정으로 진행된다.문제 정의 및 목표 설정데이터 수집 및 전처리데이터 탐색 및 분석모델 선택 및 학습모델 평가 및 성능 개선모델 배포 및 활용이제 각 단계를 구체적으로 설명하고, 사용되는 분석 방법을 소개하겠다.2. 머신러닝 프로세스 상세 설명 & 분석 방법1) 문제 정의 및 목표 설정머신러닝을 적용할 문제를 정의하고, 목표를 설정하는 단계이다.예제:이메일이 스팸인지 아닌지 분류고객이 제품을 구매할지 예측집의 크기와 위치를 보고 집값을 예측머신러닝 유형 선택문제 유형에 ..

4. Data transformation - 영국시장의 중고 자동차 가격 데이터 다루기[프로젝트]

해당 프로젝트는 "모두연 PDA(프로덕트데이터분석)1기 수업과정" 에서 수행한 내용을 기준으로 작성했습니다. import pandas as pdimport numpy as npimport seaborn as snsIn [3]:car_df = pd.read_csv('../../data/cars.csv')In [5]:brand_df = pd.read_csv('../../data/brand.csv')In [6]:car_df.head()Out[6]: brand_df.head()Out[7]:In [8]:car_df.info()RangeIndex: 3687 entries, 0 to 3686Data columns (total 13 columns): # Column Non-Null Count ..

MCDM vs MECE

MCDM vs MECE 영어가 비슷한데 뜻은 전혀 다릅니다. 무엇이 다른지 알아보겠습니다.MCDM vs MECE 차이점 비교구분MCDM (Multi-Criteria Decision Making)MECE (Mutually Exclusive, Collectively Exhaustive)개념여러 기준을 고려하여 최적의 대안을 선택하는 의사결정 기법문제를 중복 없이(Mutually Exclusive) 빠짐없이(Collectively Exhaustive) 분류하는 원칙목적최적의 선택을 위한 평가 및 의사결정논리적으로 문제를 구조화하고 분류활용 방식여러 평가 기준을 설정하고, 가중치를 적용하여 최적의 대안을 찾음데이터를 중복 없이, 빠짐없이 나누어 체계적으로 분석적용 예시- 중고차 구매 시, 가격, 연비, 주행거리..

정보 2025.02.13

TOPS (Technique for Order Preference by Similarity to Ideal Solution)

TOPS (Technique for Order Preference by Similarity to Ideal Solution)란?TOPS는 다기준 의사결정(MCDM, Multi-Criteria Decision Making) 방법 중 하나로, 여러 대안 중에서 **이상적인 대안(최적의 선택)**과 가장 가까운 것을 선택하는 기법.TOPS의 핵심 개념이상적인 대안(Ideal Solution) 설정모든 평가 기준(예: 가격, 성능, 내구성 등)에서 가장 좋은 값을 가지는 이상적인 대안을 정의.반대로, 가장 나쁜 값을 가지는 대안(반이상적인 대안, Negative Ideal Solution)도 설정.각 대안과 이상적인 대안 간의 거리 계산각 대안이 이상적인 대안과 얼마나 가까운지, 반이상적인 대안과 얼마나 먼지를..

정보 2025.02.13

3. Data transformation

해당 내용은 모두연의 프로덕트데이터분석가1기 수료과정 중 내용과 개인적인 내용을 정리한 것입니다.   데이터 병합, 개요 작성, 결측치 및 이상치 처리, 집계와 피벗 테이블 활용, 로그 변환 및 원-핫 인코딩, 스케일링, 주성분 분석(PCA)을 통해 데이터 변환의 고급 기술.데이터를 다양한 방법으로 합치고 변환할 수 있다.데이터의 스케일을 변환할 수 있다.카테고리형 데이터를 숫자형태로 변환할 수 있다.데이터의 차원축소를 할 수 있다. JOIN 종류: INNER, OUTER, LEFT, RIGHTINNER JOIN (교집합)"공통된 데이터만 가져온다"A와 B에 모두 존재하는 승객만 선택A, B 둘 다 포함된 승객만 출력됨.예제:승객 ID / (A)승객 이름1Alice2Bob3Charlie승객 ID / (B..

1. Data cleaning - 타이타닉 데이터 다루기

아래내용은 모두연의 프로덕트데이터분석1기 수업내용중에 정리한 겁니다. Pandas : 파이썬을 지원하는 페키지Dataframe : 판다스에서 제공하는 데이터(엑셀과 비슷하다)index, row(행), column(열, 변수, Feature)독립변수를 잘 활용해서 종속변수를 예측data.head()data.tail() : 뒷에 5일반적으로 1: yes, 0:No  data.info() : 컬럼에 대한 정보, 데이터라인, 컬럼몇개, 내용 제대로 들어가있는 데이터값, Dtype(데이터 타입) 을 알려줌data.describe() : object를 뺀 숫자형태의 데이터를 보여줌교육과정중에 자주 등장하는 메소드 10개 입니다. 숙지 하셨다가 잘 활용해 보세요.!!NO.메소드설명1..describe()DataFra..

6장_데이터프레임의 다양한 응용(데이터프레임 합치기)

# 라이브러리 불러오기 import pandas as pd # 데이터프레임 만들기 df1 = pd.DataFrame({'a': ['a0', 'a1', 'a2', 'a3'],                     'b': ['b0', 'b1', 'b2', 'b3'],                     'c': ['c0', 'c1', 'c2', 'c3']},                     index=[0, 1, 2, 3])  df1df2 = pd.DataFrame({'a': ['a2', 'a3', 'a4', 'a5'],                     'b': ['b2', 'b3', 'b4', 'b5'],                     'c': ['c2', 'c3', 'c4', 'c5'],  ..

6장_데이터프레임의 다양한 응용

Lambda 함수(익명 함수) 쉽게 기억하는 방법Lambda 함수는 "이름 없는 짧은 함수" 라고 생각하면 이해하기 쉽습니다.1. 기본 문법lambda 매개변수: 표현식lambda : 함수 선언 키워드매개변수 : 입력값 (여러 개도 가능)표현식 : 반환할 값 (한 줄로 작성해야 함)기본 함수와 비교하면 이렇게 정리할 수 있어요.# 일반 함수 def add(x, y): return x + y # 같은 기능의 lambda 함수 add_lambda = lambda x, y: x + y ✔ lambda는 return 없이도 결과를 반환합니다.2. 사용 예시 (1) 리스트 정렬에 사용students = [("Alice", 90), ("Bob", 80), ("Charlie", 85)] # 점수를 기준으로 정렬 st..

Matplotlib

# x, y축 데이터를 plot 함수에 입력 plt.plot(sr_one.index, sr_one.values) #sr_one.index는 x축 값(인덱스), sr_one.values는 y축 값(데이터 값)이 된다.[]1. plt.plot(sr_one.index, sr_one.values)plt.plot(sr_one.index, sr_one.values) plt.show()sr_one이 pandas.Series 객체라고 가정하면, sr_one.index는 x축 값(인덱스), sr_one.values는 y축 값(데이터 값)이 된다.따라서 plt.plot(sr_one.index, sr_one.values)는 x축과 y축을 명확히 지정해서 선 그래프를 그린다.plt.show()를 호출하면 그래프만 출력된다.2..

아나콘다 설치

파이썬을 따로 설치 해도 되지만 아나콘다 배포판을 설치하면 판다스와 넘파이 등 데이터 분석에 필요한 필수 라이브러리들이 자동으로 기본 설치된다. 다운로드 하는것을 추천하며 아래는 가상환경에서 하는것을 기준으로 합니다.모든게 설치된 base에서 하면 편하기는 하지만 처음 고생하는것을 추천합니다.그래야 가상환경이 무엇이고 필요한 라이브러리는 어떤것이 있어야된다는걸 더 실감나게 알수 있습니다.   윈도우 검색에서 "Anaconda"를 입력하고 아나콘다 프롬프트(Anaconda Prompt)를 실행하면 도스창이 뜬다.mkdir pandas로 폴더를 만들고 cd pandas 폴더로 이동한다.conda env list는 현재 가상환경을 출력한다. 현재 활성화되어 있는 환경에 * 표시가 있다conda activate..

가상공간(가상 환경, Virtual Environment)의 개념

가상공간(가상 환경, Virtual Environment)은 독립적인 파이썬 실행 환경을 의미합니다. 쉽게 말해, 컴퓨터 안에 여러 개의 "파이썬 작업 공간"을 따로따로 만들 수 있도록 도와주는 기능입니다.가상 환경이 필요한 이유프로젝트별 환경 분리예를 들어, 프로젝트 A에서는 pandas 1.3 버전을 사용하고, 프로젝트 B에서는 pandas 1.5 버전이 필요할 수 있습니다.만약 가상 환경이 없다면, 파이썬에 설치된 패키지가 하나뿐이라 여러 프로젝트에서 충돌이 발생할 수 있습니다.가상 환경을 사용하면, 프로젝트마다 필요한 패키지와 버전을 따로 관리할 수 있습니다.시스템 환경 보호가상 환경을 사용하지 않고 직접 패키지를 설치하면, 시스템에 있는 기본 파이썬 환경이 변경됩니다.여러 프로젝트를 진행하다 보..

파이썬으로 게임만들기

import random# Character 클래스 정의class Character:    def __init__(self, name, level, health, attack, defense, job):        self.name = name        self.level = level        self.health = health        self.attack = attack        self.defense = defense        self.job = job        def is_alive(self):        return self.health > 0        def take_damage(self, damage):        actual_damage = max(0, d..

사각형 넓이 구하기 와 키오스크 만들기

사각형 넓이 구하기# 사각형 넓이를 구하는 클래스 완성!class Square:    def __init__(self):        self.square = int(input('넓이를 구하고 싶은 사각형의 숫자를 써주세요.\n 1.직사각형 2.평행사변형 3.사다리꼴 \n >>>'))        if self.square == 1:            print('직사각형 함수는 rect()입니다.')  #Square 클래스에 rect() 메서드를 추가합니다.        elif self.square == 2:            print('평행사변형 함수는 par()입니다.')    #Square 클래스에 par() 메서드를 추가합니다.                elif self.square =..

알고리즈미스트(Algorithmist)

알고리즈미스트는 다양한 기술을 사용하여 알고리즘의 공정성과 투명성을 확보하고, 알고리즘에 의해 부당한 피해 입은 사람을 구제한다. 주요 기술은 ; • 기계학습(Machine Learning): 데이터를 학습하여 예측 모델을 생성하고 알고리즘의 작동 방식을 분석합니다. • 회귀분석(Regression Analysis): 독립변수와 종속변수 간의 관계를 분석하여 알고리즘의 영향을 평가합니다. • 유전자 알고리즘(Genetic Algorithms): 최적화를 통해 알고리즘의 성능을 개선하거나 문제를 해결합니다. • 감정분석(Sentiment Analysis): 텍스트 데이터를 분석해 사용자 감정을 파악하고 알고리즘 결과를 평가합니다. • 소셜 네트워크 분석: 관계망 데이터를 활용해 알고리즘의 사회적 영향을 분..

WBS 와 MECE

공정관리 일정관리에서 작업분류체계인 WBS(Work Breakdown Structure)와 MECE(Mutually Exclusive and Collectively Exhaustive)는 서로 다른 목적과 분야에서 사용되지만, 체계적 분류와 조직화라는 공통점이 있습니다.• WBS는 프로젝트 관리에서 사용되는 도구로, 프로젝트를 계층적으로 세분화하여 각 작업 단위를 정의하고 조직합니다. 이는 작업의 범위를 명확히 하고 관리 가능하게 만드는 데 중점을 둡니다. 프리마베라 P6 에서 activity정의 를 WBS별로 구분할때 사용합니다.• MECE는 주로 문제 해결과 분석에서 사용되는 사고 프레임워크로, 항목을 상호 배타적(Mutually Exclusive)이고 전체를 포괄(Collectively Exhaus..

정보 2025.02.01
300x250
SMALL