데이터 분석가:Applied Data Analytics 215

자금 지원 효과 (Funding Effect) 와 산업, 경제, 학문과의 영향은?

자금 지원 효과 (Funding Effect) : 알기 쉬운 설명과 산업, 경제, 학문에 미치는 영향안녕하세요. 경제 및 학문 분야의 흥미로운 개념을 탐구하는 일정관리, 데이터분석 전문가 블로그입니다. 오늘은 종종 논의되지만 그 의미가 명확하게 와닿지 않을 수 있는 '자금 지원 효과(Funding Effect)'에 대해 알아보고자 합니다.이 개념이 우리 사회의 산업, 경제, 그리고 학문 분야에 어떤 영향을 미치는지 쉽고 전체적으로 설명해 드리겠습니다.자금 지원 효과란 무엇인가 : 개념 이해하기자금 지원 효과란 : 연구 또는 프로젝트의 자금 출처가 해당 연구의 결과나 결론에 영향을 미치는 현상을 의미합니다.간단히 말해, 누가 돈을 대느냐에 따라 연구 결과가 특정 방향으로 기울어질 수 있다는 것입니다.이는 ..

튜링 테스트란 ?

안녕하세요. 오늘은 인공지능 이야기에서 절대 빼놓을 수 없는 주제인 튜링 테스트에 대해 쉽고 재미있게 이야기해 보려고 해요.요즘 챗봇이랑 대화하다 보면 가끔 ‘이거 진짜 사람 아니야?’ 싶을 때가 있죠? 바로 이 질문에서 튜링 테스트가 시작된답니다. 튜링 테스트가 뭐냐고요?아주 간단해요. 컴퓨터가 사람처럼 생각할 수 있는지를 알아보는 시험이라고 할 수 있습니다.상황을 하나 상상해 볼까요? 여기 커튼이 하나 있고, 여러분은 심사관이 되어 커튼 뒤에 있는 누군가와 컴퓨터 채팅으로만 대화를 나눕니다. 커튼 뒤에는 두 명, 아니 두 존재가 있어요. 한 명은 진짜 사람이고 다른 하나는 인공지능 컴퓨터입니다. 여러분은 자유롭게 질문을 던질 수 있어요. 오늘 날씨 이야기부터 어제 본 영화 감상평, 심지어 시시콜콜한 ..

XGBoost(eXtreme Gradient Boosting) 회귀 모델 이란?

여러 특성을 복합적으로 분석하는 데 성능이 뛰어난 XGBoost(eXtreme Gradient Boosting) 회귀 모델을 사용하여 내부 저항(R_internal_est_mohm)을 예측 XGBoost는 'eXtreme Gradient Boosting'의 줄임말로, 여러 개의 간단한 예측 모델을 합쳐서 더 정확한 예측을 만들어내는 똑똑한 기계학습 방법 중 하나입니다. 특히 회귀 문제에서 특정 숫자 값을 예측하는 데 아주 뛰어난 성능을 보입니다.XGBoost의 작동 원리이해를 위해 '집값 예측'을 예로 들어보겠습니다.1. 첫 번째 예측먼저 아주 단순한 모델 (보통 '결정 트리'라고 부릅니다) 하나가 집값을 예측합니다. 예를 들어 '방 개수가 3개 이상이면 5억, 아니면 3억' 과 같이 매우 간단하게 예측..

바나나 배터리 아닙니다. 바나듐 배터리에 대해서 아십니까?

1. 바나듐 배터리는 어떤 배터리인가?바나듐 배터리는 ‘레독스 흐름 배터리(Redox Flow Battery)’의 한 종류. 일반 배터리처럼 안에 에너지가 들어있고 충전하는 구조가 아니라, ‘전해액’이라는 액체를 사용해서 전기를 저장하고 방출하는 배터리핵심 구조두 개의 물탱크처럼 생긴 저장 탱크가 각각에는 전해질(바나듐이 녹아 있는 액체)이 들어 있다.가운데에는 전기를 만드는 셀(Stack)이라는 부분이 있어 전해질이 여기로 들어오면, 산화와 환원 반응(레독스 반응)이 일어나서 전기가 만들어진다.2. 왜 하필 ‘바나듐’을 쓸까?보통 다른 레독스 배터리는 두 가지 다른 금속을 쓰는데, 바나듐 배터리는 ‘모든 전해액에 바나듐만’ 사용그 이유는?바나듐은 산화 상태가 여러 개(V2+, V3+, VO2+, VO2..

왜 이상치(Outlier)가 위험한가? - "반 평균"의 함정

왜 이상치(Outlier)가 위험한가? - "반 평균"의 함정학생 5명의 수학 점수를 예로 들어보겠습니다. 이 5명의 점수가 데이터입니다.정상적인 경우:학생 A: 85점학생 B: 90점학생 C: 80점학생 D: 95점학생 E: 88점이 반의 평균 점수는 (85 + 90 + 80 + 95 + 88) / 5 = 87.6점 입니다. 이 87.6점이라는 평균은 "이 반 학생들은 대체로 80점대 후반의 점수를 받았다"라고 말할 수 있는 좋은 대표값입니다.이상치가 포함된 경우: 그런데 학생 E의 점수를 컴퓨터에 입력하다가 실수로 '88점'이 아닌 '1000점'을 입력했다고 가정해봅시다.학생 A: 85점학생 B: 90점학생 C: 80점학생 D: 95점학생 E: 1000점 (이상치!)이 때, 새로운 평균 점수는 (85..

전력 효율분석 프로젝트 고민의 흔

# 데이터 핸들링을 위한 pandas 라이브러리 (별칭: pd)import pandas as pd# 파일 경로를 쉽게 다루기 위한 glob 라이브러리import glob# 데이터 시각화를 위한 matplotlib와 seaborn 라이브러리 (향후 분석을 위해 미리 불러옵니다)import matplotlib.pyplot as pltimport seaborn as snsprint("라이브러리 불러오기 완료!")import glob # 이 줄을 추가해서 glob 라이브러리를 불러옵니다.import os # 경로를 안전하게 만들기 위해 os 라이브러리도 함께 불러옵니다.# 1. 데이터 파일들이 저장된 폴더 경로를 변수에 저장합니다.data_path = 'C:/컴퓨터의 본인 폴더경로 입력(파일경로아님 폴더까지..

아직도 쥬피터 노트북 쓰세요? 당신의 분석 속도를 갉아먹는 '진짜' 이유

데이터 분석 프로젝트에는 JupyterLab(쥬피터랩)을 사용하시는 것을 강력히 추천합니다.두 도구의 차이를 쉽게 비유하자면 다음과 같습니다.쥬피터 노트북 (Jupyter Notebook) : 하나의 '문서 편집기' 같습니다. 노트북 파일(.ipynb) 하나를 열고 작업하는 데 최적화되어 있습니다.쥬피터랩 (JupyterLab): '통합 개발 환경(IDE)'에 가깝습니다. 코드를 짜는 노트북뿐만 아니라, 파일 탐색기, 터미널, 텍스트 편집기 등 다양한 도구를 한 화면에 원하는 대로 배치해서 사용할 수 있습니다.아래 표는 두 도구의 특징 비교.구분Jupyter Notebook (쥬피터 노트북)JupyterLab (쥬피터랩)구분단일 문서 중심 인터페이스웹 기반의 통합 개발 환경 (IDE)화면 구성한 번에 하..

SKT 다음은 당신? 끝나지 않은 해킹 전쟁, 이미 타겟이 되었다.

1. SK텔레콤 해킹 (2025년 4월)지난 2월 SK텔레콤의 대규모 개인정보 유출 사건공격자는 사회공학적 기법을 통해 내부 직원의 계정을 탈취하고, 관리자 권한을 확보하여 약 2,300만 명의 고객 정보를 유출했습니다.유출된 정보에는 USIM 데이터, IMEI, 고객 이름 및 전화번호 등이 포함되어 있으며, 이는 보이스피싱 및 휴대폰 복제 범죄로 이어질 수 있는 심각한 위협입니다.이 사건으로 인해 약 94만 명의 사용자가 통신사를 변경하는 등 사회적 파장이 컸습니다. ictleader.tistory.comkoreatimes.co.kr+3mk.co.kr+3koreajoongangdaily.joins.com+32. 예스24 랜섬웨어 공격 (2025년 6월)6월에는 국내 최대 온라인 서점 예스24가 랜섬웨어..

엑셀파일 복구하기 - 파이

코드 실행 결과 검토: 심각한 파일 손상 및 해결 방안제공해주신 Python 코드와 실행 결과를 검토한 결과, 엑셀 파일이 매우 심각하게 손상되어 xlwings 라이브러리로도 복구 및 데이터 추출이 불가능한 상황으로 판단1. 오류 분석에러 메시지: (-2147352567, '예외가 발생했습니다.', (0, 'Microsoft Excel', 'Workbooks 클래스 중 Open 메서드에 오류가 있습니다.', 'xlmain11.chm', 0, -2146827284), None)오류의 의미: 이 오류는 Python 코드가 xlwings를 통해 Microsoft Excel 응용 프로그램에게 '복사본 기술자료_5(자동 복구됨)(자동 복구됨).xls' 파일을 열어달라고 요청했을 때, Excel 프로그램 자체에서 ..

Office 2016 및 2019 서비스 종료?

Office 2016 및 2019 이 제품 구매를 막차타신 분들은 황당 할 수 밖에 없는데요왜냐 문제는 제품을 사고 일 년도 안 돼서 보안이나 서비스를 지원을 못 받는다고 하니까 그럴 수밖에 없죠아무리 할인 된 금액으로 제품만 구매 했다고 하지만 공짜로 구매한 건 아니거든요그래서 소프트웨어에 관한 내용을 정리해놨습니다1. 소프트웨어 지원 정책의 기준점• 지원 기간은 ‘제품 출시일’을 기준으로 산정하는 것이 글로벌 소프트웨어 업계의 표준입니다.• 예를 들어, Office 2019는 2018년 9월에 출시되어, 2025년 10월까지 약 7년간 지원이 제공됩니다.• 늦게 구매한 소비자라도, ‘구매일’이 아닌 ‘출시일’ 기준으로 지원 종료일이 정해집니다.• 이는 Windows, SQL Server 등 모든 주요..

"인지 수행 골디락스 존" 을 개인적으로 실행하기 위한 방법

골디락스 존 개인적 실행 1. 본인 생체리듬 분석 및 인지 성능 구간 파악목적자신의 “피크 존 – 밸리 존 – 리바운드 존” 시간대를 파악하여, 집중도와 에너지를 최대한 활용하는 스케줄을 만들기 위함입니다.방법1~2주간 하루 일과를 시간대별로 기록 (예: 1시간 단위로 집중력, 피로도, 성취감 점수화)기록 예시:9-10시: 집중도 8/10, 에너지 9/1014-15시: 집중도 3/10, 에너지 4/10패턴 분석: 비슷한 시간대에 피크/밸리/리바운드 경향이 반복되는지 확인적용피크 존: 고난도·창의적 작업밸리 존: 단순·반복적 업무리바운드 존: 중간 난이도, 협업·정리 등개인화된 시간대 예시 (사람마다 다름)피크: 오전 9-11시밸리: 오후 2-3시리바운드: 오후 4-6시2. 작업 설계 및 난이도 조절 (골..

인지 수행에서의 골디락스 존(Goldilocks Zone)

인지 수행에서의 골디락스 존(Goldilocks Zone)은 과제의 난이도, 스트레스 수준, 인지 부하가 “너무 쉽지도, 너무 어렵지도 않은” 최적의 상태를 의미합니다.이 개념은 인간의 인지 성능, 동기 부여, 학습 효율성을 극대화하기 위한 핵심 원리로 다양한 분야에서 적용되고 있습니다.1. 골디락스 존의 개념적 기반골디락스 원칙(Goldilocks Principle)은 과제가 개인의 현재 능력 수준을 약간 상회할 때 최고의 동기와 성과가 발생한다는 이론입니다. 이는 다음과 같은 이론들과 연결됩니다• 예르케스-도드슨 법칙(Yerkes-Dodson Law): 중간 수준의 스트레스가 최적의 성과를 낸다는 법칙.• 70% 규칙: 70% 성공률을 유지하는 과제가 학습과 성장을 촉진한다는 연구 결과.• 근접 발달..

Dash 시각화

Python 기반의 웹 대시보드 프레임워크인 Dash 구현 주피터 노트북이나 아나콘다 프롬프트에서 다음을 실행pip install dash 아래 명령어는 Jupyter 셀이 아닌 아나콘다 프롬프트 또는 CMD/Terminal에 입력jupyter labextension install jupyterlab-plotly최근 버전에서는 JupyterLab에서 특별한 확장 없이도 mode='inline'이 작동할 수 있습니다.즉, 이 명령어 자체가 필요 없을 수도 있습니다. 다음만 실행해보고 확인아래를 JupyterLab에서 실행from jupyter_dash import JupyterDash from dash import html app = JupyterDash(__name__) app.layout = html..

Dash (by Plotly)란?

1.1 기본 개념Dash는 Python 기반의 웹 애플리케이션 프레임워크입니다.특히 데이터 시각화 대시보드를 만들기 위해 설계되었습니다.Plotly라는 시각화 라이브러리를 기반으로 동작합니다.HTML, CSS, JavaScript를 직접 다룰 필요 없이 Python 코드만으로 대시보드를 만들 수 있습니다.1.2 다른 도구들과의 비교 (Superset, Looker, Tableau)기술기반PythonSQL + UILookMLDrag & Drop실시간 인터랙션매우 강력 (Python 콜백 사용)제한적 (필터링 위주)일부 가능필터링 가능예측 모델 연동Python으로 직접 구현 가능 (sklearn, XGBoost 등)어려움Looker Action 필요외부 연동 필요커스터마이징완전 자유 (코드 기반)제한적제한적..

시계열 분석의 정상성(stationarity)

1. 정상성의 의미정상성(stationarity)이란 시계열 데이터의 통계적 성질이 시간에 따라 일정하게 유지되는 상태를 말한다.이때 통계적 성질이란 평균, 분산, 자기공분산 등을 포함한다.정상 시계열은 다음 조건을 만족해야 합니다.평균이 시간에 따라 변하지 않는다분산이 일정하다자기공분산이 시간의 위치에 의존하지 않고 시차(lag)에만 의존한다2. 정상성 검증이 중요한 이유시계열 모델(예: ARIMA, SARIMA 등)은 정상성을 기본 가정으로 하여 작동한다.비정상 데이터를 그대로 분석하면 예측력이 떨어지고, 통계적 해석도 왜곡된다.따라서 모델링 전에 정상성을 먼저 확인하고, 필요시 정상화 처리를 해야 한다.3. 정상성 검증 방법1) 시각적 방법시계열 그래프에서 평균이나 분산이 시간에 따라 변하는지를 확..

트럼프 행정부의 하버드 대학 제재 조치

출처 : CNN기사 https://edition.cnn.com/2025/05/27/us/trump-harvard-cancel-federal-contracts?Date=20250527&Profile=CNN&utm_content=1748374383&utm_medium=social&utm_source=linkedin 지금 현재 미국에서 이슈가 되는 내용입니다. 🇺🇸 미국 학계의 반응1. 학문적 자유 침해에 대한 우려미국 내 학계는 트럼프 행정부의 조치를 학문적 자유에 대한 심각한 침해로 간주하고 있습니다. 하버드대는 연방 정부의 요구에 맞서며 소송을 제기하였고, 이를 통해 헌법상 권리와 대학의 독립성을 지키려는 노력을 보이고 있습니다.2. 과학 연구 및 교육에 대한 영향연방 자금 지원 중단은 하버드대의 연..

모수(parameter) 란?

데이터 분석에서 모수(parameter)는 모집단의 특성을 나타내는 수치적 지표로, 확률 분포의 형태를 결정하는 핵심 요소입니다. 모수를 이해하는 것은 통계적 추론과 머신러닝 모델 구축의 기초가 됩니다.모수의 정의와 기본 개념 • 모수는 모집단의 분포를 규정하는 수치(예: 정규분포의 평균 μ, 분산 σ²) • 추정량(estimator)은 표본 데이터로부터 모수를 추정하는 통계량(표본평균, 표본분산 등) • 최대가능도법(MLE)은 관측 데이터를 가장 잘 설명하는 모수를 찾는 방법으로, 가능도 함수 최대화 원리 사용모수적 방법의 특징장점 • 가정된 분포 하에서 효율성 높은 추정 가능 • 소표본에서도 강력한 검정력 발휘(정규성 가정 충족 시) • 복잡한 관계 모델링에 적합(회귀분석 등)단점 • 분포 가정이 ..

예측의 실존적 무의미함

인간적 사고의 고유 가치를 회복하자는 의미이기도 합니다. 1. 예측이란 무엇인가?예측(Prediction)은아직 일어나지 않은 미래의 사건을현재까지 확보한 정보나 패턴을 바탕으로 추론하는 행위입니다.예측은 두 가지 전제를 필요로 합니다:현재의 정보가 미래에 영향을 준다는 믿음미래는 어느 정도 규칙이나 패턴을 따른다는 가정2. 실존적 관점에서의 문제제기실존주의 철학은 다음과 같이 말합니다:미래는 아직 존재하지 않는다.인간은 지금 이 순간만을 살 수 있다.불확실한 세계에서, 우리는 본질적으로 모르는 상태에 처해 있다.여기서 나오는 핵심 의문은 다음과 같습니다:존재하지 않는 미래를 지금 추론하는 것이 과연 가능한가?예측은 실제 세계의 어떤 진실을 말해주는가?3. 예측의 실존적 무의미함이란?이 용어는 다음과 같..

딥시크(Deepseek) 개인정보 문제

딥시크(Deepseek) 개인정보 문제 요약딥시크(Deepseek)는 중국에서 개발된 생성형 AI 챗봇으로, 저렴한 비용과 성능으로 주목받았으나, 개인정보 수집 및 보안 문제로 큰 논란을 일으켰습니다.주요 개인정보 문제• 광범위한 개인정보 수집딥시크는 이름, 생년월일 등 기본 신상정보뿐 아니라 인터넷 IP 주소, 고유 장치 식별자, 키 입력 패턴 등 매우 다양한 정보를 수집합니다. 사용자가 웹이나 앱을 통해 딥시크를 이용할 경우, 이런 정보가 실시간으로 중국에 위치한 서버로 전송됩니다.• 이용자 선택권 부재챗GPT 등 주요 글로벌 AI 서비스들은 개인정보 수집·활용에 대해 이용자에게 선택권을 주지만, 딥시크는 별도의 동의 없이 정보를 수집·전송합니다. 즉, 사용자는 정보 제공을 거부할 수 없습니다.• 중..

300x250
SMALL