데이터 분석가:Applied Data Analytics/파이썬

아나콘다 설치

데이터분석 2025. 2. 6. 13:55

파이썬을 따로 설치 해도 되지만 아나콘다 배포판을 설치하면 판다스와 넘파이 등 데이터 분석에 필요한 필수 라이브러리들이 자동으로 기본 설치된다. 다운로드 하는것을 추천하며 아래는 가상환경에서 하는것을 기준으로 합니다.

모든게 설치된 base에서 하면 편하기는 하지만 처음 고생하는것을 추천합니다.

그래야 가상환경이 무엇이고 필요한 라이브러리는 어떤것이 있어야된다는걸 더 실감나게 알수 있습니다. 

해당주소에서 본인의 컴퓨터 에 맞게 파일을 다운로드 한다.
설치진행중

 

설치완료후 Next
아나콘다 클라우드 소개 Next클릭
아나콘다 설치 완료 Finish클릭
아나콘다 문서 사이트가 팝업 창에 열린다. 필요한 내용을 찾아서 참고하기 유용한 곳

SMALL

자동적으로 아나콘다가 실행되었으며 아나콘다 내비게이터 홈화면
홈화면에서 Environments클릭후 새로운 가상환경을 만들어준다 아래 + Create클릭후 여기서는 pandas라고 입력했다. 이때 Python버전을 선택할수 있다.
15개의 패키지가 설치완료 이런식으로 파이썬 버전을 직접지정하고 필요한 패키지를 별도로 추가하는 방식으로 작업하는것이 일반적임
pandas선택후 Not installed 선택후 아래항목에서 jupyter관련 항목을 선택하고 적용한다. 본인은 base에 있는 항목들을 참고하여 적용하였다.
홈에서 설치된 applications 항목중 JupyterLab실행 아래 Launch클
이 화면이 뜨면 제대로 설치 및 실행이 된것이다. 젤 위에 Python 3를 클릭

여기서 잠깐 pyarrow를 선택하고 설치해줘야된다.

 

윈도우 검색에서 "Anaconda"를 입력하고 아나콘다 프롬프트(Anaconda Prompt)를 실행하면 도스창이 뜬다.

mkdir pandas로 폴더를 만들고 cd pandas 폴더로 이동한다.

conda env list는 현재 가상환경을 출력한다. 현재 활성화되어 있는 환경에 * 표시가 있다

conda activate pandas 명령을 실행하면 추가한 pandas가상환경을 활성화 한다.

그럼 아래 처럼 앞에 (pandas)부분이 표시되어 현재 활성화된 가상환경을 확인할 수 있다.

파이썬 패키지 관리자(pip)를 통해 ipykernel패키지를 pandas 가상환경에 설치한다.

pip install ipykernel명령을 입력하고 실행 한번만 해주면됨.

아래 명령어를 실행하면 pandas 가상환경을 Jupyter Notebook 환경에서 인식할 수 있도록 추가된다.

 

여기서 한단계가 빠져서 고생좀 했습니다 ㅜㅜ 가상환경으로 하기때문에 아래 내용이 들어있는 텍스트 파일로 설치를 해야 됩니다.

folium==0.15.1
lxml==5.1.0
matplotlib==3.8.2
numpy==1.26.3
openpyxl==3.1.2
pandas==2.2.0
pillow==10.2.0
pyarrow==15.0.0
scikit-learn==1.4.0
scipy==1.12.0
seaborn==0.13.2
tzdata==2023.4
beautifulsoup4==4.12.2
missingno==0.5.2

 

이내용이 들어 있는 파일을 아나콘다 프롬프트에서 pip install -r 텍스트파일.txt 아래로 실행하여 설치

설치 화면
jupyter lab를 실행하면 현재 폴더에서 아래 화면처럼 주피터 랩이 실행된다.
해당 창에서 선택하게 되어있다

 

가상환경 pandas를 만들었으니 pandas를 선택하고 실행

여기서 jupyter lab을 실행중일때는 아나콘다 프롬프트창을 닫으면 안되는거 같습니다. 연결이 끊어졌다고 메시지가 뜨는거 보니. (주의)

이렇게 되면 정상 아까 와는 화면이 다른걸 알수 있다. 오른쪽에 pandas가 추가된걸 알 수 있다. 이때 왼쪽(Python 3)를 선택하면 base 기본환경이 활성화 되고, 오른쪽에 (pandas)를 선택하면 pandas가상 환경이 실행된다.

 

아나콘다 프롬프트가 아닌 아나콘다 네비게이션에서 Jupyter Lab을 실행해도 됩니다.

 

주식관련 데이터가 필요할때 필요한 조치

먼저 가상환경으로 연결한다음

 

pip install pykrx이 라이브러리는 해당 시점에 네이버와 KRX 페이지에서 접근하여 주식 관련 데이터를 실시간에 가져옵니다. 실시간 스크래핑 방식이기에 대량의 데이터를 가져오는데는 다소 시간이 소요될 수 있습니다. 한 종목 또는 지수에 대해 20년치 정도의 데이터를 가져오는데 대략 1분 정도가 소요됩니다. 대량의 동일 데이터를 반복해서 사용하고자 하는 경우에는, 따로 저장해 두고 재사용하는 것이 효율적입니다.

아나콘다 프롬프트에서 설치 완료한 상태입니다.