본문 바로가기
Skill Stacks/데이터분석_Python

데이터 분석 - Pandas

by JayAlex07 2023. 4. 10.

데이터 분석 - Pandas

 

파이썬의 라이브러리다

Pandas는 데이터 분석, 필터링, 조작, 집계, 병합, 피벗 등을 할 수 있다

  • 데이터를 가공하거나 분석을 할 때에 Pandas를 사용하는게 좋다

엑셀보다 더 강력하다 (즉 더 많은 데이터를 다룰 수 있다)

 


 

아나콘다란?

오늘 인턴으로 첫 출근을 했는데, 아나콘다 라는 것을 다운로드 받았다

웹 풀 스택 개발을 했지만, 데이터 분석 파트 인턴으로 입사를 했고, 아나콘다는 처음 보게 되었다

아나콘다는 머신러닝이나 데이터 분석을 할 때에, 필요한 여러가지 패키지가 기본적으로 포함되어 있는 파이썬 배포판이다

  • 사수님이 가상 환경을 구축할 때에도 아나콘다를 사용한다고 했다

 

기존에는 venv를 사용하며 패키지 하나하나 추가로 설치를 했다

  • 하지만 아나콘다를 사용하며 따로 가상환경을 설치하며, 데이터 분석을 위해 필요한 패키지를 자동적으로 가지고 올 수 있다

 

conda라는 환경 관리자가 있다

  • 같은 컴퓨터에 2개의 다른 프로젝트를 한다
    • 하나는 파이썬 3.8 버전을 사용하고 | 다른 하나는 3.5를 사용한다
  • 이렇게 다른 버전들을 각각 사용하기 위해 conda에서 가상환경을 만들어서 2개의 다른 프로젝트를 할 수 있도록 한다
  • 'base' environment를 만들게 된다

 

conda info --envs
# 콘다의 가상환경에 대한 정보

conda update conda
# 콘다를 업데이트 하기

conda create --name pandas_playground
# 가상환경을 만드는 것, pandas_playground 라는 가상환경을 생성

conda activate pandas_playground
# 가상환경 시작

 


 

Jupyter Notebook

코드와, 결과물 (테이블)을 한꺼번에 볼 수 있다

  • IDE와는 다르다

 


 

아나콘다를 통해서 Jupyter Notebook 열기

 

아나콘다 프롬프트 (Anaconda Prompt)에 들어간다

 

conda install pandas
# 판다 설치

conda install pandas jupyter bottleneck numexpr matplotlib
# 판다 외에 jupyter, bottleneck, numexpr, matplotlib 라이브러들을 한번에 다운로드 하기

conda update --all
# 모든 라이브러리들을 업데이트하기

jupyter notebook
# 웹 브라우저를 연다

'Skill Stacks > 데이터분석_Python' 카테고리의 다른 글

4_Pandas - Series  (0) 2023.04.23
3_Pandas - Series  (0) 2023.04.22
2_Pandas - Series  (0) 2023.04.21
1_Pandas - Series  (0) 2023.04.20
데이터 분석 - PyTorch  (0) 2023.04.10