본문 바로가기
Skill Stacks/데이터분석_Python

5_Pandas - Series

by JayAlex07 2023. 4. 24.

Pandas - Series

 

Head and Tail

 

head()

  • 기본은, 제일 위에서 부터, 5개의 데이터를 불러와 주는 것이다
  • 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 수 있다
import pandas as pd

pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]).squeeze()

# 위에서부터 5개의 데이터 출력
pokemon.head()

# 위에서부터 3개의 데이터 출력
pokemon.head(3)

# 위에서부터 10개의 데이터 출력
pokemon.head(10)

 

tail()

  • 기본은, 제일 밑에서 부터, 5개의 데이터를 불러와 주는 것이다
  • 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 수 있다
  •  
import pandas as pd

google = pd.read_csv("./pandas/google_stock_price.csv", usecols=["Stock Price"]).squeeze()

# 밑에서부터 5개의 데이터 출력
pokemon.tail()

# 밑에서부터 3개의 데이터 출력
pokemon.tail(3)

# 밑에서부터 10개의 데이터 출력
pokemon.tail(10)

 

 

 

Copy vs View

Copy 는 데이터를 완전히 복제하고, 복제한 데이터는 원본과 같지만, 독립적이다

A를 copy 하여, B를 만들었다

  • B를 수정한다고 A가 수정되지 않는다 (즉 처음에 A와 B의 데이터는 같지만, A와 B는 각각 독립적으로 행동을 한다)

View 는 데이터 중에 특정 데이터를 보거나, 데이터 자체를 보는 것이다

  • A에서 B를 만드는 것이 아닌, A 안에 있는 데이터를 읽는 것

 

 

 

Pandas에서 사용이 가능한 파이썬 함수

import pandas as pd

pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]).squeeze()

len(pokemon)        # pokemon의 데이터의 개수를 출력
# output : 721

type(pokemon)        # pokemon의 데이터 타입을 출력
# output : pandas.core.series.Series

dir(pokemon)        # pokemon에 사용할 수 있는 메서드 또는 함수 출력

sorted(pokemon)        # pokemon 데이터를 오름차순으로 정렬 (알파벳 또는 숫자), 리스트로 반환해준다

list(pokemon)        # pokemon을 리스트로 반환

dict(pokemon)        # pokemon을 딕셔너리로 반환

max(pokemon)        # 숫자는, 제일 큰 수를 출력, 문자는, 오름차순으로 정렬되었을 때, 마지막 단어 출력
# output : 'Zygarde'

min(pokemon)        # 숫자는, 제일 작은 수를 출력, 문자는, 오름차순으로 정렬되었을 때, 처음 단어 출력
# output : 'Abomasnow'

 

 

sort_values

 

sorted() 을 사용하면, series를 리스트로 반환해준다

 

반대로 그대로 series를 사용하되, 값들을 정렬하고 싶으면 sort_values()를 사용하면 된다

 

import pandas as pd

pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]).squeeze()

pokemon.sort_values()
# series를 반환하되, 값들을 오름차순으로 정렬한다

pokemon.sort_values(ascending=False)
# series를 반환하되, 값들을 내림차순으로 정렬한다

 

 

sort_index

 

인덱스를 정렬하고 싶을때 사용하는 메서드다

 

import pandas as pd

pokemon = pd.read_csv("./pandas/pokemon.csv", index_col="Pokemon").squeeze()

pokemon.sort_index(ascending=False)
  • index_col : 인덱스 행을 Pokemon으로 설정해준다
    • pokemon.csv 에는 Pokemon과 Type 행이 있어, 자연스럽게 Pokemon이 인덱스, Type이 값이 된다
  • sort_index : 오름차순으로 인덱스를 정렬해준다
    • sort_index(ascending=False) : 내림차순으로 인덱스를 정렬해준다

'Skill Stacks > 데이터분석_Python' 카테고리의 다른 글

7_Pandas - Series  (0) 2023.04.26
6_Pandas - Series  (0) 2023.04.25
4_Pandas - Series  (0) 2023.04.23
3_Pandas - Series  (0) 2023.04.22
2_Pandas - Series  (0) 2023.04.21