본문 바로가기

dataframe4

13_Pandas - DataFrame Pandas - DataFrame sort_values 메서드 선택한 행을 정렬해주는 것이다 기본으로는 오름차순으로 정렬된다 NaN은 기본으로 제일 밑에 놓인다 by = "" : 정렬을 할 행의 이름을 넣는다 ascending : 오름차순 또는 내림차순을 결정한다 na_position : NaN 이 어느 위치에 출력이 될지 정해준다 Salary 행을 보면 NaN이 모두 위쪽에 위치한 것을 볼 수 있다 default는 제일 아래에 위치하는 것이다 복수의 행 정렬시키기 nba.sort_values(by = ["Team", "Name"], ascending = [True, False]) by 에 정렬할 행을 순서대로 넣고, ascending에 오름차순 또는 내림차순인지 지정한다 ascending은 꼭 안 해도.. 2023. 5. 4.
12_Pandas - DataFrame Pandas - DataFrame 빈칸, NaN 안에 값을 직접 넣기 .fillna() .fillna() 를 사용하고, argument를 넣어주면, 위에 DataFrame의 NaN이 argument로 들어간 값을 출력하는 것을 볼 수 있다 특정 행에 NaN 대신 값을 넣고 싶을 때 행을 인덱스로 가지고 오고 .fillna() 를 사용한다 이렇게 하면, series로 반환해서, series 안에 있는 NaN을, 입력한 값으로 바꿔준다 하지만 위와 같이 할 경우, DataFrame에는 NaN를 특정 값으로 바꾼 것이 적용이 안 되었다 4번 열의 College 행을 보면 NaN을 볼 수 있다 nba["College"] = nba["College"].fillna("Unknown") # nba["College"].. 2023. 5. 3.
11_Pandas - DataFrame Pandas - DataFrame DataFrame 에서 2개 이상의 행 선택하기 '[]' 안에 행의 이름/인덱스 를 넣으면, Series를 반환하는 것을 알 수 있다 '[]' 안에 리스트를 넣으면, 새로운 DataFrame을 만들어 준다 nba[] 안에 ["Name", "Number", "Team"] 을 넣어주었더니, 해당 행에 대한 값들을 DataFrame으로 출력해주었다 리스트 안의 행의 이름은, 순서대로 안 넣어도 된다 단, 리스트 안에 행의 이름 순으로, 값들이 출력된다 DataFrame에 추가 행을 넣기 19번째 줄 : nba["League"] = "National Basketball Association" DataFrame의 행들 중, 제일 마지막에 League라는 행 이름으로 Nationa.. 2023. 5. 2.
10_Pandas - DataFrame Pandas - DataFrame DataFrame 이란? 2D 의 자료 구조다 / 테이블이라고 생각하면 된다 즉 행과 열로 데이터가 이루어져 있다 DataFrame Methods and Attributes import pandas as pd nba = pd.read_csv("nba.csv") nba.head() # 테이블 제일 위의 5개의 열을 출력해준다 # 5개가 기본이고 argument에 위에서 몇 개를 출력할지 지정할 수 있다 nba.tail() # 테이블 제일 아래의 5개의 열을 출력해준다 # 5개가 기본이고 argument에 위에서 몇 개를 출력할지 지정할 수 있다 nba.index # output : RangeIndex(start=0, stop=458, step=1) nba.shape # o.. 2023. 5. 1.