본문 바로가기

series7

9_Pandas - Series Pandas - Series apply() series에 있는 모든 값에 함수를 넣어서, 새로운 값을 만드는 것이다 여기서 len은 문자열의 길이, 또는 리스트의 길이를 알고 싶을 때 사용하는 함수이다 위에 같은 경우, pokemon 에 있는 모든 종류의 문자열의 길이를 출력해준다 Grass 같은 경우, 문자열의 길이가 5고, Fire 같은 경우 4이다 따로 함수를 만들어서 apply() 에 argument로 넣어서 사용할 수 있다 rank_pokemon()에 parameter가 있지만 apply()에서는 각각의 값들을 rank_pokemon()의 argument로 자동으로 넣어준다 map() apply()는 함수를 받아온다면, map()은 객체(예. 딕셔너리)를 받는다 그 외에도 series를 map(.. 2023. 4. 29.
8_Pandas - Series Pandas - Series View import pandas as pd pokemon_df = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]) pokemon_series = pokemon_df.squeeze("columns") pokemon_df 를 통해서 .squeeze() 를 하여, pokemon_series라는 series를 만들었다 하지만 pokemon_df와 pokemon_series는 독립적인 관계가 아니다 즉 pokemon_series에서, 값을 바꾸면, pokemon_df에 있는 값도 바뀌게 된다 pokemon_series[0] = "Changed" pokemon_series[0]를 "Changed"로 바꿨다 pokemon_df의 0번.. 2023. 4. 28.
7_Pandas - Series Pandas - Series Get을 사용해서 값을 찾기 get() 을 사용하면, 인덱스를 가지고 값을 찾을 수 있다 get() 을 사용하게 되면, 인덱스가 없으면, output을 아무것도 가지지 않는다 즉 None을 출력하는 것이다 import pandas as pd pokemon = pd.read_csv("./pandas/pokemon.csv", index_col="Pokemon").squeeze() pokemon.get(0) # Output : 'Grass' pokemon.get("Bulbasaur") # Output : 'Grass' pokemon.get([4, 10]) # Output # Pokemon # Charmeleon Fire # Metapod Bug # Name: Type, dtype:.. 2023. 4. 26.
5_Pandas - Series Pandas - Series Head and Tail head() 기본은, 제일 위에서 부터, 5개의 데이터를 불러와 주는 것이다 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 수 있다 import pandas as pd pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]).squeeze() # 위에서부터 5개의 데이터 출력 pokemon.head() # 위에서부터 3개의 데이터 출력 pokemon.head(3) # 위에서부터 10개의 데이터 출력 pokemon.head(10) tail() 기본은, 제일 밑에서 부터, 5개의 데이터를 불러와 주는 것이다 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 .. 2023. 4. 24.
4_Pandas - Series Pandas - Series pd.read_csv csv 파일을 가져오는 함수이다 데이터를 코드로 만드는 것이 아니라, 이미 존재하는 데이터를 가지고 와서 사용하는 것이다 Comma Separate Value csv 파일은 1번째 행(Row)는 헤더, 즉 어떤 데이터가 있는지 표시해준다 그 밑의 행부터는 데이터가 들어간다 그리고 각 열은 ',' 쉼표로 구분 짓는다 pd.read_csv csv 외에도, 엑셀, html, json 등 많은 파일을 읽을 수 있다 pd.read_csv() 를 하게 되면, series가 아닌 dataframe을 가지고 온다 dataframe은 행과 열로 구성된 테이블을 뜻한다 .read_csv()에서 usecols를 통해서 하나의 열을 가지고 왔다 하지만, 주어진 output은 .. 2023. 4. 23.
3_Pandas - Series Pandas - Series Parameters and Argument 파라미터 (매개 변수)는, 기대되는 입력값에 부여하는 이름이다 메서드 또는 함수에 입력값을 받아드릴 수 있다 Argument는 함수 또는 메서드에 제공하는 실질적인 값을 나타낸다 def add(a, b): return a + b print(add(1, 6)) 여기서 def add(a, b): 에서 a와 b는 매개 변수다 add(1, 6)의 1과 6은 add라는 함수에 실질적으로 입력되는 값으로, argument라고 할 수 있다 즉 parameter를 지정하고, 지정한 parameter에 argument라는 실질적인 값을 넣어서 함수 또는 메서드를 실행한다 pd.Series(data = fruits, index = weekdays) 이.. 2023. 4. 22.
1_Pandas - Series Series는? 1차원이면서 라벨이 붙은 배열이다 하나의 열이라고 생각하면 된다 Series는 여러 가지의 데이터를 순서대로 저장하고, 요소의 위치를 정할 수 있다 (리스트와 같이) 딕셔너리에 key와 value가 있듯이, 값의 식별자 (key)를 할당할 수 있다 Series는 클래스다 (블루프린트) 리스트로 Series 만들기 저장한 ice_cream 들은 순서대로 Series로 저장되었다 Out[2]에서 숫자들은 인덱스다 (기본적으로 0부터 시작해서 1씩 더해준다) 인덱스는 사용자가 지정할 수 있다 지정하지 않을 경우, 값들을, 기본 인덱스로 지정한다 dtype가 숫자일 경우 int 로 나타날 것이다 dtype가 boolean일 경우 (True or False), bool 로 니타날 것이다 딕셔너리로.. 2023. 4. 20.