본문 바로가기

Skill Stacks132

8_Pandas - Series Pandas - Series View import pandas as pd pokemon_df = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]) pokemon_series = pokemon_df.squeeze("columns") pokemon_df 를 통해서 .squeeze() 를 하여, pokemon_series라는 series를 만들었다 하지만 pokemon_df와 pokemon_series는 독립적인 관계가 아니다 즉 pokemon_series에서, 값을 바꾸면, pokemon_df에 있는 값도 바뀌게 된다 pokemon_series[0] = "Changed" pokemon_series[0]를 "Changed"로 바꿨다 pokemon_df의 0번.. 2023. 4. 28.
7_Pandas - Series Pandas - Series Get을 사용해서 값을 찾기 get() 을 사용하면, 인덱스를 가지고 값을 찾을 수 있다 get() 을 사용하게 되면, 인덱스가 없으면, output을 아무것도 가지지 않는다 즉 None을 출력하는 것이다 import pandas as pd pokemon = pd.read_csv("./pandas/pokemon.csv", index_col="Pokemon").squeeze() pokemon.get(0) # Output : 'Grass' pokemon.get("Bulbasaur") # Output : 'Grass' pokemon.get([4, 10]) # Output # Pokemon # Charmeleon Fire # Metapod Bug # Name: Type, dtype:.. 2023. 4. 26.
6_Pandas - Series Pandas - Series 인덱스 또는 값 중에, 찾고자 하는 것이 있는지 확인 하는 것 원래 파이썬을 사용할 때에, 특정 값을 찾을 때 사용하는 'in'을 사용하면 된다 "car" in "racecar" output : True import pandas as pd pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=['Pokemon']).squeeze() pokemon.head() # output # 0 Bulbasaur # 1 Ivysaur # 2 Venusaur # 3 Charmander # 4 Charmeleon # Name: Pokemon, dtype: object "Bulbasaur" in pokemon # Output : False "Bulbas.. 2023. 4. 25.
5_Pandas - Series Pandas - Series Head and Tail head() 기본은, 제일 위에서 부터, 5개의 데이터를 불러와 주는 것이다 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 수 있다 import pandas as pd pokemon = pd.read_csv("./pandas/pokemon.csv", usecols=["Pokemon"]).squeeze() # 위에서부터 5개의 데이터 출력 pokemon.head() # 위에서부터 3개의 데이터 출력 pokemon.head(3) # 위에서부터 10개의 데이터 출력 pokemon.head(10) tail() 기본은, 제일 밑에서 부터, 5개의 데이터를 불러와 주는 것이다 괄호 안에, 데이터의 개수를 넣어, 원하는 만큼의 데이터를 불러올 .. 2023. 4. 24.
4_Pandas - Series Pandas - Series pd.read_csv csv 파일을 가져오는 함수이다 데이터를 코드로 만드는 것이 아니라, 이미 존재하는 데이터를 가지고 와서 사용하는 것이다 Comma Separate Value csv 파일은 1번째 행(Row)는 헤더, 즉 어떤 데이터가 있는지 표시해준다 그 밑의 행부터는 데이터가 들어간다 그리고 각 열은 ',' 쉼표로 구분 짓는다 pd.read_csv csv 외에도, 엑셀, html, json 등 많은 파일을 읽을 수 있다 pd.read_csv() 를 하게 되면, series가 아닌 dataframe을 가지고 온다 dataframe은 행과 열로 구성된 테이블을 뜻한다 .read_csv()에서 usecols를 통해서 하나의 열을 가지고 왔다 하지만, 주어진 output은 .. 2023. 4. 23.
3_Pandas - Series Pandas - Series Parameters and Argument 파라미터 (매개 변수)는, 기대되는 입력값에 부여하는 이름이다 메서드 또는 함수에 입력값을 받아드릴 수 있다 Argument는 함수 또는 메서드에 제공하는 실질적인 값을 나타낸다 def add(a, b): return a + b print(add(1, 6)) 여기서 def add(a, b): 에서 a와 b는 매개 변수다 add(1, 6)의 1과 6은 add라는 함수에 실질적으로 입력되는 값으로, argument라고 할 수 있다 즉 parameter를 지정하고, 지정한 parameter에 argument라는 실질적인 값을 넣어서 함수 또는 메서드를 실행한다 pd.Series(data = fruits, index = weekdays) 이.. 2023. 4. 22.
2_Pandas - Series Pandas - Series Methods (메서드) 객체에게 명령을 하는 것이다 메서드를 이용하여, 기존 값을 수정하거나, 기존 값을 토대로 새로운 값을 만들어 낸다 아래의 메서드들은 새로운 값을 출력해준다 .sum() : prices 안에 있는 값들을 모두 더하기 .product() : prices 안에 있는 값들을 모두 곱하기 .mean() : prices 안에 있는 값들의 평균값 구하기 .median() : prices 안에 있는 값들의 중간값 구하기 즉 위의 메서드들은 prices의 값들을 가지고, 새로운 값을 만들어내는 메서드들이다 Attributes (속성) 객체의 세부 사항이나 특성 등을 말하는 것이다 객체 자체를 설명하는 것이다 Series 안에 있는 값들에 대한 '정보'를 알려준다 .s.. 2023. 4. 21.
1_Pandas - Series Series는? 1차원이면서 라벨이 붙은 배열이다 하나의 열이라고 생각하면 된다 Series는 여러 가지의 데이터를 순서대로 저장하고, 요소의 위치를 정할 수 있다 (리스트와 같이) 딕셔너리에 key와 value가 있듯이, 값의 식별자 (key)를 할당할 수 있다 Series는 클래스다 (블루프린트) 리스트로 Series 만들기 저장한 ice_cream 들은 순서대로 Series로 저장되었다 Out[2]에서 숫자들은 인덱스다 (기본적으로 0부터 시작해서 1씩 더해준다) 인덱스는 사용자가 지정할 수 있다 지정하지 않을 경우, 값들을, 기본 인덱스로 지정한다 dtype가 숫자일 경우 int 로 나타날 것이다 dtype가 boolean일 경우 (True or False), bool 로 니타날 것이다 딕셔너리로.. 2023. 4. 20.
Python 좌표계 📋Python 좌표계 좌표계는 동근 지구를 2차원 평면에 투영하는 다양한 방법이다 주로 위도, 경도 (Latitude, Longitude)를 사용한다 대표적으로 ESPG:4326 / WGS84 이 있다 하지만, 한국에서 사용하는 특정 데이터에서, x와 y를 통해 위치를 찾는 것을 볼 수 있게 되었다 이것을 ESPG:5181 이고 카카오나 공공데이터포탈에서 자주 사용한다 개인적으로는 위도, 경도가 익숙해서, 공공데이터포탈에서 가지고 온 x,와 y 좌표를 위도와 경도로 변환하는 방법을 찾았다 아래는 pyproj 버전이 업데이트 하기 전이다 from pyproj import Proj, transform epsg5181= Proj(init="epsg:5181") wgs84=Proj(init='epsg:4.. 2023. 4. 19.