본문 바로가기

PANDAS16

4_Pandas - Series Pandas - Series pd.read_csv csv 파일을 가져오는 함수이다 데이터를 코드로 만드는 것이 아니라, 이미 존재하는 데이터를 가지고 와서 사용하는 것이다 Comma Separate Value csv 파일은 1번째 행(Row)는 헤더, 즉 어떤 데이터가 있는지 표시해준다 그 밑의 행부터는 데이터가 들어간다 그리고 각 열은 ',' 쉼표로 구분 짓는다 pd.read_csv csv 외에도, 엑셀, html, json 등 많은 파일을 읽을 수 있다 pd.read_csv() 를 하게 되면, series가 아닌 dataframe을 가지고 온다 dataframe은 행과 열로 구성된 테이블을 뜻한다 .read_csv()에서 usecols를 통해서 하나의 열을 가지고 왔다 하지만, 주어진 output은 .. 2023. 4. 23.
3_Pandas - Series Pandas - Series Parameters and Argument 파라미터 (매개 변수)는, 기대되는 입력값에 부여하는 이름이다 메서드 또는 함수에 입력값을 받아드릴 수 있다 Argument는 함수 또는 메서드에 제공하는 실질적인 값을 나타낸다 def add(a, b): return a + b print(add(1, 6)) 여기서 def add(a, b): 에서 a와 b는 매개 변수다 add(1, 6)의 1과 6은 add라는 함수에 실질적으로 입력되는 값으로, argument라고 할 수 있다 즉 parameter를 지정하고, 지정한 parameter에 argument라는 실질적인 값을 넣어서 함수 또는 메서드를 실행한다 pd.Series(data = fruits, index = weekdays) 이.. 2023. 4. 22.
2_Pandas - Series Pandas - Series Methods (메서드) 객체에게 명령을 하는 것이다 메서드를 이용하여, 기존 값을 수정하거나, 기존 값을 토대로 새로운 값을 만들어 낸다 아래의 메서드들은 새로운 값을 출력해준다 .sum() : prices 안에 있는 값들을 모두 더하기 .product() : prices 안에 있는 값들을 모두 곱하기 .mean() : prices 안에 있는 값들의 평균값 구하기 .median() : prices 안에 있는 값들의 중간값 구하기 즉 위의 메서드들은 prices의 값들을 가지고, 새로운 값을 만들어내는 메서드들이다 Attributes (속성) 객체의 세부 사항이나 특성 등을 말하는 것이다 객체 자체를 설명하는 것이다 Series 안에 있는 값들에 대한 '정보'를 알려준다 .s.. 2023. 4. 21.
1_Pandas - Series Series는? 1차원이면서 라벨이 붙은 배열이다 하나의 열이라고 생각하면 된다 Series는 여러 가지의 데이터를 순서대로 저장하고, 요소의 위치를 정할 수 있다 (리스트와 같이) 딕셔너리에 key와 value가 있듯이, 값의 식별자 (key)를 할당할 수 있다 Series는 클래스다 (블루프린트) 리스트로 Series 만들기 저장한 ice_cream 들은 순서대로 Series로 저장되었다 Out[2]에서 숫자들은 인덱스다 (기본적으로 0부터 시작해서 1씩 더해준다) 인덱스는 사용자가 지정할 수 있다 지정하지 않을 경우, 값들을, 기본 인덱스로 지정한다 dtype가 숫자일 경우 int 로 나타날 것이다 dtype가 boolean일 경우 (True or False), bool 로 니타날 것이다 딕셔너리로.. 2023. 4. 20.
데이터 분석 - Pandas 데이터 분석 - Pandas 파이썬의 라이브러리다 Pandas는 데이터 분석, 필터링, 조작, 집계, 병합, 피벗 등을 할 수 있다 데이터를 가공하거나 분석을 할 때에 Pandas를 사용하는게 좋다 엑셀보다 더 강력하다 (즉 더 많은 데이터를 다룰 수 있다) 아나콘다란? 오늘 인턴으로 첫 출근을 했는데, 아나콘다 라는 것을 다운로드 받았다 웹 풀 스택 개발을 했지만, 데이터 분석 파트 인턴으로 입사를 했고, 아나콘다는 처음 보게 되었다 아나콘다는 머신러닝이나 데이터 분석을 할 때에, 필요한 여러가지 패키지가 기본적으로 포함되어 있는 파이썬 배포판이다 사수님이 가상 환경을 구축할 때에도 아나콘다를 사용한다고 했다 기존에는 venv를 사용하며 패키지 하나하나 추가로 설치를 했다 하지만 아나콘다를 사용하며 따.. 2023. 4. 10.
Udemy : Python 리스트와 딕셔너리 컴프리헨션 Udemy : Python 리스트와 딕셔너리 컴프리헨션 리스트 컴프리헨션 (List Comprehension) 원래 사용했던 코드 numbers = [1,2,3] new_list = [] for n in numbers: add_1 = n + 1 new_list.append(add_1) print(new_list) # output : [2,3,4] 리스트 컴프리헨션 new_list = [new_item for item in list] numbers = [1,2,3] new_list = [n + 1 for n in numbers] print(new_list) # output : [2,3,4] if문 추가하기 new_list = [new_item for item in list if test] 뒤에다가 if문을.. 2023. 1. 25.
Udemy : Python CSV 데이터와 Pandas Udemy : Python CSV 데이터와 Pandas CSV (Comma Separated Values) 표로 나타낼 수 있는 데이터들을 뜻한다 엑셀 같이 각 열은 데이터를 뜻 하는데, , 를 통해서 데이터를 나눈다 CSV 데이터 읽기 csv 라이브러리를 import 한다 csv.reader()를 사용해서, 각 열의 데이터를 가지고 온다 for문으로 순회를 하며, 각 열의 데이터를 볼 수 있다 , csv.reader()를 사용해서 데이터를 끌어왔을 때 그 밑에는 for문으로 을 순회하며, 각 열의 데이터를 출력한 것이다 Pandas https://pandas.pydata.org/docs/reference/index.html 파이썬 데이터 분석 라이브러리다 표로 나타난 데이터들을 분석하는데 매우 유용하다.. 2023. 1. 25.