Python_Pandas_04-2(pivot_table, apply, cut, TODO문제)
pivot_table() 엑셀의 pivot table 기능을 제공하는 메소드. 분류별 집계(Group으로 묶어 집계)를 처리하는 함수로 group으로 묶고자 하는 컬럼들을 행과 열로 위치시키고 집계값을 값으로 보여준다. 역할은 groupby()를 이용한 집계와 같은데 여러개 컬럼을 기준으로 groupby 를 할 경우 집계결과를 읽는 것이 더 편하다.(가독성이 좋다) pivot() 함수와 역할이 다르다. pivot() 은 index와 column의 형태를 바꾸는 reshape 함수. DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, marg..
Python_Pandas_01-2(벡터화, Boolean 인덱싱, 주요 메소드, 정렬, (평균, 중앙값, 표준편차/분산, 최빈값, 분위수))
벡터화 (연산) - Pandas의 Series나 DataFrame은 연산을 하면 원소 단위로 연산을 한다. element-wise 연산 이라고도 한다. - Series/DataFrame과 값(scalar값)을 연산하면 각 원소들과 값을 연산한다. - Series끼리 또는 DataFrame끼리 연산을 하면 같은 위치의 원소끼리 연산을 한다. Index 이름이 (index가 아닌) 같은 원소끼리 연산한다. s1 = pd.Series([10, 100, 50, 30]) s2 = pd.Series([100, 5, 10, 300]) s1과 s2 연산 s1 + 20 # Series + 상수(Scalar) s1 - 100 # s1 > 50 s1 + s2 # Series끼리 연산 : 같은 index name의 원소끼리 ..