본문 바로가기
728x90

전체 글74

[Visualization][Basic] Violin Plot(바이올린 플롯) Violin Plot은 데이터의 분포를 파악하고 싶을 때 사용하면 유용하다. 그래프는 Python의 내장 데이터인 excerise 데이터를 이용하고, 운동의 종류(kind)에 따른 심박수(pulse)의 분포를 파악해 볼 것이다. df = sns.load_dataset('exercise') df Seaborn 모듈을 활용한 Violin Plot import seaborn as sns sns.violinplot(df.kind, df.pulse) sns.violinplot(df.kind, df.pulse, palette = 'cool') palette 파라미터를 이용해서 분포의 색상을 변경할 수 있다. sns.violinplot('kind', 'pulse', hue = 'diet', data = df, pal.. 2021. 7. 14.
[Visualization][Basic] Pie Chart(원 그래프) Pie Chart는 파이 모양의 그래프로 범주별 비율을 비교할 때 유용한 그래프이다. matplotlib.pyplot 모듈을 이용하여 그래프를 그릴 것이므로 모듈을 선언하고, plt로 별칭을 붙여준다. import matplotlib.pyplot as plt ratio = [25, 10, 8, 22, 35] name =['Blue', 'Orange', 'Green', 'Red', 'Purple'] plt.pie(ratio, labels = name) plt.show() 기본 값만 사용하여 그래프를 그려도 예쁘게 나오지만, Pie Chart은 최대 단점은 그래프와 같이 정확한 값을 비교하기가 어렵다는 것이다. 따라서, 몇 가지 조건을 넣어 그래프를 보기 쉽게 그려보자. import matplotlib.py.. 2021. 7. 14.
[Statistics][Time Series Analysis] 2. 시계열 회귀분석 시계열 데이터는 일반적인 회귀 분석이 어렵다. → 회귀 분석은 기본적으로 서로 독립이라는 가정을 갖는데, 시계열 데이터는 이러한 자기 상관 기본 가정을 위배하기 때문이다. 추세를 이용한 회귀 분석 시계열 Zt는 추세만을 이용하여 아래와 같이 표현할 수 있다. Zt = TRt + Et Zt : 시점 t에서의 관측값 TRt : 시점 t에서의 추세 Et : 시점 t에서의 오차항 그림 (1)과 같이 TRt = B0 로 상수항을 가지면 추세가 없는 경우에 해당한다. 그럼 (2), (3)과 같이 TRt = B0 + B1t (B1 >0 or B1 2021. 7. 12.
[Statistics][Time Series Analysis] 1. 시계열 분석 기본 개념 시계열 데이터(Time series data) 특정한 개체의 자료를 시간이 지남에 따라 순차적으로 얻게 되는 데이터이다. 횡단면 데이터(Cross sectional data) 엑셀 자료와 같이 일반적으로 볼 수 있는 데이터 셋이다. 시계열 분석의 목적 기술(Description): 과거 자료를 이용하여 시도표를 작성하고, 시계열의 구성 요소를 확인하는 것으로 추세, 순환, 계절성, 특이점을 파악할 수 있다. * 시도표(Time Plot) : 시계열 자료를 그림으로 그리는 것으로 시계열의 특성을 파악할 수 있다. 예측 결과를 시도표로 작성할 시에는 신뢰 구간을 함께 표시한다. 2. 예측(Forecasting): 모형화를 통해 미래 시점의 값을 예측한다. 3. 설명(Explanation): 구축된 시계열 모.. 2021. 7. 12.
반응형