파이썬 > Pandas 4

데이터 시각화 - 그래프 종류와 해석

seaborn 에서 제공하는 데이터를 가지고 여러 그래프를 그려보았다.  Joint Plot목적: 두 변수 간의 관계를 시각화하는 데 사용됩니다. 주로 2D 공간에서 두 변수의 분포와 관계를 동시에 보여줍니다.구성: 중심에는 두 변수의 산점도가 있고, 양쪽에는 각 변수의 일변량 분포(히스토그램, 커널 밀도 추정 등)가 나타납니다. 회귀선, KDE plot, 히스토그램 등 다양한 옵션을 추가할 수 있습니다.사용 예시: sns.jointplot(x="x_variable", y="y_variable", data=data)데이터 set: 팁가격  대각선 실선의 주변으로 파란 영역은 분포 범위 이다. 실선에서 데이터들이 얼마나 많이 흩어져 있는가를 보여준다.   Pair Plot목적: 여러 변수 간의 쌍(pair..

파이썬 > Pandas 2024.08.28

파이썬에서 생성자란

생성자로 객체를 만든다.. -> 무슨말일까... 궁금하신 분들을 위한 글.  생성자(Constructor)는 객체 지향 프로그래밍에서 클래스로부터 객체가 생성될 때 자동으로 호출되는 특별한 종류의 메소드(함수)입니다. 생성자의 주된 목적은 객체가 생성될 때 그 객체의 데이터를 초기화하는 것이며, 필요한 자원을 할당하거나 초기 상태를 설정하는 등의 작업을 수행합니다. 라고 정의되었는데, 잘 모르겠면. 저의 언어로 다시 설명.. 정의된 클래스를 붕어빵틀이라고 합시다. 난 먹을 붕어빵을 여러개를 만들어서, 팥, 슈크림, 초코를 넣을 예정입니다.틀을 사용하면 붕어빵을 여러개 만들 수 있습니다. 붕어빵 여러개는 이렇게 만들어요.  코드로 본다면,//일단 붕어빵틀이라는 클래스를 만든다class 붕어빵틀:    st..

파이썬 > Pandas 2024.07.19

Pandas DataFrame 만들고 연산하기 (2) - 맥, 주피터 사용

데이터 프레임 통계 데이터 프레임의 값의 통계치를 확인하거나 통계를 내기위해 임의 값으로 데이터를 부분 치환하는 연산들(전처리라고 한다)을 나열해보았다.   ** 참고 interactiveshell 을 import 하면, print 문 없이 데이터 프레임이 나온다고 함.  info()전체 내용, 아래와 같이 보여줌 describe()통계치 보여줌 sort_index()axis =0 은 행을 기준으로 정렬, 가로 한줄의 인덱스가 통으로 움직임 즉 인덱스가 정렬됨..ascending = false : 내림차순, 즉, 큰 수 부터 정렬 *axis 참고 내용 (sum () 에서는 반대로 쓰이는것 같다.)Pandas에서 axis 매개변수는 데이터를 처리할 때 행과 열을 기준으로 작업을 수행하는 방향을 지정하는 데..

파이썬 > Pandas 2024.07.17

Pandas DataFrame 만들고 연산하기 (1) - 맥, 주피터 사용

PANDAS 의 데이터는 어떻게 정의할까?다음 두 데이터 형태를 사용하여 데이터를 정의하고 각데이터를 연산함 시리즈어떤 항목에 대한 값들의 묶음. 정확한 정의는 Numpy 기능을 기반으로 만든 Wrapper 패키지로 벡터라이징이 가능하도록 만든 판다스의 모듈이다. 예를 들어, 이름 : 김연아, 송혜교, 김태희 ..... 데이터 프레임이런 시리즈 들의 묶음, 각 시리즈들은 인덱스를 공유함예를 들어,   시리즈 1 -> 이름 : 김연아, 송혜교, 이효리시리즈 2 -> 직업:  피겨선수, 배우, 가수두개를 붙여서 데이터 프레임.예를 또 들어,시리즈 1 : 국어 성적국어9090100시리즈 2 : 수학 성적수학8090100공통 특징은 '중간고사 성적' -> 인덱스로 정한다.  인덱스 여러개 붙이면 데이터 프레임이..

파이썬 > Pandas 2024.07.17