PYTHON

[빅데이터 분석] 2021.12.20 Titanic

죠으니 2021. 12. 20. 18:18

오늘 팀끼리 퀴즈를 풀었다. 상대팀이 한번도 틀리지 않고 다 풀어서 우리는 풀지도 못하고 떨어졌다..ㅠㅠ

열심히 공부해서 아는 문제였는데 우리가 주춤하는 동안 상대팀이 먼저 한다고 손을 들었다

괜찮아 시험은 보면 되징 시험보면 공부한게 더 기억에 잘 남고 좋아,,

괜찮아..난...ㅠㅠ

근데 퀴즈를 푸니깐 복습도 되고 머리에 잘 들어오는 것 같아서 좋았당 굿굿

근데 수업 듣다가 내가 필기해놓은게 다 사라져버렸다..ㅠㅠㅠ

괜찮아,,다시 보면서 모르는거 인터넷에 찾아보면 되지..후..

그래도 재밌어서 좋당!

 

 

 

<101 Pandas Tips for Beginners_Titanic>

size() = 빈도수, 개체 수, 갯수

matplotlib.pyplot 모듈의 각각의 함수를 사용해서 간편하게 그래프를 만들고 변화를 줄 수 있다.

▶test = pd.read_csv('data_titanic/test.csv')
   train = pd.read_csv('data_titanic/train.csv')

▶null 값의 갯수를 알고 싶으면 info, isnull 쓰기

   train.info()  /  train.isnull()

▶train.isnull().any() #null이 있나없나를 보는 것. 출력하면 True, False 이렇게 나옴

▶train.isnull().sum() null 갯수

▶train.sort_values(['Fare', 'Survived', 'Pclass'], ascending=[True, False, False])

이렇게 다 다르게 줄 수도 있다.

▶train.sort_values(by=['Pclass'])

pclass 기준으로 오름차순이다.

▶Reindex

☞ 새로운 색인에 맞도록 객체를 새로 생성하는 기능. index는 변경할 수 없음. 변경을 위해서는 reindex 사용

▶sorted(train.columns) #알파벳 순으로 칼럼이 정렬됨

☞ train.reindex(sorted(train.columns), axis=1)