파이썬 판다스

    [Python] 산점도 (Scatter Plot) 그리기

    [Python] KNN으로 데이터 분류하기 (with Scikit-Learn) [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언 senti-mech.tistory.com 지난 글에서 나는 다짜고짜 KNN을 이용하였다. 그 결과, 신뢰도가 50%라는 도박성 짙은 모델이 만들어졌다. 데이터가 잘못됐거나, KNN이 데이터에 맞지 않는 모델일 수 있다. 그걸 알기 위해서 산점도(Scatter Plot)를 찍어 데이터의 분포를 먼저 알아보자. 1. 기존에 알던 방법 : df.plot() import pandas as pd..

    [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기

    [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 Competition을 열기도 합니다. 많은 데이터들이 올라와있고, 사람들이 그 분석방법을 공유합니 senti-mech.tistory.com 위 글에서 소개한 데이터를 머신러닝으로 분류하기 앞서, 각 파일로 나뉘어져있는 데이터를 하나로 합쳐보자. 나는 데이터가 담긴 총 6개의 파일이 있고, 각 파일의 Column Head는 모두 동일하다. 이 데이터들에서 조건에 맞는 데이터들만 꺼내어 하나로 합칠 예정이다. 1. 폴더 내 csv 파일 모두 읽어오기 import pandas a..

    [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용)

    Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 Competition을 열기도 합니다. 많은 데이터들이 올라와있고, 사람들이 그 분석방법을 공유합니다. 공공데이터 말고 재밌는 게 없을까 하고 찾다 발견했습니다. 한국에는 비슷한 사이트로 데이콘(Daycon)이 있습니다. Mechanical Gear Vibration Dataset Vibration of six gear types are measured under various working conditions www.kaggle.com 제가 오늘 사용할 데이터입니다. 기어의 진동 데이터이고, 문제가 발생했을 때의 값이 모두 적혀있습니다. 데이터 파일은 6개로 나뉩니다. 각각 Eccentricity,..

    [Pandas] 4. Dataframe으로 그래프 그리기 (재료역학 문제 활용)

    2학년 과목인 고체역학을 재수강 중인데, 마침 데이터로 그래프 그리는 문제가 나왔습니다. 파이썬을 활용해서 그려봅시다. 1. 엑셀에 데이터 입력 후 불러오기 문제의 데이터입니다. 이걸 토대로 물질이 Brittle 한지 Ductile 한지 판별하랍니다. 주피터로 직접 입력하면 머리 아프니까, 엑셀로 작성한 다음에 불러옵시다. 저는 Stress-strain.xlsx 라고 저장했습니다. import pandas as pd df=pd.read_excel('Stress-strain.xlsx') df 잘 나옵니다. 사진이 길어서 아래는 생략했습니다. 2. plot() 을 이용해 그래프 그리기 df.plot() 점과 점 사이는 직선으로 이은 듯 합니다. y축은 잘 나왔는데 x축이 인덱스로 보입니다. x축을 strai..