파이썬 머신러닝

    [Python] 산점도 (Scatter Plot) 그리기

    [Python] KNN으로 데이터 분류하기 (with Scikit-Learn) [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언 senti-mech.tistory.com 지난 글에서 나는 다짜고짜 KNN을 이용하였다. 그 결과, 신뢰도가 50%라는 도박성 짙은 모델이 만들어졌다. 데이터가 잘못됐거나, KNN이 데이터에 맞지 않는 모델일 수 있다. 그걸 알기 위해서 산점도(Scatter Plot)를 찍어 데이터의 분포를 먼저 알아보자. 1. 기존에 알던 방법 : df.plot() import pandas as pd..

    [머신러닝] KNN으로 데이터 분류하기 (with Scikit-Learn)

    [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 senti-mech.tistory.com 앞선 글에서 각 Defection 별로 나뉘어져있던 변위 데이터를 한 곳으로 모았다. 이 데이터를 이용하면 새로운 값을 넣었을 때, 그 것이 어떤 Defection인지 예측하는데 도움이 될 수 있다. 하지만 Defection 당 데이터가 150,000개다. 너무 많다. 그래서 나는 머신러닝을 사용해보기로 했다. 머신러닝 분류 모델에는 여러가지가 있다. 나이브 베이즈, De..