판다스 데이터 분석

    [머신러닝] 모델 신뢰도 향상을 위한 피처 스케일링 (Feature Scaling)

    이번 글도 머신러닝 모델의 신뢰도를 올리기 위한 방법에 대해 소개합니다. 다들 아시겠지만 산점도도 그렇고 아래의 글에서 시작됐습니다. 흐름을 보고 싶다면 한번 읽어보세요. [머신러닝] KNN으로 데이터 분류하기 (with Scikit-Learn) [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언 senti-mech.tistory.com 1. 피처 스케일링(Feature Scailing)이란? 오늘 소개할 것은 피처 스케일링 (Feature Scaling)입니다. 데이터의 독립변수(independent variab..

    [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용)

    Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 Competition을 열기도 합니다. 많은 데이터들이 올라와있고, 사람들이 그 분석방법을 공유합니다. 공공데이터 말고 재밌는 게 없을까 하고 찾다 발견했습니다. 한국에는 비슷한 사이트로 데이콘(Daycon)이 있습니다. Mechanical Gear Vibration Dataset Vibration of six gear types are measured under various working conditions www.kaggle.com 제가 오늘 사용할 데이터입니다. 기어의 진동 데이터이고, 문제가 발생했을 때의 값이 모두 적혀있습니다. 데이터 파일은 6개로 나뉩니다. 각각 Eccentricity,..