나는 용이 맞을까?
[근황] 4개월 만에 돌아온 블로그 - 1. 4학년 1학기 종합
블로그에 4개월만에 돌아왔습니다. 제 생각도 정리할 겸 근황을 적습니다.1. 4학년 1학기에는 무엇을 배웠나 a. 냉동공조설계 기존에 배운 열역학, 열전달을 기반으로 공조시스템 설계에 대한 내용을 배웠으며, 학교 건물 한 층의 공조시스템을 설계하는 팀프로젝트로 마무리 됩니다. 8주간의 이론 수업, 8주 간의 프로젝트 기간이 주어졌습니다. 가장 시간을 많이 투자한 만큼 배운 것도 많습니다. 하지만 이 내용을 블로그에 모두 적으려니 양이 너무 방대합니다. 발표 시에 사용한 PPT가 추리고 추려도 100장을 넘길 정도입니다. 다음에 기회가 되면 작성하겠습니다. b. 신소재응용구조설계 학부 과정에서 배우는 대부분의 고체는 등방성(Isotropic)을 가정합니다. 계산이 용이하고, 실제로 금속을 많이 기..
[머신러닝] 모델 신뢰도 향상을 위한 피처 스케일링 (Feature Scaling)
이번 글도 머신러닝 모델의 신뢰도를 올리기 위한 방법에 대해 소개합니다. 다들 아시겠지만 산점도도 그렇고 아래의 글에서 시작됐습니다. 흐름을 보고 싶다면 한번 읽어보세요. [머신러닝] KNN으로 데이터 분류하기 (with Scikit-Learn) [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언 senti-mech.tistory.com 1. 피처 스케일링(Feature Scailing)이란? 오늘 소개할 것은 피처 스케일링 (Feature Scaling)입니다. 데이터의 독립변수(independent variab..
[Python] 산점도 (Scatter Plot) 그리기
[Python] KNN으로 데이터 분류하기 (with Scikit-Learn) [Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언 senti-mech.tistory.com 지난 글에서 나는 다짜고짜 KNN을 이용하였다. 그 결과, 신뢰도가 50%라는 도박성 짙은 모델이 만들어졌다. 데이터가 잘못됐거나, KNN이 데이터에 맞지 않는 모델일 수 있다. 그걸 알기 위해서 산점도(Scatter Plot)를 찍어 데이터의 분포를 먼저 알아보자. 1. 기존에 알던 방법 : df.plot() import pandas as pd..
[머신러닝] KNN으로 데이터 분류하기 (with Scikit-Learn)
[Pandas] 6. 폴더 내 여러 데이터 프레임(파일) 합치기 [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용) Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 senti-mech.tistory.com 앞선 글에서 각 Defection 별로 나뉘어져있던 변위 데이터를 한 곳으로 모았다. 이 데이터를 이용하면 새로운 값을 넣었을 때, 그 것이 어떤 Defection인지 예측하는데 도움이 될 수 있다. 하지만 Defection 당 데이터가 150,000개다. 너무 많다. 그래서 나는 머신러닝을 사용해보기로 했다. 머신러닝 분류 모델에는 여러가지가 있다. 나이브 베이즈, De..