pandas

    [Pandas] 5. 조건에 맞춰 데이터 추출하고 수정하기 (Kaggle 에서 가져온 Gear Defection 데이터 이용)

    Kaggle 이라는 사이트가 있습니다. 데이터 사이언스 커뮤니티입니다. 유명한 IT 기업들이 데이터 분석 Competition을 열기도 합니다. 많은 데이터들이 올라와있고, 사람들이 그 분석방법을 공유합니다. 공공데이터 말고 재밌는 게 없을까 하고 찾다 발견했습니다. 한국에는 비슷한 사이트로 데이콘(Daycon)이 있습니다. Mechanical Gear Vibration Dataset Vibration of six gear types are measured under various working conditions www.kaggle.com 제가 오늘 사용할 데이터입니다. 기어의 진동 데이터이고, 문제가 발생했을 때의 값이 모두 적혀있습니다. 데이터 파일은 6개로 나뉩니다. 각각 Eccentricity,..

    [Pandas] 3. Dataframe과 Series 정보 확인

    이제 정말 약간이나마 데이터 분석으로 가까워집니다. 1. Dataframe 정보 확인 a. df.describe() import pandas as pd data = { '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'], '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'], '키' : [197, 184, 168, 187, 188, 202, 188, 190], '국어' : [90, 40, 80, 40, 15, 80, 55, 100], '영어' : [85, 35, 75, 60, 20, 100, 65, 85], '수학' : [100, 50, 70, 70, 10, 95, 45, 90], ..

    [Pandas] 1. 기본 자료구조와 Dataframe 확인, 생성, 수정

    이번 글에서는 Pandas 에서 사용하는 자료구조인 Dataframe, 그 기반인 Series, 구성요소인 Index, Column, Value 에 대해 설명하고 이를 확인/생성/수정하는 법에 대해 이야기합니다. *본 글은 위 영상을 참고합니다. 0. Dataframe 과 Series Pandas에서는 Dataframe 라는 자료구조를 사용합니다. 우리가 엑셀을 사용하는 방식과 흡사합니다. 사진이 구성요소들을 잘 설명하므로 제 말은 생략합니다. 다시, Dataframe 은 여러 개의 Column(열)과 Row(행)로 만들어졌었습니다.. 반면에 Series 는 단 하나의 Column 과 여러 개의 Row 로 이뤄져있습니다. 아래에서 직접 확인해봅시다. 1. Series 생성과 수정 A. Series 생성 ..

    [Pandas] 0. Anaconda (아나콘다) 다운로드와 Jupyter Notebook (주피터 노트북)

    Pandas 를 사용하기에 앞서 Anaconda 와 Jupyter notebook 을 다운 받고 사용해봅시다. 1. Anaconda (아나콘다) 다운로드 Free Download | Anaconda Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 데이터 분석에 사용되는 라이브러리는 다양합니다. Pandas 를 시작으로, Numpy, Jupyter notebook, tensorflow 등이 있죠. 그런데 이걸 하나하나 다 다운받기는 귀찮으니 패키지로 묶었습니다. 그게 Anaconda 입니다. 다..