CS/Data Science 5

[CS] 파이썬으로 시작하는 데이터 사이언스 (5)

10 minutes to pandas (판다스 실습) 참고 : pandas.pydata.org/pandas-docs/version/1.0.0/getting_started/10min.html - numpy, pandas 사용하기 > import numpy as np > import pandas as pd numpy : 행렬이나 대규모 다차원 배열을 쉽게 처리 할 수 있도록 지원하는 파이썬 라이브러리 - Object 생성하기 (1) Series 만들기 s = pd.Series([1, 3, 5, np.nan, 6, 8]) 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 (2) DataFrame 만들기 dates = pd.date_range('20201110', per..

CS/Data Science 2020.11.09

[CS] 파이썬으로 시작하는 데이터 사이언스 (4)

데이터 분석을 위한 파일 경로 설정하기 - %mv - %pwd - %ls - pd.read_csv - cp949 - 설정 방법 1) 새로운 노트북 생성하기 2) 공공데이터 포털로 이동하여 원하는 데이터 다운받기 3) 다운받은 데이터를 주피터 노트북의 위치로 옮기기 : %mv 4) data 폴더 내에 판다스로 csv 파일 불러오기 pd.read_csv("./data/도로교통공단_교통사고_다발지역_20201104.csv", encoding="cp949") * 도움말 : Shift + Tab

CS/Data Science 2020.11.09

[CS] 파이썬으로 시작하는 데이터 사이언스 (3)

판다스 치트시트 활용하기 - pandas - dataframe - series - sort - drop - groupby - pivot table - plot - Pandas 사용하기 수식으로 계산할 수 있고 시각화도 할 수 있는 데이터 분석도구이다. 엑셀로는 힘든 대용량의 데이터를 분석할 수 있다. import pandas as pd로 라이브러리를 불러온 후 사용한다. - Pandas 따라해보기 pandas.pydata.org/pandas-docs/version/1.0.0/getting_started/10min.html pandas.pydata.org/Pandas_Cheat_Sheet.pdf - 관련 문법 익히기 1) DataFrame : 2차원의 자료구조 2개 이상의 프레임을 가져올 때는 데이터 프레..

CS/Data Science 2020.11.08

[CS] 파이썬으로 시작하는 데이터 사이언스 (2)

데이터 분석에 필요한 파이썬 기초 문법 - import : import를 통해 파이썬의 라이브러리나 패키지를 가져올 수 있다. - boolean : True(1), False(0) - string : 앞 뒤 공백 제거하기 - address = address.strip(), 문자열 포함여부(address.startswith(""), 혹은 "" in address) - list : append(원소 추가하기), 슬라이싱(address:[:2]), 원소 포함 여부 확인하기("" in address_list) - for : enumerate를 통해 원소와 index 함께 가져오기 - for i, val in enumerate(lang): - len() : 문자열, 리스트 길이 확인하기 - split(기준 문자)..

CS/Data Science 2020.11.08

[CS] 파이썬으로 시작하는 데이터 사이언스 (1)

데이터 분석 환경 설정하기 (Mac) - 공공 데이터 포털 www.data.go.kr/ - 아나콘다 가상 개발환경, 데이터 분석을 위한 파이썬 개발환경을 모아놓은 패키지 www.anaconda.com/products/individual 1) 아나콘다 설치 버전 확인 : conda --version 2) 최신 버전 업그레이드 : conda update conda - 주피터 노트북 사용하기 1) 파이썬3 사용하기 2) 간단한 파이썬 코드 실행시키기 Run을 통해 결과를 바로 확인해 볼 수 있다. 위에 새로운 샐 생성하기: a 아래에 새로운 샐 생성하기: b 셀 삭제하기 : dd 편집상태로 변환 : Enter 셀이 실행이 되고 커서가 다음셀로 이동 : Shift + Enter 셀이 실행되고 커서가 그 셀에 유..

CS/Data Science 2020.11.08