일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 그리디
- REACT
- Cloud Run
- 다이나믹 프로그래밍
- 종만북
- 이분탐색
- CI/CD
- 수학
- 우선순위 큐
- 컴퓨터 구조
- 삼성 SW 역량테스트
- 백준 1753번
- 시뮬레이션
- LCS
- Air Table
- Cloud Pub/Sub
- BFS
- 삼성SW역량테스트
- 데이터 분석
- 펜윅 트리
- jpa
- JavaScript
- 다익스트라
- r
- dp
- 고속 푸리에 변환
- Bit
- ICPC
- 생활코딩
- 접미사 배열
- Today
- Total
목록데이터 분석 (14)
코딩스토리
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 데이터 전처리 데이터를 분석에 적합하게 가공하는 작업을 데이터 전처리라고 한다. dplyr 패키지는 앞에서도 공부했지만 데이터 전처리 작업에 가장 많이 사용되는 패키지라고 한다. dplyt 함수 기능 filter() 행 추출 select() 열(변수) 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left-join() 데이터 합치기(열) bind_rows() 데이터 합치기(행) 바로 코드로 하나씩 살펴보자. 1. filter() 함수 library(dplyr) exam % filter(class == 1) exam 데이터는 다음과 같다..
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 데이터 프레임 열 (column) = 속성, value 행 (row) = 정보, case 데이터가 크다 = 행이 많다 or 열이 많다 데이터를 분석하는 입장에서는 열이 많은 것이 더 중요! Why? 행이 늘어난다 -> 단순히 정보만 늘어난다. 즉 연산 시간만 길어진다. 열이 늘어난다 -> 열이 많아지면 변수가 많아짐 = 조합할 수 있는 경우의 수가 늘어남 데이터 분석은 변수들의 관계를 분석해야 하는데 조합이 늘어난다는 것은 적용하는 분석 기술 고급화 이제 R 스튜디오에서 직접 데이터 프레임을 만들어보자. 코드는 다음과 같다. # 학생 4명의 영어점수 english
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 정리) R은 최근 떠오르고 있는 데이터 분석을 위한 언어이다. 데이터 분석 도구에는 GUI 방식과 프로그래밍 방식이 있는데 R은 전문적인 데이터 분석까지 할 수 있는 프로그래밍 방식이다. 변수 생성 R에서는 변수를 다음과 같이 생성한다. var1
이번 방학때 모든 분야에 발을 담궈보자는 생각을 했었기 때문에 (발 끝이라도, 발가락 끝이라도 시도해봐야지 진로를 정하는데 도움이 될 것 같아서) Web 관련 책을 사러 가서 데이터 분석 책도 샀었는데 계절학기 + 나태한 나의 마음가짐 + 귀차니즘 등등 수만가지 이유로 공부 시작을 미뤄오다 오늘에서야 계획을 세우고 공부를 시작했다. 사실 내가 가장 해보고 싶었던 분야갸 빅데이터 쪽이기 때문에 책을 펴는데 설렜던 적은 처음이였다 ㅎㅎ 앞으로 공부할 때마다 이곳에다 정리할 예정이다. 1. Do it! 쉽게 배우는 R 데이터 분석 2주 집중 코스로 공부 1일차 - 1.22 fin 2일차 - 1.24 fin 3일차 - 1.26 fin 4일차 - 1.27 fin 5일차 - 1.28 fin 6일차 - 1.30 fi..