일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 컴퓨터 구조
- 다익스트라
- Bit
- 우선순위 큐
- r
- 접미사 배열
- JavaScript
- 시뮬레이션
- 수학
- Cloud Run
- CI/CD
- 백준 1753번
- 데이터 분석
- 펜윅 트리
- 삼성 SW 역량테스트
- 고속 푸리에 변환
- Cloud Pub/Sub
- 그리디
- 다이나믹 프로그래밍
- LCS
- 이분탐색
- REACT
- BFS
- dp
- jpa
- Air Table
- 생활코딩
- 종만북
- ICPC
- 삼성SW역량테스트
- Today
- Total
목록분류 전체보기 (153)
코딩스토리
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/B5Hqy/btqVZTewzpI/eEr5V6yMuCtjq2RClobPTK/img.png)
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 텍스트 마이닝이란 문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법이다. 해당 분석을 하기 위해 가장 먼저 해야할 일은 '형태소 분석'이다. 즉 문장을 구성하는 어절들이 어떤 품사로 되어 있는지 파악하는 것이다. 이후 각 품사의 단어들을 추출해 등장 횟수를 체크한다. 오늘도 책을 따라 분석을 시작해보자. 1. 힙합 음악 가사 텍스트 마이닝 먼저 한글 자연어 분석 패키지인 KoNLP를 사용해야 한다. 이 패키지를 사용하려면 Java가 깔려있어야 한다고 하니 참고하고 설치 방법은 책을 사서 확인하길.. 이런 게 제일 짜증 난다 패키지 설치하고 뭐 다운받고 등등... 이거 다운받는것도 쉽지 않았다..ㅠ 거의..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bltgKW/btqVJSegN6i/rXMcq009Oo1KOlILZLeHpK/img.png)
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 드디어 데이터 분석 프로젝트 마지막 날이다. 이제는 전처리 같은 과정은 어느 정도 할 수 있어진 것 같다. 바로 분석으로 넘어가 보자. 1. 성별 직업 빈도 "성별로 어떤 직업이 가장 많을까?"에 대한 질문에 답해 보자. 남성과 여성 두 성별에 대해 각각 어떤 직업을 많이 가지고 있는지 분석해보자. 이미 필요한 모든 변수들에 대한 전처리를 앞에서 진행했으므로 바로 분석해보면 # 남성 직업 빈도 상위 10개 추출 job_male % filter(!is.na(job) & sex == "male") %>% # 결측치 제거 $ 남성 group_by(job) %>% # 직업 기준 그룹화 summarise(n = n()) ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/c1rou7/btqVsxXOEiZ/krdRY81LwFRHlNkpaXIZ51/img.png)
www.acmicpc.net/problem/1300 1300번: K번째 수 세준이는 크기가 N×N인 배열 A를 만들었다. 배열에 들어있는 수 A[i][j] = i×j 이다. 이 수를 일차원 배열 B에 넣으면 B의 크기는 N×N이 된다. B를 오름차순 정렬했을 때, B[k]를 구해보자. 배열 A와 B www.acmicpc.net 오랜만의 알고리즘 포스팅이다. 이번 주 우리 소학회의 공부 주제가 이분 탐색이라 이 문제를 풀어봤다. (KOALA 뽜이팅!!) 어제 그제 이분 탐색 기초 문제들을 몇 개 풀어본 뒤라 해볼 만할 거라고 생각해서 골드 문제에 도전했는데 문제를 보고 뭐지..? 란 생각이 들었다. 딱 봐도 일반적인 정렬은 무조건 아니고, 배열에 넣어서 계산하는 건 더더욱 아니고.. 음... 음....??..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b0BbLx/btqVdeiZa3N/YPULth5ZZg2n64OvXeQRgK/img.png)
# 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 어제에 이어 데이터 분석을 해보자. 기본적인 내용은 6일 차와 같다. kimtaehyun98.tistory.com/76 6 일차 - 데이터 분석 프로젝트 1 # 이 글을 "Do it! 쉽게 배우는 R 데이터 분석"의 내용을 바탕으로 작성한 글입니다. 드디어 본격적인 데이터 분석 프로젝트를 시작한다. 내가 분석할 데이터는 '한국 복지패널데이터'이 kimtaehyun98.tistory.com 1. 연령대에 따른 월급 차이 "어떤 연령대의 월급이 가장 많을까?"라는 질문에 데이터 분석을 통해 답해보자. 어제 birth 변수를 사용해 새로운 파생 변수 age를 생성했다. 이제 이 age 변수를 통해 연령대를 나타내는 '..
# 이 글은 책 "Do it! 클론 코딩 영화 평점 웹서비스"를 바탕으로 쓴 글입니다. 드디어 본격적인 영화 web을 클론 코딩한다. 이 Web을 만들 때의 데이터는 영화들의 정보에 대한 API를 받아와 사용할 것이다. 여기서 API란 뭘까? 책에 나와있진 않지만 평소에도 궁금했었고 자주 들었지만 실제로 접해본 적은 없었기에 한번 찾아보았다. 위키백과에는 다음과 같이 정의되어있다. "API란 응용 프로그램에서 사용할 수 있도록, 운영 체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있게 만든 인터페이스를 뜻한다." 넹...? 응용 프로그램, 운영 체제, 프로그래밍 언어, 인터페이스 이 단어들 모두 아는 단어들인데 조합해 놓으니까 뭔 소린지 잘 모르겠넼ㅋㅋㅋ 뭐.. 어쨌든 그렇다고 한다. 궁금증을 안고..