본문 바로가기

빅데이터 in r

[R] 튜토리얼 01. R 프로젝트 시작하기 Rstudio에서 맨 오른쪽 위에 보면 사각얼음모양의 아이콘을 클릭해서 새로운 프로젝트 하나를 만든다. 작업하다보면 같은 변수를 쓸때도 있고 한데, 어떠한 주제로 분석할때마다 이렇게 따로 프로젝트를 생성해서 이 안에서 작업하면 변수 값들이 섞일 일이 없다. 1) 프로젝트 생성하기 New Project 클릭 > New Directory 클릭 > New Project 항목 클릭 뉴 프로젝트 라는 이름으로 프젝이름을 설정해보았다. 이렇게 새로 Rscript를 만들면 뉴 프로젝트라는 경로 바로 아래에 기존의 .R이 아니라 .Rproj 라는 확장자의 파일이 생성된걸 볼 수 있다. 2) 생성한 프로젝트로 들어가기 새로 Rstudio를 껐다 켰을 때, 뉴 프로젝트로 들어가기 위해선, 사각얼음아이콘 클릭 > Open .. 더보기
[R] 튜토리얼 01. R Global Options에서 기본 설정 변경해서 분석 환경 최적화하기 Rstudio에서 위 메뉴바에 보이는 Tools 클릭 > Global Options 클릭 ㅁ 왼쪽 세로메뉴바에서 Code 아이콘 클릭 여기서 기본으로 빈 체크박스로 되어있는 Auto-detect code indentation 체크하고 > Apply 버튼 클릭 ㅁ 왼쪽 세로메뉴바에서 Code 아이콘 클릭 > Display 탭 클릭 여기서 기본으로 빈 체크박스로 되어있는 Highlight selected line이랑 Show indent guides 두 개를 체크하고 > Apply 버튼 클릭 * Highlight selected line : Rstudio에서 마우스 커서가 위치한 행만 튀는 바탕색깔로 표시해준다. * Show indent guides : for문, if문 등 함수쓰기에 매우 유용하다. 들여쓰.. 더보기
[R] 튜토리얼 01. R 설치하기 - 텍스트마이닝 분석 환경 셋팅하기 1) rtool, rstuido, R, java(jre)를 설치한다. 텍스트마이닝을 하기 위해선 R 에서 KoNLP 라이브러리를 사용하게 된다. 이 때, KoNLP를 이용해 동작을 구현하기 위해선 바탕에 java가 깔려있어야 된다. 구글에 R 설치, rstudio 설치, rtools 설치, java 설치 라고 검색하면, 바로 아래에 다운로드하러 가는 창으로 가서 설치하면된다. | R 설치 https://cloud.r-project.org/ The Comprehensive R Archive Network cloud.r-project.org | rstuido 설치 https://www.rstudio.com/ RStudio | Open source & professional software for data s.. 더보기
[R] 튜토리얼 02. (수집) selenium 크롬 드라이버 버전 문제 해결 : This version of ChromeDriver only supports Chrome version 100 R에서 셀레니움으로 구동하려다 이런 메세지가 떴다. [오류메시지] Selenium message:session not created: This version of ChromeDriver only supports Chrome version 100 Current browser version is 99.0.4844.82 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe 찾아보니 크롬 드라이버의 버전 문제 였다. (참고) https://codechacha.com/ko/selenium-chromedriver-version-error/ selenium 버전 문제 해결 - This version of ChromeDriver onl.. 더보기
띄어쓰기 교정 패키지 다운로드 받으려다 아나콘드를 업그레이드 Konlp 텍스트마이닝 과정에서 먼저 정갈한 형태소분석을 위해 KoSpacing 이라는 띄어쓰기 교정 패키지를 다운받아 테스트 해보려 하였다. ## 띄어쓰기 교정 패키지 다운 https://hwangknock.tistory.com/8 한글 띄어쓰기 패키지 KoSpacing! 한글 띄어쓰기 패키지 KoSpacing! 지난 텍스트마이닝 글에서 띄어쓰기와 관련된 문제가 있다고 말했는데, 찾아보니 KoSpacing이라는 한글 띄어쓰기 패키지가 있더라구요. 예전부터 실행이 안 되길 hwangknock.tistory.com 근데 아나콘다가 설치된 환경해서 실행이 되나보다. 아나콘다를 설치하거나 있는지 확인하는 방법등은 아래 두가지 경우가 있는데, 1. library(reticulate) install_minicon.. 더보기
Gitgub에서 html 띄우기 (with 템플릿 bootstrap) - 작업한 로컬 html을 외부로 배포 공유하기 | 템플릿bootstrap 다운 startbootstrap.com/landing-pagesstartbootstrap.com/ Free Bootstrap Themes, Templates, Snippets, and Guides Start Bootstrap develops free to download, open source Bootstrap 4 themes, templates, and snippets and creates guides and tutorials to help you learn more about designing and developing with Bootstrap. startbootstrap.com 여기서 free한 BOOTSTRAP 템플릿을 다운받는다. 다운받은 zip 압축 파일을 푼다. .. 더보기
XMLHttpRequest from origin 'null' has been blocked by CORS policy . json 이 새 크롬 창에 안 띄워질 때 해결 방법 index.html 을 새 크롬 창에 띄우려 했더니, 열리진 않고 f12를 눌러보니 이런 에러가 나타났다. CORS 라는 구글의 보안 정책 때문에 json파일이 포함된 이 데이터 폴더를 띄울 수 없었다.. 찾아보니, 해결 방법이 있었다. Cmd 로도 하는 방법, 어파치php로 하는 방법 등등 다양했지만 시스템 초보자가 할 수 있는 가장 간단한 방법이 있었다. 1. 우선 크롬의 확장프로그램 "Web Server for Chrome" 앱을 설치한다. 2. 이 앱을 실행해서 연다. 3. index.html이 들어있는 폴더를 choose folder로 선택하고 그 바로 아래 보이는 web server url를 클릭한다. 그럼 띄워지더라.. 보안정책 때문에 막았지만, 이렇게 데이터 교환되는 새 server 창을 .. 더보기
[R] 튜토리얼 02. (수집) 셀레니움 Selenium을 이용한 자동 웹 크롤링하는 방법 0. 자바 설치하기 cmd 창에서 java -version 또는 javac 라고 명령어를 입력하고 쳐서 제대로 잘 깔렸는지 확인한다. 에러가 난다면 환경변수편집으로 path를 지정해준다. 1. 설치하기 C:\r_selenium으로 폴더를 만든다 1) selenium 다운받기. (ver. 3.11.0) -> jar 압축파일을 r_selenium에 압출파일 풀지 않고 저장. >>> https://www.seleniumhq.org/download/ 에서 바로 다운 또는 http://selenium-release.storage.googleapis.com/index.html 링크에 접속하면 다운로드할 수 있는 3.11버전 말고도 4.0 등 여러 버전들이 있음 2) geckodriver 다운받기. (ver. 0.1.. 더보기