본문 바로가기

분류 전체보기175

비즈니스 활용 사례로 배우는 데이터 분석 : R 사용된 주요 함수들... 7장을 넘어가면서, 점점 새로운 함수가 나온다.당장은 알겠지만, 나중에 내 것으로 사용할려면, 정리가 필요하다.(책에 있는 것도 있고, 더한것도 있다.)앞장에서 사용한 함수 정리하고, 다음장에서 사용할때, 까먹지 말자.!!!! 패키지 3장 4장 5장 6장 7장 8장 9장 10장 base setwd read.csv head merge summary NROW is.na substr ifelse view sum setwd read.csv head merge summary substr length setwd read.csv head merge summary ifelse is.na as.Date max setwd read.csv summary setwd read.csv head merge.. 2016. 11. 16.
데이터 분석 준전문가 정리 [1] 데이터의 이해1-1 데이터의 이해1.1.1 데이터와 정보1.1.2 데이터베이스 정의와 특징1.1.3 데이터베이스 활용1-2 데이터의 가치와 미래1.2.1 빅데이터의 이해1.2.2 빅데이터의 가치와 영향1.2.3 비즈니스 모델1.2.4 위기 요인과 통제 방안1.2.5 미래의 빅데이터1-3 가치창조를 위한 데이터 사이언스와 전략 인사이트1.3.1 빅데이터 분석과 전략 인사이트1.3.2 전략 인사이트 도출을 위한 필요 역량1.3.3 빅데이터 그리고 데이터 사이언스의 미래 [2] 데이터 분석 기획2-1 분석과제 정의2.1.1 개요2.1.2 분석 기회 발굴2.1.3 분석 기회 구조화2.1.4 분석 방안 구체화2.1.5 분석 활용 시나리오 정의2.1.6 분석 정의서 작성2.1.7 전사관점 분석정의 시 고려요.. 2016. 11. 4.
apply 계열 함수 * apply 계열 함수apply, lapply, sapply, tapply, mapply비슷하다-_-;구별하자 대상 결과 apply 2차원 이상 배열 및 행렬, 데이터프레임 벡터나 리스트는 다음과 같은 에러 :dim(X)는 반드시 양의 값을 가지는 길이를 가져야 합니다 1차원 배열은 다음과 같은 에러 : Error in if (d2 == 0L) { : missing value where TRUE/FALSE needed lapply 문자빼고 다된다. (스칼라 숫자도 된다) 리스트 (보기에 나쁘다-_-) sapply 문자빼고 다된다. (스칼라 숫자도 된다) 결과의 길이가 1이면 >> unlist(리스트) -> 벡터 결과의 길이가 1보다 크면 -> 행렬 2016. 10. 31.
R 리스트 list 리스트는 다른 언어에서 딕셔너리라 했다.그런데, 뭔가 잘 이해가 안된다. 리스트를 비교해보자 str unlist 딕셔너리 같은 리스트 > b b $a [1] 1 2 3 $b [1] "2" > b[1] $a [1] 1 2 3 > b[[1]] [1] 1 2 3 > b[3] $ NULL > str(b) List of 2 $ a: num [1:3] 1 2 3 $ b: chr "2" a1 a2 a3 b "1" "2" "3" "2" 배열 같은 리스트 > a a [[1]] [1] 1 2 3 > a[1] [[1]] [1] 1 2 3 > a[[1]] [1] 1 2 3 > a[2] [[1]] NULL > str(a) List of 1 $ : int [1:3] 1 2 3 [1] 1 2 3 결과로서 리스트 > res.. 2016. 10. 31.
빅북 통계학 (최용석 저) 공부 정리 | 1장 | 통계학의 이해_ 13 1.1 통계학의 활용 _ 15 1.2 자료의 수집 _ 19 1.3 자료의 이해 _ 21 1.4 연습문제 _ 24| 2장 | 자료의 정리 및 요약_27 2.1 범주형 자료의 요약 _ 29 2.2 이산형 자료의 요약 _ 32 2.3 표와 그림을 이용한 연속형 자료의 요약 _ 2.4 수치를 이용한 연속형 자료의 요약 _ 38 2.5 상자그림 _ 44 2.6 R-프로그램 실습 _ 47 2.7 연습문제 _ 50| 3장 | 이산확률변수 및 분포_53 3.1 사건의 확률 _ 55 3.2 확률변수 _ 56 3.3 이산확률변수의 확률분포함수 _ 57 3.4 확률변수의 기대값과 표준편차 _ 58 3.5 이항분포 _ 66 3.6 R-프로그램 실습 _ 71 3.7 연습문제 _ 72| 4장 |.. 2016. 10. 25.
데이터 타입 1.1 스칼라 - 숫자, NA, NULL, 문자열, 진릿값(TRUE, FALSE)1.2 팩터 - 범주형(명목형, 순서형)factor( )nlevels( )levels( )is.factor( )ordered( )is.ordered( )어떻게 사용?2 벡터 - 한가지 데이터 타입, 중첩X, 벡터연산c( )names( )names( ) 2016. 10. 4.
텍스트 자동 변환1 R을 이용한 데이터처리 분석 실무https://thebook.io/006723/ 의 데이터 가공 > R script만 가져오기 2016. 10. 2.
마스터 알고리즘 페드로 도밍고스 지음/ 비즈니스북스 머신러닝에 대한 다양한 관점에서 시작한다.저자의 궁극적인 의도는 하나의 마스터 알고리즘을 개발하기 위함이지만그러기 위해서는 기존의 다양한 관점들을 살펴볼 필요가 있다. 파이썬, spark, 머하웃 등을 공부하며, 어쩌면 돌아온 이 길에서쉬어가는 코너로... 좀더 넓은 안목으로 머신러닝에 대한 여러 관점을 볼 수 있었다. 수식없이...어쩌면 수식없이, 그림도 거의 없이글로만 머신러닝을 설명하고 있어서 답답한 부분도 있지만...새롭게 알게된 것도 많이 있다. 일단 빠르게 1독을 목표로 읽었고, 다시 한번 읽어야 겠다^^;; 간단히 정리해본다---------------------------------------------------------------------------.. 2016. 8. 30.