데이터 분석을 심층적으로 하기 위해 무료 오픈 소스인 R과 Python을 많이 활용하고 있습니다. 그 중에서도 통계용 언어인 R과 비즈니스 발견 시각화 솔루션인 Qlik Sense를 연동 하면 어떠한 장점이 있는지 소개하겠습니다.
Qlik Sense에 R 라이브러리를 이용하면 2가지의 장점이 있습니다.
- Drag&Drop을 통해서 회귀식 등 통계 모듈 표현 가능 (첫 번째 동영상 0:00 ~ 0:20, 두 번째 동영상 0:00 ~ 0:30 에서 참고)
- 데이터를 선택할 때마다 데이터 기준으로 통계 모듈 식 변경 (첫 번째 동영상 1:30 ~ 1:45, 두 번째 동영상 0:31 ~ 0:45 에서 참고)
이번 내용에서는 R에 내재되어 있는 데이터 샘플을 가지고 R에서 회귀분석을 표현한 결과와 Qlik Sense에서 R라이브러리를 이용하여 회귀분석을 평가한 부분을 비교해 보도록 하겠습니다.
우선 비교를 하기 전에 Qlik Sense와 R 연동 방법부터 살펴 보도록 하겠습니다.
Qlik Sense와 R을 연동하기 위해서는 Qlik Sense가 설치되어 있는 Server에 R, R-Studio를 설치 후 Qlik Sense에서 몇 가지 환경설정 후 아래와 같은 화면이 나오면 Qlik Sense와 R은 연동이 됩니다.
자세한 연동방법 – Installing R with Qlik Sense
데이터는 R에 내장되어 있는 데이터를 가지고 단순선형회귀분석을 표현했고 이 결과를 가지고 Qlik Sense와 R을 연동하면 어떠한 장점이 있는지 소개해 드리겠습니다.
아래 이미지를 참고하시면 간단하게 단순선형회귀식 그래프를 표현한 부분을 확인할 수 있습니다.
이미지에서 회귀분석 선과 그래프를 표현하는 식은 아래와 같습니다.
> fit <- lm(Murder~Population,data = states)
> summary(fit)
> plot(Murder~Population,data = states)
> abline(fit,col="red")
Qlik Sense에서 R에서 표현한 내용을 보여드리도록 하겠습니다.
데이터는 위 이미지에 있는 아래 식으로 csv를 추출 후 Qlik Sense에서 로드 하여 표현했습니다.
> write.csv(states,"E:/R/states.csv")
다음은 관련 내용은 동영상으로 보여드리겠습니다.
[시각화 툴 BI와 통계 패키지 R 연동, 첫번째 동영상]
[시각화 툴 BI와 통계 패키지 R 연동, 두번째 동영상]
동영상 내용과 같이 회귀식 표현 시 특별히 R과 같이 식을 이용하는 것이 아니라 Drag&Drop으로 회귀식을 표현하고 있습니다. 그리고 데이터의 값을 알고 싶으면 그래프 위에 마우스 커서를 두면 데이터에 대한 내용을 보여줍니다. 추가적으로 동영상에서 보셨던 것처럼 데이터를 선택하면 데이터 선택 기준으로 다시 회귀식을 계산해서 보여주게 됩니다. 이와 같은 기능은 R에서는 표현하기 힘든 부분 입니다. 표현을 하더라도 스크립트 식으로 데이터를 정제 후 표현해야 하기 때문에 시간이 오래 걸립니다. 이처럼 Qlik Sense와 R이 연동되면 기존 R에서 보던 부분을 빠르고 유연하게 분석을 할 수 있습니다.
[문의] 이수시스템 BI 솔루션 담당 이종민 02-6494-2977 / winmin@isu.co.kr