셀프 데이터 전처리 도구
데이터 분석에서 데이터 전처리가 차지하는 비중이 날로 중요해지는 것과 달리 기존 방식의 분석 프로세스는 IT 담당자와 현업 담당자가 분리되어 데이터 전처리에 많은 대기시간이 발생하여 왔습니다. 그래서 이런 대기시간을 줄여 현업담당자가 빠르게 분석에 필요한 데이터를 전처리 할 수 있도록 셀프 서비스 분석 프로세스가 현재 많이 활용되고 있습니다.
Trifacta는 바로 셀프 서비스 전처리 시장을 리딩하는 선두업체로서 현업 담당자가 엑셀을 활용하듯 손쉽게 직접 데이터를 전처리 할 수 있도록 도와줍니다.
![이미지_4-removebg-preview (1).png](https://static.wixstatic.com/media/8009b2_222ed6a4e798405d9bc415c659cbfb3c~mv2.png/v1/crop/x_0,y_0,w_82,h_81/fill/w_82,h_81,al_c,q_85,enc_avif,quality_auto/%EC%9D%B4%EB%AF%B8%EC%A7%80_4-removebg-preview%20(1).png)
T R I F A C T A
Trifacta Overview
FEATURE I.
Data Discoveriing
데이터 분석에서 데이터 전처리가 차지하는 비중이 날로 중요해지는 것과 달리 기존 방식의 분석 프로세스는 IT 담당자와 현업 담당자가 분리되어 데이터 전처리에 많은 대기시간이 발생하여 왔습니다. 그래서 이런 대기시간을 줄여 현업담당자가 빠르게 분석에 필요한 데이터를 전처리 할 수 있도록 셀프 서비스 분석 프로세스가 현재 많이 활용되고 있습니다.
Trifacta는 바로 셀프 서비스 전처리 시장을 리딩하는 선두업체로서 현업 담당자가 엑셀을 활용하듯 손쉽게 직접 데이터를 전처리 할 수 있도록 도와줍니다.
![t1.gif](https://static.wixstatic.com/media/8009b2_757b799c9f5441348292f45b126aaf70~mv2.gif)
![t2.gif](https://static.wixstatic.com/media/8009b2_a8458056c59a48d4a318ba5a670de452~mv2.gif/v1/fill/w_734,h_413,al_c,usm_0.66_1.00_0.01,pstr/t2_gif.gif)
FEATURE II.
Data Structuring
데이터 구조화는 원천 데이터를 분석에 적합한 형태로 데이터 구조를 변경하는 작업을 의미합니다.
Trifacta는 자체 내장된 AI 엔진을 기반으로 학습하여 각 상황에서 사용자가 원하는 구조화 작업을 미리 인지하여 여러가지 제안을 제공하여 손쉽게 적용할 수 있도록 도와줍니다.
FEATURE III.
Data Cleaning
데이터 클린징은 원천 데이터에서 결측 값이나 잘못 입력된 값 또는 사용자가 원하는 기준으로 데이터를 정제하는 작업입니다.
Trifacta는 앞단계에서 식별된 데이터 특성을 기반으로 각 상황에 맞게 사용자가 여러가지 클린징 작업을 할 수 있도록 안내합니다.
![t4.gif](https://static.wixstatic.com/media/8009b2_afd84632567146a9b62b872cc5f5eee4~mv2.gif/v1/fill/w_734,h_413,al_c,usm_0.66_1.00_0.01,pstr/t4_gif.gif)
![t5.gif](https://static.wixstatic.com/media/8009b2_3cac31e0cf5f43c68c7928d3c99ad4c1~mv2.gif/v1/fill/w_758,h_414,al_c,usm_0.66_1.00_0.01,pstr/t5_gif.gif)
FEATURE IV.
Data Enriching
데이터 인리칭은 사용자가 데이터에서 인사이트를 식별할 수 있도록 여러 원천 데이터를 조합하여 하나의 데이터셋으로 통합하는 작업입니다.
Trifacta는 데이터 인리칭을 위한 다양한 기능을 제공하고 있으며 특히 조인 시 내장된 인텔리전트 엔진을 활용하여 쉽게 통합작업을 할 수 있도록 합니다.
FEATURE V.
Data Validating
데이터 검증은 데이터 전처리 작업이 제대로 수행이 되었는지 확인하는 작업입니다.
Trifacta에서는 사용자가 수행한 전처리 작업에 대한 검증이 할 수 있도록 다양한 기능을 제공합니다.
![t6.gif](https://static.wixstatic.com/media/8009b2_18bf2232e6034b58a22cae74d1db0eb4~mv2.gif/v1/fill/w_736,h_414,al_c,usm_0.66_1.00_0.01,pstr/t6_gif.gif)
![t7.gif](https://static.wixstatic.com/media/8009b2_6ff7bb020f404a448c5007c7afa01bf3~mv2.gif/v1/fill/w_736,h_414,al_c,usm_0.66_1.00_0.01,pstr/t7_gif.gif)
FEATURE VI
Data Publishing
데이터 퍼블리싱은 전처리한 결과는 분석에 활 용할 수 있도록 여러 매체에 저장하는 작업입니다.
Trifacta는 전처리한 결과 데이터를 여러가지 타겟활용에 손쉽게 저장할 수 있도록 다양한 인터페이스를 제공합니다.
기존 분석 프로세스 vs. 셀프 서비스 분석 프로세스
![t3.png](https://static.wixstatic.com/media/8009b2_40c279c909f04b4a9fc479df2bd6fe8a~mv2.png/v1/fill/w_922,h_440,al_c,q_90,usm_0.66_1.00_0.01,enc_avif,quality_auto/t3.png)