바로가기 메뉴


슈퍼트랙교육 과정일정 그리고 장소
아래 일정에서 확인하실 수 있습니다.

과정명을 클릭하시면 해당 과정에 대한 소개를 보실 수 있습니다.

AWS 기반 빅 데이터(Big Data on AWS)
수강료 1,320,000원 (VAT 포함)
교육 일자 2020-04-27
교육 장소 장소 추후 확정
교육 기간 3일
교육 기간 상세 2020-04-27~2020-04-29
교육 시간 09:30~17:30
제공 사항 E-Book 교재 및 다과 (주차 지원 불가)
수강가능인원 10 명 남았습니다.
스크랩하기
 

AWS 기반 빅 데이터 (Big Data on AWS)

과정 소개

AWS 기반 빅 데이터 과정에서는 Amazon Elastic MapReduce(EMR), Amazon Redshift, Amazon Kinesis와 같은 클라우드 기반 빅 데이터 솔루션 및 나머지 AWS 빅 데이터 플랫폼을 소개합니다. 이 과정에서는 Amazon EMR에서 Hive 및 Hue 같은 하둡 도구의 다양한 에코시스템을 사용해 데이터를 처리하는 방법을 보여줍니다. 또한, 빅 데이터 환경을 생성하고 Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena 및 Amazon Kinesis로 작업하고 모범 사례를 활용해 비용 효과적이며 안전한 빅 데이터 환경을 설계하는 방법을 알려줍니다.

과정 목표

빅 데이터 에코시스템에서의 AWS 솔루션 적합화

Amazon EMR 환경에서의 Apache 하둡 활용

Amazon EMR 클러스터의 구성 요소 식별

Amazon EMR 클러스터 시작 및 구성

Hive, Pig, 스트리밍을 비롯해 Amazon EMR에 사용 가능한 일반적인 프로그래밍 프레임워크 사용

Hue를 활용한 Amazon EMR의 사용 편의성 개선

Amazon EMR 기반 Spark를 통한 인메모리 분석 사용

적절한 AWS 데이터 스토리지 옵션 선택

Amazon Kinesis를 사용한 준실시간 빅 데이터 처리의 이점 파악

데이터의 효율적 저장과 분석에 Amazon Redshift 활용

빅 데이터 솔루션을 위한 비용 및 보안 이해와 관리

데이터 수집, 전송 및 압축 옵션 식별

Amazon Athena를 활용한 임시 쿼리 분석 수행

AWS Glue를 활용하여 ETL 워크로드 자동화

시각화 소프트웨어를 사용하여 Amazon QuickSight를 사용하는 데이터 및 쿼리 설명

AWS Data Pipeline을 사용하여 빅 데이터 워크플로 조율

교육 대상

솔루션스 아키텍트 및 시스템 운영 관리자와 같이 빅 데이터 솔루션의 설계 및 구현에 책임이 있는 개인

AWS를 기반으로 한 빅 데이터 솔루션에 관심이 있는 데이터 과학자 및 데이터 분석가

사전 조건

Apache 하둡, HDFS 및 SQL/NoSQL을 비롯한 빅 데이터 기술에 대한 기본 지식

빅 데이터 기술 기초 웹 기반 교육을 이수했거나 동등 수준의 경험을 보유하고 있어야 함

핵심 AWS 서비스 및 퍼블릭 클라우드 구현에 대한 실무 지식

수강생은 AWS 에센셜 과정을 이수했거나 동등 수준의 경험을 보유하고 있어야 함

데이터 웨어하우징, 관계형 데이터베이스 시스템 및 데이터베이스 설계에 대한 기본 이해

교육 진행 방식

강의 및 실습 교육 (다양한 실습을 통해 새로운 기술을 테스트하고 지식을 실무 환경에 적용해 봅니다.)

준비물

Wi-Fi 가능한 개인 노트북 컴퓨터 (태블릿 PC 불가)

지원 브라우저 : 크롬, 파이어폭스

개인 방화벽이 설정되어 있는 경우 비활성화시키거나 SSH(20), RDP(3389), HTTP/S(80,443) 등의 포트로 통신이 가능해야 합니다.

기간

3일

과정 개요

Day 1 Day 2 Day 3

빅 데이터 개요

수집

빅 데이터 스트리밍 및 Amazon Kinesis

Kinesis를 사용하여 Apache 서버 로그 스트리밍 및 분석

스토리지 솔루션

Amazon Athena를 사용하여 빅 데이터 쿼리

Amazon Athena를 사용한 로그 데이터 분석

Apache 하둡 및 Amazon EMR 소개

Amazon Elastic MapReduce 사용

DynamoDB 기반 데이터 저장 및 쿼리

하둡 프로그래밍 프레임워크

Amazon EMR에서 Hive로 서버 로그 처리하기

Hue를 통해 Amazon EMR 경험 간소화

Amazon EMR의 Hue에서 Pig 스크립트 실행하기

Amazon EMR 기반 Spark

Amazon EMR에서 Spark를 사용하여 뉴욕 택시 데이터 세트 처리 

AWS Glue를 사용하여 ETL 워크로드 자동화

Amazon Redshift 및 빅 데이터

빅 데이터 시각화 및 조정

시각화

Amazon EMR 비용 관리

빅 데이터 솔루션 보호

빅 데이터 설계 패턴

과정 내용은 AWS Global Training Program 기준으로 국가 및 언어에 따라 내용이 조금씩 다를 수 있습니다.