본문 영역으로 바로가기

Implementing Predictive Analytics with Spark in Azure HDInsight(한글)

코스소개

빅 데이터 사이언스에 대한 준비가 되셨습니까? 이 과정에서는 마이크로소프트 Azure HDInsight에서 Apache Spark를 사용하여 대용량 데이터에 대한 예측 분석 솔루션을 구현하는 방법을 학습합니다. 스칼라 또는 파이썬을 사용하여 Spark ML(Spark의 기계 학습 라이브러리)을 사용하여 데이터를 정제 및 변환하고 머신러닝 모델을 작성하는 방법을 살펴보십시오.

참고 :이 과정의 실습을 완료하려면 Azure 구독 및 윈도우즈 클라이언트 컴퓨터가 필요합니다. 무료 Azure 평가판 구독을 신청할 수 있습니다(확인을 위해서는 유효한 신용 카드가 필요하지만 Azure 서비스에 대해서는 비용이 청구되지는 않습니다). 일부 지역에서는 무료 평가판을 사용할 수 없습니다.

학습내용

  • 스파크를 사용하여 데이터 탐색 및 모델링 준비
  • 지도 학습 모델 구축
  • 모델 평가 및 최적화
  • 빌드 권장사항 및 비지도 학습 모델 작성

강의 계획서

스파크를 활용한 데이터 사이언스 소개
AzureHDInsight에서 스파크 클러스터를 시작하고 스파크를 사용하여 파이썬 또는 스칼라 코드를 실행하여 데이터를 처리 합니다.

머신 러닝 시작하기
스파크 ML 라이브러리를 사용하여 분류 및 회귀 모델을 작성하는 방법 배우기

머신 러닝 모델 평가
지도 학습 모델을 평가하는 방법과 모델 매개 변수를 최적화하는 방법에 대해 알아보십시오.

권장사항과 비지도 학습 모델
스파크 ML을 사용하여 권장 사항 및 클러스터링 모델을 작성하는 방법을 익히십시오.

Meet the instructor

Course Staff Image #1

Graeme Malcolm

Graeme는 SQL Server 및 마이크로소프트 데이터 플랫폼 전문가로서 오랫동안 트레이너, 컨설턴트 및 저자로 활동 해 왔습니다. 그는 SQL Server 데이터 플랫폼 및 비즈니스 인텔리전스를 위한 마이크로소프트 공인 솔루션 전문가입니다. 마이크로소프트와 파트너 및 공급업체로 수년간 협력 한 후 그는 Senior Learning Developer로 마이크로소프트 Learning Experiences 팀에서 마이크로소프트 기술을 최대한 활용하고자하는 개발자 및 데이터 전문가를 위한 컨텐츠를 계획 및 개발하고 있습니다.

  1. 강좌 번호

    DAT202.3x
  2. 개강일

  3. 종강일

  4. 주간 학습 권장 시간

    24 hours in total
등록