Class‎ > ‎

데이터과학

  • Data Science 
    • 2016.1 Spring Semester (Thrs. 15:00 - 18:00, Room 5410)
    • Python, R, and Hadoop programming
  • Teacher
    • Youngseok Lee (lee@cnu.ac.kr)
  • 개요
    • R, Python, Java 등의 다양한 언어이용 데이터 분석 학습
    • Hadoop/Spark 이용한 분산환경에서 데이터 분석 학습
    • 데이터 시각화 기법 학습
  • 주의사항
    • 2015년 2학기 "데이터과학개론", 2014년 2학기 "분산시스템"과 교과과정이 유사하기때문에 기수강생은 수강하지 말기를 권고함
  • 주제별 일정
    1. 빅데이터 개론
    2. 공개데이터 개요
    3. 타슈 데이터 분석: MySQL, Python, R 언어로 실습 4주
    4. Fitbit 발걸음 수 데이터 분석: Python, R 언어로 실습 4주
    5. Hadoop 에서 MapReduce 프로그래밍: Java 실습 4주
    6. 데이터 분류 및 클러스터링: Python, Scala, Java 언어로 Python Scikit-learn, R 언어로 데이터분류 알고리즘 및 클러스터링 알고리즘 실습
      1. Python, R, Java, Scala 언어
      2. Hadoop, Spark 실습
  • 숙제
    • 1-2주 별 프로그래밍 실습
  • 텀 프로젝트
    • 최종 프로젝트로 개별적 데이터 분석 서비스 개발 및 데모: 타슈데이터, Fitbit 데이터
  • 숙제제출 방법
    • Google Classroom: http://classroom.google.com 접속 후 @cs-cnu.org 아이디로 로그인하여 연결
    • 코드: 8ynj182
  • 담당조교
    • 이현호 


Comments