커리큘럼 🏫

  1. 데이터 사이언스 기본(Data Science Fundamentals)
    1. 데이터 전처리 및 EDA(Data Preprocessing and EDA)
      1. 데이터 탐색(Exploratory Data Analysis)
      2. 특성공학(Feature Engineering)
      3. 데이터랭글링(Data Wrangling)
      4. 데이터 시각화 (Data Visualization)
      • 도구: Pandas, GitHub, Numpy, Matplotlib, Seaborn, Plotly, Google Colab
    2. 통계 (Statistics)
      1. 기초 통계(Basic Statistics)
      2. 가설 검정(Hypothesis Testing)
      3. 신뢰구간(Confidence Intervals)
      4. 베이지안 추론(Bayesian Inference)
      • Correlation(상관관계)
      • Covariance(공분산)
      • 유의확률(P-value)
      • 중심극한정리(Central Limit Theorem)
      • T-검정(T-test)
      • 카이제곱검정(Chi-square tests)
    3. 선형대수(Linear Algebra)
      1. 벡터와 행렬(Vectors and Matrices)
      2. 선형대수학 주제(Linear Algebra Topics)
      3. 차원 축소(Dimensionality Reduction)
      • 벡터 변환(Vector transformations)
      • 고유값과 고유벡터(Eigenvalues and Eigenvectors)
      • K-평균 군집화(K-Means Clustering)
    4. Solo Project
    5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
  2. 기계학습(Machine Learning)
    1. 선형모델(Linear Models)
      1. 회귀분석(Linear Regression)
      2. 다중회귀모델(Multiple Regression)
      3. 정규화(Regularization)
      4. 로지스틱회귀(Logistic Regression)
      • 기준모델(baseline)
      • 과대/소적합(Overfitting/Underfitting)
      • 편향-분산 트레이드오프(Bias-variance Trade-off)
      • 특징 선택(Feature Selection)
      • 범주형 변수 인코딩(Categorical Encoding)
      • OLS(ordinary Least Squares)
    2. 트리모델(Decision Tree Learning)
      1. 결정트리(Decision Tree)
      2. 랜덤포레스트(Random Forests)
      3. 부스팅 알고리즘(Boosting Algorithms)
      • 교차 타당성 검사(Cross-Validation)
      • 모형 평가(Evaluation Metrics)
      • ML 파이프라인(ML Pipelines)
      • 특징 중요도(Feature Importance)
      • 하이퍼파라미터 최적화(Hyperparameter Optimization)
    3. 머신러닝응용(Applied Predictive Modeling)
    4. Solo Project 및 Kaggle Competition
    5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
  3. 데이터 엔지니어링(Data Engineering)
    1. 소프트웨어 엔지니어링(Software Engineering)
      1. 파이썬 패키지와 환경(Python Packages and Environments)
      2. 코드 스타일 및 리뷰(Code Style and Reviews)
      3. 컨테이너와 재현 가능한 빌드(Containers and Reproducible Builds)
      4. 소프트웨어 테스트(Software Testing)
      • PEP 8
      • 도커(Docker)
      • 아나콘다(Anaconda)
      • 오픈소스(Open Sources)
    2. SQL 과 데이터베이스(SQL and Databases)
      1. SQL 기초(SQL Basics)
      2. SQL 분석(SQL for Analysis)
      3. NoSQL
      4. 데이터베이스 트랜잭션(Database Transaction)
      • MySQL
      • PostgreSQL
      • MongoDB
      • ACID(Atomicity Consistency Isolation Durability)
    3. 어플리케이션 배포(Productization)
      1. 플라스크 파이썬 프래임워크(Flask Python Framework)
      2. API(Application Programming Interface)
      3. 웹 어플리케이션 배포(Web Application Deployment)
      • 리눅스(Linux)
      • 백엔드 서버 개발(Back-end server development)
      • 클라우드 서비스(Amazon Web Services, AWS)
    4. 팀 프로젝트
    5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
  4. 딥러닝(Deep Learning)
    1. Natural Language Processing
      1. NLP 개요(Introduction to NLP)
      2. 벡터표현(Vector Representations)
      3. 문서분류(Document Classification)
      4. 토픽모델링(Topic Modeling)
      • 토큰화(Tokenization)
      • 임베딩(Embeddings)
    2. Neural Network Foundation
      1. 퍼셉트론(Perceptrons)
      2. 경사하강법(Gradient Descent)
      3. 역전파(Backpropagation)
      • NN Frameworks(Tensorflow, Pytorch)
      • 하이퍼파라미터 튜닝(Hyperparameter Tuning)
    3. Major Neural Network Architectures
      1. 순환신경망(Recurrent Neural Networks)
      2. 합성곱신경망(Convolutional Neural Networks)
      3. 오토인코더(AutoEncoders)
      • LSTM(Long Short-Term Memory)
      • 이미지분류(Image Classification)
      • 자동기계학습(AutoML)
    4. Solo Project
    5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
  5. 컴퓨터 공학 기본(Computer Science)
    1. 파이썬 프로그래밍(Python Programming)
      • 파이썬 기본타입, 데이터구조(Lists, Tuples, Sets, Dictionaries)
      • 문제 해결 전략(Problem-solving Strategy)
      • 클래스(Python Classes)
      • 변수 스코프(Scope, LEGB(Local, Enclosing, Global, builtin) rule)
      • 객체지향프로그래밍(Object-Oriented Programming)
      • 함수형프로그래밍(Functional Programming)
    2. 자료구조와 알고리즘((Data Structures and Algorithms)
      • 시간복잡도(Time Complexity)
      • 연결리스트(Linked List)
      • 이진탐색트리(Binary Search Trees)
      • DFT(Depth First Traversal), BFT(Breadth First Traversal)
      • 해시테이블(Hash Tables)
      • 재귀정렬알고리즘(Recursive Sorting Algorithms)
      • 메모이제이션(Memoization)
      • 휴리스틱(Heuristics)
      • 그래프(Graphs)
    3. 컴퓨터구조(Computer Architectures)
      • 중앙처리장치(CPU)