커리큘럼 🏫

데이터 사이언스 기본(Data Science Fundamentals)
1. 데이터 전처리 및 EDA(Data Preprocessing and EDA)
  1. 데이터 탐색(Exploratory Data Analysis)
  2. 특성공학(Feature Engineering)
  3. 데이터랭글링(Data Wrangling)
  4. 데이터 시각화 (Data Visualization)
  - 도구: Pandas, GitHub, Numpy, Matplotlib, Seaborn, Plotly, Google Colab
2. 통계 (Statistics)
  1. 기초 통계(Basic Statistics)
  2. 가설 검정(Hypothesis Testing)
  3. 신뢰구간(Confidence Intervals)
  4. 베이지안 추론(Bayesian Inference)
  - Correlation(상관관계)
  - Covariance(공분산)
  - 유의확률(P-value)
  - 중심극한정리(Central Limit Theorem)
  - T-검정(T-test)
  - 카이제곱검정(Chi-square tests)
3. 선형대수(Linear Algebra)
  1. 벡터와 행렬(Vectors and Matrices)
  2. 선형대수학 주제(Linear Algebra Topics)
  3. 차원 축소(Dimensionality Reduction)
  - 벡터 변환(Vector transformations)
  - 고유값과 고유벡터(Eigenvalues and Eigenvectors)
  - K-평균 군집화(K-Means Clustering)
4. Solo Project
5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
기계학습(Machine Learning)
1. 선형모델(Linear Models)
  1. 회귀분석(Linear Regression)
  2. 다중회귀모델(Multiple Regression)
  3. 정규화(Regularization)
  4. 로지스틱회귀(Logistic Regression)
  - 기준모델(baseline)
  - 과대/소적합(Overfitting/Underfitting)
  - 편향-분산 트레이드오프(Bias-variance Trade-off)
  - 특징 선택(Feature Selection)
  - 범주형 변수 인코딩(Categorical Encoding)
  - OLS(ordinary Least Squares)
2. 트리모델(Decision Tree Learning)
  1. 결정트리(Decision Tree)
  2. 랜덤포레스트(Random Forests)
  3. 부스팅 알고리즘(Boosting Algorithms)
  - 교차 타당성 검사(Cross-Validation)
  - 모형 평가(Evaluation Metrics)
  - ML 파이프라인(ML Pipelines)
  - 특징 중요도(Feature Importance)
  - 하이퍼파라미터 최적화(Hyperparameter Optimization)
3. 머신러닝응용(Applied Predictive Modeling)
4. Solo Project 및 Kaggle Competition
5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
데이터 엔지니어링(Data Engineering)
1. 소프트웨어 엔지니어링(Software Engineering)
  1. 파이썬 패키지와 환경(Python Packages and Environments)
  2. 코드 스타일 및 리뷰(Code Style and Reviews)
  3. 컨테이너와 재현 가능한 빌드(Containers and Reproducible Builds)
  4. 소프트웨어 테스트(Software Testing)
  - PEP 8
  - 도커(Docker)
  - 아나콘다(Anaconda)
  - 오픈소스(Open Sources)
2. SQL 과 데이터베이스(SQL and Databases)
  1. SQL 기초(SQL Basics)
  2. SQL 분석(SQL for Analysis)
  3. NoSQL
  4. 데이터베이스 트랜잭션(Database Transaction)
  - MySQL
  - PostgreSQL
  - MongoDB
  - ACID(Atomicity Consistency Isolation Durability)
3. 어플리케이션 배포(Productization)
  1. 플라스크 파이썬 프래임워크(Flask Python Framework)
  2. API(Application Programming Interface)
  3. 웹 어플리케이션 배포(Web Application Deployment)
  - 리눅스(Linux)
  - 백엔드 서버 개발(Back-end server development)
  - 클라우드 서비스(Amazon Web Services, AWS)
4. 팀 프로젝트
5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
딥러닝(Deep Learning)
1. Natural Language Processing
  1. NLP 개요(Introduction to NLP)
  2. 벡터표현(Vector Representations)
  3. 문서분류(Document Classification)
  4. 토픽모델링(Topic Modeling)
  - 토큰화(Tokenization)
  - 임베딩(Embeddings)
2. Neural Network Foundation
  1. 퍼셉트론(Perceptrons)
  2. 경사하강법(Gradient Descent)
  3. 역전파(Backpropagation)
  - NN Frameworks(Tensorflow, Pytorch)
  - 하이퍼파라미터 튜닝(Hyperparameter Tuning)
3. Major Neural Network Architectures
  1. 순환신경망(Recurrent Neural Networks)
  2. 합성곱신경망(Convolutional Neural Networks)
  3. 오토인코더(AutoEncoders)
  - LSTM(Long Short-Term Memory)
  - 이미지분류(Image Classification)
  - 자동기계학습(AutoML)
4. Solo Project
5. 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
컴퓨터 공학 기본(Computer Science)
1. 파이썬 프로그래밍(Python Programming)
  - 파이썬 기본타입, 데이터구조(Lists, Tuples, Sets, Dictionaries)
  - 문제 해결 전략(Problem-solving Strategy)
  - 클래스(Python Classes)
  - 변수 스코프(Scope, LEGB(Local, Enclosing, Global, builtin) rule)
  - 객체지향프로그래밍(Object-Oriented Programming)
  - 함수형프로그래밍(Functional Programming)
2. 자료구조와 알고리즘((Data Structures and Algorithms)
  - 시간복잡도(Time Complexity)
  - 연결리스트(Linked List)
  - 이진탐색트리(Binary Search Trees)
  - DFT(Depth First Traversal), BFT(Breadth First Traversal)
  - 해시테이블(Hash Tables)
  - 재귀정렬알고리즘(Recursive Sorting Algorithms)
  - 메모이제이션(Memoization)
  - 휴리스틱(Heuristics)
  - 그래프(Graphs)
3. 컴퓨터구조(Computer Architectures)
  - 중앙처리장치(CPU)