커리큘럼 🏫
- 데이터 사이언스 기본(Data Science Fundamentals)
- 데이터 전처리 및 EDA(Data Preprocessing and EDA)
- 데이터 탐색(Exploratory Data Analysis)
- 특성공학(Feature Engineering)
- 데이터랭글링(Data Wrangling)
- 데이터 시각화 (Data Visualization)
- 도구: Pandas, GitHub, Numpy, Matplotlib, Seaborn, Plotly, Google Colab
- 통계 (Statistics)
- 기초 통계(Basic Statistics)
- 가설 검정(Hypothesis Testing)
- 신뢰구간(Confidence Intervals)
- 베이지안 추론(Bayesian Inference)
- Correlation(상관관계)
- Covariance(공분산)
- 유의확률(P-value)
- 중심극한정리(Central Limit Theorem)
- T-검정(T-test)
- 카이제곱검정(Chi-square tests)
- 선형대수(Linear Algebra)
- 벡터와 행렬(Vectors and Matrices)
- 선형대수학 주제(Linear Algebra Topics)
- 차원 축소(Dimensionality Reduction)
- 벡터 변환(Vector transformations)
- 고유값과 고유벡터(Eigenvalues and Eigenvectors)
- K-평균 군집화(K-Means Clustering)
- Solo Project
- 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
- 기계학습(Machine Learning)
- 선형모델(Linear Models)
- 회귀분석(Linear Regression)
- 다중회귀모델(Multiple Regression)
- 정규화(Regularization)
- 로지스틱회귀(Logistic Regression)
- 기준모델(baseline)
- 과대/소적합(Overfitting/Underfitting)
- 편향-분산 트레이드오프(Bias-variance Trade-off)
- 특징 선택(Feature Selection)
- 범주형 변수 인코딩(Categorical Encoding)
- OLS(ordinary Least Squares)
- 트리모델(Decision Tree Learning)
- 결정트리(Decision Tree)
- 랜덤포레스트(Random Forests)
- 부스팅 알고리즘(Boosting Algorithms)
- 교차 타당성 검사(Cross-Validation)
- 모형 평가(Evaluation Metrics)
- ML 파이프라인(ML Pipelines)
- 특징 중요도(Feature Importance)
- 하이퍼파라미터 최적화(Hyperparameter Optimization)
- 머신러닝응용(Applied Predictive Modeling)
- Solo Project 및 Kaggle Competition
- 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
- 데이터 엔지니어링(Data Engineering)
- 소프트웨어 엔지니어링(Software Engineering)
- 파이썬 패키지와 환경(Python Packages and Environments)
- 코드 스타일 및 리뷰(Code Style and Reviews)
- 컨테이너와 재현 가능한 빌드(Containers and Reproducible Builds)
- 소프트웨어 테스트(Software Testing)
- PEP 8
- 도커(Docker)
- 아나콘다(Anaconda)
- 오픈소스(Open Sources)
- SQL 과 데이터베이스(SQL and Databases)
- SQL 기초(SQL Basics)
- SQL 분석(SQL for Analysis)
- NoSQL
- 데이터베이스 트랜잭션(Database Transaction)
- MySQL
- PostgreSQL
- MongoDB
- ACID(Atomicity Consistency Isolation Durability)
- 어플리케이션 배포(Productization)
- 플라스크 파이썬 프래임워크(Flask Python Framework)
- API(Application Programming Interface)
- 웹 어플리케이션 배포(Web Application Deployment)
- 리눅스(Linux)
- 백엔드 서버 개발(Back-end server development)
- 클라우드 서비스(Amazon Web Services, AWS)
- 팀 프로젝트
- 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
- 딥러닝(Deep Learning)
- Natural Language Processing
- NLP 개요(Introduction to NLP)
- 벡터표현(Vector Representations)
- 문서분류(Document Classification)
- 토픽모델링(Topic Modeling)
- 토큰화(Tokenization)
- 임베딩(Embeddings)
- Neural Network Foundation
- 퍼셉트론(Perceptrons)
- 경사하강법(Gradient Descent)
- 역전파(Backpropagation)
- NN Frameworks(Tensorflow, Pytorch)
- 하이퍼파라미터 튜닝(Hyperparameter Tuning)
- Major Neural Network Architectures
- 순환신경망(Recurrent Neural Networks)
- 합성곱신경망(Convolutional Neural Networks)
- 오토인코더(AutoEncoders)
- LSTM(Long Short-Term Memory)
- 이미지분류(Image Classification)
- 자동기계학습(AutoML)
- Solo Project
- 현장의 이야기 - 선배 현직자의 이야기를 듣고 질문하는 시간을 갖습니다.
- 컴퓨터 공학 기본(Computer Science)
- 파이썬 프로그래밍(Python Programming)
- 파이썬 기본타입, 데이터구조(Lists, Tuples, Sets, Dictionaries)
- 문제 해결 전략(Problem-solving Strategy)
- 클래스(Python Classes)
- 변수 스코프(Scope, LEGB(Local, Enclosing, Global, builtin) rule)
- 객체지향프로그래밍(Object-Oriented Programming)
- 함수형프로그래밍(Functional Programming)
- 자료구조와 알고리즘((Data Structures and Algorithms)
- 시간복잡도(Time Complexity)
- 연결리스트(Linked List)
- 이진탐색트리(Binary Search Trees)
- DFT(Depth First Traversal), BFT(Breadth First Traversal)
- 해시테이블(Hash Tables)
- 재귀정렬알고리즘(Recursive Sorting Algorithms)
- 메모이제이션(Memoization)
- 휴리스틱(Heuristics)
- 그래프(Graphs)
- 컴퓨터구조(Computer Architectures)