Programa Pedagógico
Pré-requisitos
- INF213: Estrutura de dados
- MAT135: Geometria Analítica e Álgebra Linear
-
MAT140: Cálculo I
É esperado que os alunos estejam confortáveis com (1) programação em Python, (2) operações fundamentais com vetores e matrízes e (3) derivadas de funções compostas e multivariáveis. Além disso, espera-se que os alunos conheçam estruturas de dados fundamentais, bem como os algoritmos clássicos associados à elas.
Conteúdo Programático
-
Introdução
História da Inteligência Artificial; machine Learning x deep Learning; o sucesso de deep learning; as sub-áreas de deep learning; tipos de redes neurais; tecnologias para implementação (python, jupyter notebook, numpy e frameworks).
-
Aprendizado Supervisionado
Formulação matemática; problemas de classificação e regressão; conjuntos de dados, espaço de hipótese; treinamento, validação e teste; métricas de avaliação;
-
Redes Neurais Rasas
Problemas linearmente separáveis; regressão logística, funções de custo; gradiente gescendente; implementação de redes neurais com numpy.
-
Redes Neurais Profundas
Problemas linearmente não-separáveis; multilayer perceptron; funções de ativação; backpropagation; autograd; implementação de redes neurais com pytorch.
-
Regularização
Generalização, sobreajuste e subajuste; aumentando conjuntos de dados; regularização l1 e l2; dropout; normalização de entrada; batch e camada.
-
Otimização
Gradiente descendente estocástico, mini-batch, momentum, RMSprop, Adam, learning rate decay;
-
Redes Neurais Convolucionais
Visão computacional, filtros e convoluções, padding e stride, convoluções em volumes, camadas de pooling, estudo de casos (AlexNet, ResNet, Inception, etc).
-
Redes Neurais Recorrentes
Processamento de linguagem natural, redes neurais recorrentes (RNNs), explosão e esvanecimento de gradientes, gated recurrent unit (GRU), long short term memory (LSTM), RNNs bidirecionais.
-
Mecanismos de Atenção e Transformers
Modelos encoder-decoder; autoatenção; atenção multi-head; transformers, estudo de casos (BERT e GPT).
-
Modelos Generativos
Generative adversarial networks; variational autoencoders (VAEs); vector-quantized variational autoencoders (VQ-VAEs); diffusion models.