Ciência de Dados - Conteúdo Programático

 

Ementa

 

1.Introdução (Motivação)

 

1.1.O que é Ciência de Dados (Data Science) ?

-Conceitos

-Que profissão é essa

-Mercado de trabalho, Habilidades

 

1.2. Linguagens usadas em Data Science

- Python, R, Scala, Java

 

1.3 - Curso Rápido de Python para Análise de Dados

 

2.Data Science e Big Data

-Introdução

-O que é Big Data

-Modelos de Computação Distribuída

 

3.Machine Learning (Aprendizado de Máquina)

(Aprendizado Supervisionado e Aprendizado não-Supervisionado)

Fundamentação Teórica

RegressãoLinear

Regressão Logística

KNN

Naive Bayes

Clusterização

PCA

Árvores de Decisão

SVM

 

4. Redes Neurais

4.1. Componentes Básicos das Redes Neurais Artificiais - RNAs 
4.2. O Sistema Nervoso 
4.3. O Neurônio 
4.4. Sinapses 
4.5. Neurônio x Redes Neurais Artificiais 
4.6. Arquitetura 
4.7. O aprendizado 
4.8. Redes Perceptron 
4.9. Redes ADALINE – Regra Delta 
4.10. Perceptron Multicamadas - MLP 
4.11. Algoritmo BackPropagation 
4.12. Backpropagation – Ajuste de parâmetros
4.13. Otimizadores – Regra Delta 

 

5.Deep Learning

5.1. Introdução e conceitos básicos

5.2. A Arquitetura das Redes Neurais

5.3. Os  principais tipos de Redes Neurais

5.4. Frameworks de Deep Learning

5.5. Programação paralela em GPU

5.6 TensorFlow

5.7 Keras

6. Análise de Mídias Sociais

Twitter, Facebook, Youtube, Instagram, Spotify, etc

 

7. Hadoop e Engenharia de Dados

 

8.  Spark

 

9. Bancos de Dados NoSQL

 

10. Introdução ao MongoDB

11. Processamento de Linguagem Natural (PLN)

PLN e Análise de texto

- Datasets e Arquivos .py

 

___________________________________________________________________________________

 

Google Classroom - Fevereiro 2021 - Turma Manhã - Código da turma: gsk6whh

Google Classroom - Fevereiro 2021 - Turma Noite - Código da turma: b2mydbo

___________________________________________________________________________________

Arquivos no GitHub 

 

 

 

 

 

___________________________________________________________________________________

Python dispara entre capacidades mais procuradas em vagas de emprego

Curso Gratuito de Inglês - MyEnglishOnLine

A nova Lei de Proteção de Dados (Agosto 2020)

open source data visualization framework

___________________________________________________________________________________

Livro de Matemática para Machine Learning

Cursos:

Curso de Álgebra Linear para Cientista de dados

Por Que Você Deve Aprender Álgebra Linear Para Trabalhar com Machine Learning?

Introdução à Estatística

Estatística Descritiva

Cálculo - Derivadas

Gradiente Descendente

 

Links de Cientistas de Dados:

Geoffrey Hinton, Toronto, Canadá.

Ian Goodfellow, Google Brain, USA

Sebastian Raschka,  University of Wisconsin-Madison, USA

Andrew Ng, Co-founder of Coursera

Kira Radinsky, eBay

Hilary Mason, NY, USA (bit.ly)

 

 

LInks Redes Neurais e Deep Learning:

Animação Perceptron

Animação MLP

TensorFlow (Deep Learning)

 

Big Data Datasets:

https://archive.ics.uci.edu (Esse repositório é rico em datasets e  é da Universidade de Califórnia)
http://mariofilho.com/onde-encontrar-datasets-para-praticar-data-science-e-machine-learning/
https://mineracaodedados.wordpress.com/tag/datasets/
https://www.quandl.com/
http://www.datasciencecentral.com/profiles/blogs/big-data-sets-available-for-free
http://www.datasciencecentral.com/profiles/blogs/20-free-big-data-sources-everyone-should-check-out
http://www.datasciencecentral.com/profiles/blogs/10-great-healthcare-data-sets
http://www.bigdatanews.com/profiles/blogs/another-large-data-set-250-million-data-points-available-for-down
 

Texts:

How to Become A Successful Data Analyst?

24 Ultimate Data Science Projects To Boost Your Knowledge and Skills

learn these 3 languages now if you want to become a data scientist