1. Relembrando as escalas de medida
2. Estatística Descritiva Gráfica
2.1 - Construindo Gráficos através de Chart Builder
2.1.1- Boxplot
2.1.2 - Gráfico de barras
2.1.3 - Gráfico circular (Pie/polar)
2.1.4 - Histograma multivariado
2.1.5- Histograma horizontal
2.2 - Construindo Gráficos através de Graphboard Template Chooser
2.2.1 - Gráfico de barras
2.2.2 - Histograma
2.3 - Construindo Gráficos através de Legacy Dialogs
2.3.1 - Boxplot
2.3.2 - Scatterplot
2.3.3 - Histograma Horizontal bilateral (Pirâmide populacional)
2.4 - Desafio: Construir um gráfico que mapeie idades/rendimentos/escolaridade
- Avaliação
3. Estatística Descritiva Analítica
3.1 - Estatística Descritiva Analítica de uma variável
3.1.1 - Medidas (estatísticas) de Tendência Central
3.1.2 - Medidas (estatísticas) de Dispersão
3.1.3 Medidas de Assimetria e Achatamento
- Avaliação
3.2 - Estatística Descritiva Analítica de duas variáveis
3.2.1 - Coeficiente de Variação
3.2.2 - Covariância/coeficiente de correlação
- Avaliação
Quem deve inscrever-se?
Todos os estudantes, licenciados, mestrandos, doutorandos, investigadores, funcionários de organizações que desejem alargar as suas competências na entusiasmante e promissora área de análise de dados
1. Testes de Hipóteses Univariados
1.1 Generalidades
1.2 O problema dos dados dicotómicos: Teste Binomial
1.3 Amostras emparelhadas
1.4 Testes para duas populações: baseado em amostras independentes
1.5 Testes para três ou mais populações, baseados em amostras independentes
1.6 ANOVA fatorial com n fatores
2. Testes de Hipóteses Bivariados
2.1 Tabelas de Contingência
2.1 Teste de independência do Qui-quadrado
2.1 Teste exato de Fisher
3. Avaliação
Quem deve inscrever-se?
Os Testes de Hipóteses constituem uma metodologia estatística muito útil no apoio à tomada de decisões sobre uma ou mais populações, com base na informação contida na amostra. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Regressão Linear Múltipla
1.1 - Introdução
1.2 - Estimação do modelo
1.3 - Análise do modelo
1.3.1 - Significância global do modelo
1.3.2 - Análise dos Resíduos
1.3.3 - Multicolinearidade
1.4 - Previsão
1.5 - Aplicação em SPSS
2. Regressão Logística Binária
2.1 - Introdução
2.2 - Lista de verificação de requisitos
2.3 - Análise do modelo
2.4 - Exemplo em SPSS
2.5 - Resultados e Interpretação
2.5.1 - Estimação do modelo
2.5.2 - Avaliação do Ajustamento do Modelo
2.5.3 - Tabela de Classificação
2.5.4 - Teste de Wald, interpretação dos coeficientes e odds ratio
2.5.5 - Gráfico de classificação
2.6 - Aplicação em SPSS
3. Análise Discriminante
3.1 - Conceitos básicos de análise discriminante
3.2 - O modelo da Análise Discriminante
3.2.1 - Canonical correlation
3.2.2 - Centroid
3.2.3 - Classification matrix
3.2.4 - Discriminant function coefficients
3.2.5 - Discriminant scores
3.2.6 - Eigenvalues
3.2.7 - Standardized discriminant function coefficients
3.2.8 - Structure correlations
3.2.9 - Lambda de Wilks
3.3 - Aplicação em SPSS
4. Análise Fatorial
4.1 - Generalidades
4.2 - Análise em Componentes Principais
4.2.1 - Teste de Bartlett
4.2.2 - Métodos de seleção das componentes principais
4.2.3 - Rotações
4.2.4 - Interpretação das componentes principais
4.3 - Aplicação em SPSS
5. Avaliação
Quem deve inscrever-se?
As amostras são matrizes de dados cada vez mais complexas, pelo elevado número de casos e/ou pelo elevado número de variáveis. Estas técnicas permitem redução de dados, identificar relações significativas entre variáveis, classificar casos novos em grupos homogéneos. Constituem mais metodologias estatísticas muito úteis no apoio à tomada de decisões, com base na informação contida na amostra. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Introdução
1.1 - Quais são as vantagens da segmentação de mercado?
1.2 - O processo de Segmentação
1.3 - Fundamentos de Segmentação de Mercado
2. Variáveis base de segmentação
3. Porquê Segmentar e Dados para Segmentar
3.1 - Desenho de Data Mining Mart
3.1.1 - CRM
3.1.2 - Data Warehouse
3.1.3 - Data Mart
3.1.4 - Período de Tempo abrangido pela Exploração Mineira Dados MART
4. Técnicas Data Mining para Segmentação
4.1 - ACP
4.2 - Segmentação com Técnicas de Agrupamento (Clustering)
4.2.1 - Hierarchical Cluster Analysis
4.2.2 - K – Means
4.2.3 - Two-Step Cluster Analysis ou Agrupamento em duas etapas
4.2.4 - Modelos de Segmentos Latentes ou Latent Cluster Analysis (LCA)
4.2.5 - Binary Decision Tree-CHAID
4.3 - Tarefas e Critérios de Segmentação
4.4 - Avaliação de segmentos
4.5 - Metodologia de Segmentação
4.5.1 - Conceção do processo de segmentação
4.5.2 - Compreensão, Preparação e Enriquecimento de Dados
4.5.3 - Identificação dos Segmentos com Modelação de Agrupamento
4.5.4 - Avaliação e Perfis dos Segmentos Revelados
4.5.5 - Implementação da solução de segmentação, desenho e entrega de Estratégias
diferenciadas
5. Avaliação
Quem deve inscrever-se?
A Segmentação de Mercados trata de agrupar um grande número de casos heterogéneos (pacientes, clientes/utentes de uma organização - desde o retalho até à saúde - alunos de certa licenciatura, eleitores, etc) num conjunto de segmentos, grupos ou clusters homogéneos. Fica assim muito mais fácil a caracterização ou traçado dos perfis em cada cluster, ou seja, o nosso conhecimento sobre os elementos de cada cluster é agora total, de acordo com as características julgadas adequadas e consequentemente selecionadas para a segmentação. Constituem mais metodologias estatísticas muito úteis no apoio à tomada de decisões, com base na informação contida na amostra. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
A. Hinkin, Tracey & Enz, 1997 (30)
1. Construto
1.1 - Como medir um Construto
1.2 - Porquê medir construtos?
1.3 - Desafios na medição de construtos
1.2 - Teoria Psicométrica
2. Primeiros passos na construção de Instrumentos (Questionários)
2.1 - Geração de Itens
2.2 - A abordagem indutiva
2.3 - A abordagem dedutiva
2.4 - Desenvolvimento de perguntas (estrutura, número...)
2.5 - Avaliação da Adequação do Conteúdo
2.5.1 - Escala do item
2.5.2 - Dimensão da amostra Análise Fatorial
2.5.3 - Administração do Questionário
2.5.4 - Análise Fatorial
2.5.4.1 - Análise Fatorial Exploratória
2.5.4.2 - Análise Fatorial Confirmatória
2.5.5 - Avaliação da Consistência Interna
2.5.6 - Validação do Construto
2.6 - Replicação
2.7 - Conclusão
B. C-OAR-SE (Rossiter, 2011)
1. Racional
2. A Estrutura de Medição (C → M → S)
3. Novo -Score
4. Construtos Definidos pelo Investigador (Psicológico) versus Construtos (Perceptuais) definidos por avaliadores
5. Dependência Final do Julgamento Racional dos Peritos para a Definição de Construtos
6. A Definição do Construto Depende do Papel do Construto na Teoria
7. Validade e Fiabilidade
C. Passos no Desenvolvimento da Escala (Bandalos, 2018)
1. Indicar o objetivo da escala
2. Identificar e Definir o Domínio
3. Determinar se já existe uma medida
4. Determinar o formato do item
5. Escrever os objetivos do teste
6. Criar o grupo de Itens Iniciais
7. Realizar a Revisão Inicial do Item
8. Realizar um teste de campo em grande escala aos itens
9. Preparar as Diretrizes para a Administração
10. Exemplos
11. Aplicação e avaliação
Quem deve inscrever-se?
A elaboração de um Questionário – instrumento de recolha de dados quantitativos – é uma tarefa bem mais complexa do que parece. Esta ferramenta é necessária nas mais diversas áreas, desde que queiramos obter informação sobre casos (satisfação dos utentes do SNS ou dos clientes de qualquer organização, estudos sobre o sentido de voto dos eleitores, satisfação dos munícipes com os respetivos transportes, meios de recreação, saúde, educação, etc). Constitui mais uma metodologia estatística muito útil no apoio à tomada de decisões, com base na informação contida na amostra, recolhida através do questionário. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Modelos de Equações Estruturais
1.1 O que é modelação de equações estruturais?
1.2 Conceitos Básicos
1.2.1 Variáveis latentes versus variáveis observadas
1.2.2 Variáveis Latentes Exógenas versus Endógenas
1.2.3 O Modelo Analítico Fatorial
1.2.3.1 Análise Fatorial Exploratória
1.2.3.2 Análise Fatorial Confirmatória
1.2.4 O modelo completo de variáveis latentes
1.2.5 Objetivo geral e processo de modelação estatística
1.3 O Modelo Geral de Equações Estruturais
1.4 Uso do programa AMOS
1.5 Avaliação do Modelo
2. Avaliação.
Quem deve inscrever-se?
Modelos de Equações Estruturais (MEE) são como um prolongamento dos modelos de regressão múltipla, permitindo usar, simultaneamente, vários modelos de regressão, no mesmo estudo. Ajudam o investigador a descobrir efeitos diretos e indiretos ou mediadores entre variáveis. São essenciais quando o investigador pretende testar um modelo proposto. Constitui mais uma metodologia estatística muito útil no apoio à tomada de decisões, com base na informação contida na amostra. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Modelo AFC de segunda ordem
1.1 O modelo hipotético
1.2 Modelação com Amos Graphics
1 .3 Modelo Preliminar
1 .4 O modelo hipotético
1 .5 Avaliação de modelo
2. Variáveis categóricas analisadas como variáveis categóricas
2.1 A teoria
2.2 As suposições
2.3 Estratégias analíticas gerais
2.4 A abordagem amos para análise de variáveis categóricas
2.5 O que é estimativa bayesiana?
2.6 Aplicação da estimação bayesiana
2.7 Teste da validade de uma estrutura causal
2.7.1 O modelo hipotético
2.7.2 Modelagem com gráficos AMOS
2.7.3 Formulação de variáveis indicadoras
2.7.4 Análise Fatorial Confirmatória
2.7.5 Avaliação do modelo
2.7.5.1 Resumo do ajustamento
2.7.5.2 Índices de modificação
2.7.6 Discussão final
2.8 Avaliação
Quem deve inscrever-se?
Modelos Avançados de Equações Estruturais são um complemento dos MEE, sendo essenciais quando o investigador pretende testar um modelo proposto. Constitui mais uma metodologia estatística muito útil no apoio à tomada de decisões, com base na informação contida na amostra. Como tal, devem fazer parte das competências de licenciados em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Ciência
2. Paradigma e Teoria
3. Metodologia
4. Desenho de Investigação
5. Perspetivas Filosóficas
6. Estilos de Raciocínios
7. Positivismo, Relativismo, Pós-modernismo, Realismo Crítico
8. Comparação entre Qualitativa, Quantitativa e Métodos Mistos de Investigação
9. Tipos de Desenho de Investigação
10. Avaliação
Quem deve inscrever-se?
Tal como não será muito viável construir uma casa sem alicerces, não será de tentar levar a cabo uma investigação sem ter como suporte o Desenho de Investigação e Opções Metodológicas. Assim, deve fazer parte das competências de estudantes de licenciatura, mestrado ou doutoramento, outros investigadores, em geral, em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Generalidades
1.1. Características de um bom Desenho
1.2. Conceitos Importantes num Desenho de Investigação
2. Desenhos de Investigação não Experimentais
2.1. Desenho de investigação exploratória
2.2. Desenho de investigação descritivos e diagnósticos
3. Desenhos Experimentais
3.1. Introdução
3.2. Princípios Básicos dos Desenhos Experimentais
3.3. Especificidades
3.4. Desenhos Experimentais Importantes
3.4.1. Antes e depois sem desenho de controlo
3.4.2. Só depois, com desenho de controlo
3.4.3. Antes e depois com desenho de controlo
3.4.4. Desenho completamente aleatorizado (C.R. design)
3.4.5. Desenho aleatório simples em dois grupos
3.4.6. Desenho de réplicas aleatórias
3.4.7. O desenho de blocos aleatórios (desenho B.A.)
3.4.8. O desenho quadrado latino (desenho Q.L.)
3.4.9. Desenhos fatoriais
3.5. Aspetos essenciais complementares de Desenhos Experimentais
3.6. Considerações especiais sobre Desenhos Experimentais
4. Avaliação
Quem deve inscrever-se?
Qualquer efeito que se note sobre a variável dependente como um resultado de variável(eis) externa(s) é tecnicamente descrito como um erro experimental. Um estudo deve ser sempre concebido de tal forma que o efeito sobre a variável dependente seja inteiramente atribuído à(s) variável(eis) independente(s), e não a alguma variável ou variáveis externas.
Assim, uma característica importante de um bom desenho de investigação é minimizar a influência ou efeito de variável(eis) externa(s). O termo técnico controlo é utilizado sempre que concebemos o estudo minimizando os efeitos de variáveis independentes externas. Nas pesquisas experimentais, o termo "controlo" é utilizado para referir-se às condições experimentais de restrição.
Por tudo isto, deve fazer parte das competências de estudantes de licenciatura, mestrado ou doutoramento, outros investigadores, em geral, em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Introdução
1.1 - Populações inquiridas
1.2 - Amostras de inquérito
1.3 - Diretrizes para escolha entre tipos de amostragem ou censo
2. Escolha entre Censo e Amostragem
2.1 - Erro aleatório de Amostragem e Erro Sistemático
2.2 - Enviesamento na seleção de elementos do estudo
2.3 - Forças e Fraquezas das escolhas entre Censos e Amostragem
3. Escolha entre Amostragem Não Probabilística e Amostragem Probabilística
3.1- Amostras não Probabilísticas
3.2- Justificações para a utilização de amostras de inquéritos
3.3- Estruturas Populacionais e Estruturas de Amostragem
4. Escolha entre Censo e Amostragem
4.1- Métodos de amostragem simples de uma só fase
4.1.1 - Amostragem Aleatória Simples (Com e sem reposição)
4.1.2 - Amostragem Estratificada
4.1.3 - Amostragem Sistemática
4.1.4 - Amostragem por Clusters
5. Procedimentos de Amostragem segundo a natureza da unidade de amostragem
6. Escolha da Dimensão da Amostra
7. Avaliação
Quem deve inscrever-se?
É um slogan muito usado, por vezes indevidamente, mas um princípio básico para qualquer inferência estatística significativa é que a amostra deve ser representativa da população. A grande importância de usar um plano ou desenho de amostragem adequado tem a ver exatamente com isso, ou seja, com o rigor das conclusões finais. Assim, deve fazer parte das competências de estudantes de licenciatura, mestrado ou doutoramento, outros investigadores, em geral, em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
1. Analise de Variância
1.1 - Análise de Variância Simples
1.2 - Análise de Variância com observações repetidas
1.3 - Análise de Variância Dupla
1.4 - Análise de Variância Multivariada
2. Análise de Covariância Simples Análise de Variância Multivariada
3. Análise de Variância Multivariada
4. Avaliação
Quem deve inscrever-se?
Se as análises de variância, ANOVA e MANOVA, tratam da comparação de três ou mais médias (vetores de médias), respetivamente, na ANCOVA e MANCOVA, análises de covariância, em vez disso, as médias são ajustadas por alguma outra variável quantitativa chamada covariável.
A análise de covariância será usada, por exemplo, para descobrir (1) qual é a promoção mais eficaz (entre três) de um concessionário de automóveis, quando considera que a temperatura exterior (covariável) pode afetar o número de clientes, (2) qual é o melhor de três fármacos para diminuir os triglicéridos, suspeitando que a eficácia das drogas está relacionada com a idade (covariável) do sujeito ou (3) qual é o melhor, entre três métodos de ensino, quando a disciplina é, concretamente, a matemática.
Assim, deve fazer parte das competências de licenciados ou outros investigadores, em geral, em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
Bolonha perspectivava mudanças na metodologia de ensino e aprendizagem, na própria constituição do elenco do curso, mas apenas acarretou o desaparecimento, com o emagrecimento para três anos, das unidades curriculares de Estatística e Análise de dados, aquelas que menos falta faziam aos cursos, por não serem da especialidade! No entanto, não existe investigação científica, cada vez mais, sem Análise de Dados - Qualitativa e Quantitativa - o que torna muito difícil a missão dos Mestrandos e Doutorandos sem essas skills. Assim, todas as ferramentas de Análise de Dados que a seguir se propõem, com ajuda do R/RStudio, devem fazer parte das competências de licenciados, mestrandos, doutorandos ou outros investigadores, em geral, em Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde.
R é uma linguagem de programação multi-paradigma, orientada a objetos, programação funcional,
dinâmica, voltada à manipulação, visualização e análise de dados.
Conteúdos
1. Introdução
1.1. A consola R
1.2. Scripts
1.3. RStudio
1.5 Os painéis
1.7 Executar comandos durante a edição de scripts
1.8 Mudança de opções globais
1.9 Instalação de packages R
2. R Básico
2.1. Noções básicas
2.2. Objetos
2.3 A área de trabalho
2.4 Funções
2.5 Nomes de variáveis
2.6 Salvar a área de trabalho
2.7 Guias (Argumentos) motivadoras
2.8 Comentar o nosso código
2.10 Estruturas de controlo
2.11 As condicionais
2.12 Loops (Laços/Declarações)
2.13 Funções e Operadores
3. Tipos de dados e Conversões
3.1. Tipos de dados
3.2 Classe numérica
3.3 Classe inteira
3.4 Classe caractere
3.5 Classe lógica
3.6 Classe vetor
3.7 Classe Matricial
3.8 Sequência
3.9 Data frame
3.10 Estruturas de dados
3.11 Vetores: numéricos, caracteres e lógicos
3.12 Matrizes
3.13 Vetores
3.14 Sequências
3.15. Coerção
3.16 Conversão de tipos de dados
3.17 Aritmética vetorial
3.18 Indexação
3.19 Operadores lógicos
4. Leitura de Dados
4.1. Tipos de Input
4.2. Como ler em Dados
5. Representações gráficas dos dados
6. Exportação dos Resultados
7. Tipos de Output
8. Como exportar Dados
9. Funções
10. Dicas para escrever um bom código R
11. Multiplicação de Matrizes
A visualização de dados é comum em várias disciplinas, incluindo as ciências naturais, engenharia,
informática e estatística. Nada conta uma história sobre os seus dados, de forma tão poderosa, como
bons gráficos. Os gráficos capturam melhor os seus dados do que as estatísticas descritivas e, muitas
vezes, mostram-lhe características que não conseguiria obter a partir daquelas.
Conteúdos
1. Introdução
1.1 Tipos de dados em R
1.2 Instalar e carregar pacotes R
1.3 Importar dados para o R
1.4 Conjuntos de dados de demonstração
1.5 Fechar a sessão R/RStudio
2 Introdução ao ggplot2
2.1 A Função plot()
2.2 Argumentos de plot()
2.3 Pontos e linhas
2.4 Os Métodos de plot( )
2.5 O que é ggplot2?
2.6 Guardar ggplots
2.7 Gráficos de uma variável (X), Discreta ou Contínua
2.8 Gráfico de Duas Variáveis - X & Y: Ambas Contínuas ou Discretas
3 Distribuições bivariadas contínuas
3.1 Formatos de Dados
3.2 Tipos de gráficos
3.3 Acrescentar mapa de aquecimento de contagens de contentores (bins) 2d
3.4 Adicionar revestimento hexagonal
3.5 Gráficos de dispersão com estimativa de densidade 2d
3.6 Função contínua
3.7 Duas Variáveis: Ambas (X e Y) Discretas
3.8 Gráfico para duas Variáveis: X variável discreta, Y variável contínua
3.9 Representando a Distribuição de Duas Variáveis Contínuas
4. Extensões para ggplot2. Organizar Múltiplos Gráficos na mesma página
4.1 Pacotes R requeridos
4.2 Dados
4.3 Cowplot: Organizar gráficos prontos para publicação
4.4 Pacote gridExtra
4.5 Visualização da matriz de Correlações
4.6 Gráficos de Curvas de Sobrevivência
O teste de hipóteses é uma ferramenta chave na inferência estatística ao lado da estimativa pontual e
intervalos de confiança. Os três conceitos fazem uma inferência sobre uma população com base numa amostra retirada dela. O teste de hipóteses visa uma decisão sobre se uma hipótese sobre a natureza da
população é apoiada pelos dados da amostra.
Conteúdos
I Introdução
1. Testes de hipóteses
1.1 Teoria dos testes estatístico de hipóteses
1.2 Testar hipóteses estatísticas com R
II Distribuição Normal
2. Testes sobre médias
2.1 Uma amostra: Teste-z e teste-t
2.2 Duas amostras: Teste-z e teste-t agrupado, teste Welch, testes z e t para pares
2.3 Mais de duas amostras: Análise de Variância, Simples e Dupla
3. Testes sobre variâncias
3.1 Uma amostra: Teste χ2 (média conhecida) e Teste χ2 (média desconhecida)
3.2 Duas amostras: Teste-F e teste-t para duas populações dependentes
3.3 Mais de duas amostras: Teste Bartlett e teste Levene
III Distribuição Binomial
4. Testes para proporções
4.1 Uma amostra: Teste Binomial
4.2 Duas amostras: Teste-z para a diferença (var. agrupadas) e (var. não agrupadas)
4.3 Mais de duas amostras: Teste Binomial para k-amostras
IV Testes não Paramétricos
5. Testes sobre localização (tendência central)
5.1 Uma amostra: Teste dos Sinais, e Teste Wilcoxon
5.2 Duas amostras: Teste (Mann–Whitney) e Teste Wilcoxon matched-pairs signed-rank
5.3 Mais de duas amostras: Teste Kruskal–Wallis
6. Testes de diferença de escala (Dispersão)
6.1 Duas amostras: Teste Siegel–Tukey, teste Ansari–Bradley, teste Mood
V Testes de Ajustamento
7. Testes sobre Normalidade
7.1 Base FDE: Kolmogorov-Smirnov (Lilliefors), Anderson-Darling, Cramér-von Mises
7.2 Não baseados na FDE: Shapiro–Wilk e Jarque–Bera
VI Testes de aleatoriedade
8. Testes de aleatoriedade
8.1 Testes Run: Wald–Wolfowitz, Runs up and down
8.2 Testes de diferenças sucessivas: von Neumann e von Neumann rank (teste Bartels)
VII Testes em Tabelas de Contingência
9. Testes em Tabelas de Contingência
9.1 Testes de independência e homogeneidade: Teste exato de Fisher, Teste χ2 de
Pearson, Teste χ2 da razão de verosimilhança
9.2 Testes de concordância e simetria: kappa de Cohen, McNemar, Bowker para simetria
9.3 Teste sobre medidas de risco: Teste sobre odds ratio, Teste sobre risco relativo.
VIII Testes sobre outliers
10. Testes sobre outliers
10.1 Para distribuição Gaussiana: Grubbs, David–Hartley–Pearson, Dixon
10.2 Para outras distribuições: Distribuições uniforme e exponencial
Os algoritmos de classificação utilizam dados rotulados (porque são métodos de aprendizagem
supervisionada) e aprendem padrões nos dados que podem ser utilizados para prever uma variável de
saída categórica. Na maioria das vezes, trata-se de uma variável de agrupamento (uma variável que
especifica a que grupo pertence um determinado caso) e pode ser binomial (dois grupos) ou multinomial
(mais de dois grupos). Os problemas de classificação são tarefas muito comuns de aprendizagem
automática. Quais os clientes que não cumprirão os seus pagamentos? Quais os doentes que
sobreviverão? Que objetos numa imagem de telescópio são estrelas, planetas ou galáxias? Quando
confrontado com problemas como estes, deve utilizar um algoritmo de classificação.
Conteúdos
1. Introdução aos Modelos Machine Learning
2. Classificação
2.1 Classificação com base em semelhanças com K-vizinhos mais próximos
2.2 Classificação baseada em probabilidades com Regressão Logística
2.3 Classificação por maximização da separação com Análise Discriminante
2.4 Classificação com naive Bayes
2.5 Classificação com Support Vector Machines (SVM)?
2.6 Classificação com Árvores de Decisão
2.7 Melhorando as árvores de decisão com Random Forests e Boosting
2.8 Algoritmos de benchmarking para comparar uns contra os outros
Mudaremos o nosso foco de prever variáveis categóricas para prever variáveis contínuas e usamos o
termo regressão para supervised machine learning que prevê o resultado de uma variável contínua.
Aprenderemos uma variedade de algoritmos de regressão que nos ajudarão a lidar com diferentes
situações de dados. Alguns deles são adequados para situações em que existem relações lineares entre
variáveis preditoras e seu resultado, sendo altamente interpretáveis. Outros são capazes de modelar
relacionamentos não lineares, mas podem não ser tão interpretáveis.
Começaremos abordando a regressão linear, intimamente relacionado à regressão logística, com a qual
já trabalhámos.
Conteúdos
3. Regressão
3.1 Regressão Linear
3.2 Regressão não linear com Modelos Aditivos Generalizados
3.3 Evitando o sobreajustamento com Ridge regression, LASSO, e Elastic net
3.4 Regression Ridge on the Beijing PM2.5 dataset
3.5 Regressão LASSO
3.6 Regressão Elastic Net
3.7 Comparação entre Coeficientes e Erro Padrão Residual
3.8 Os modelos de regressão aplicados ao conjunto de dados de Iowa
3.9 Como treinar o modelo de regressão Ridge
3.10 Treino do modelo LASSO
3.11 Treinar o modelo elastic net
3.12 Benchmarking ridge, LASSO, Elastic net e OLS uns contra os outros
O agrupamento cobre uma gama de técnicas usadas para identificar grupos (clusters) de casos num
conjunto de dados. Um cluster é um conjunto de casos que são mais semelhantes entre si do que com
casos em outros clusters. Iniciamos esta formação com técnicas de redução de dimensão que compreendem uma série de abordagens que transformam um conjunto de (potencialmente muitas)
variáveis, num número menor de variáveis que retêm o máximo possível da informação contida no
ficheiro multidimensional original.
Conteúdos
1. Maximizando a variância: Análise em Componentes Principais (ACP)
1.1 Por quê redução de dimensão
1.2 O que é análise de componentes principais?
1.3 Construindo o primeiro modelo ACP
1.5 Executando ACP
1.6 Representar o resultado da nossa ACP
1.7 Pontos fortes e fracos da ACP
2. Maximizando a similaridade com t-SNE e UMAP
2.1 O que é t-SNE?
2.2 Construindo a primeira incorporação t-SNE
2.3 O que é UMAP?
2.4 Construindo o primeiro modelo UMAP
2.5 Pontos fortes e fracos do t-SNE e UMAP
3 Mapas auto-organizados e incorporação linearmente local
3.1 Pré-requisitos: Grelhas de nós e coletores
3.2 O que são mapas auto-organizáveis?
3.3 Construindo nosso primeiro SOM
3.4 Pontos fortes e fracos dos SOMs
4 Agrupamento (Clustering)
4.1 Clustering descobrindo centros com k-means
4.2 Construindo o primeiro modelo k-means
4.3 Definir a tarefa e o aprendiz
4.4 Escolher o número de clusters
4.5 Ajustando k e a escolha do algoritmo para o nosso modelo k-means
4.6 Treinar o modelo k-means final e ajustado
4.7 Usando nosso modelo para prever clusters de novos dados
4.8 Pontos fortes e fracos do agrupamento k-means
5. Agrupamento hierárquico
5.1 O que é agrupamento hierárquico?
5.2 Construindo primeiro modelo de agrupamento hierárquico aglomerativo
5.3 Outra visão com nova base de dados
5.4 Verificação da árvore de agrupamento
5.5 Pacote R de agrupamento
5.6 Aplicação de agrupamento hierárquico à análise de expressão genética
5.7 Resumo
5.8 Comparar Dendogramas
5.9 Visualização de dendogramas
5.10 Resumo
O clustering baseado em densidade compreende um conjunto de algoritmos que, conforme o nome sugere, usa a densidade dos casos para atribuir membros aos clusters. Há múltiplas maneiras de medir a densidade, mas podemos defini-la como o número de casos por volume unitário do nosso espaço de recursos. Áreas do espaço de recursos contendo muitos casos compactados conjuntamente têm alta densidade, enquanto áreas do espaço de recursos que contêm poucos ou nenhum caso podem ser consideradas de baixa densidade. Nossa intuição afirma que clusters distintos num conjunto de dados serão representados por regiões de alta densidade, separadas por regiões de baixa densidade. Algoritmos de clustering baseados em densidade tentam aprender essas regiões distintas de alta densidade e particioná-las em clusters.
Conteúdos
1. Agrupamento baseado na densidade: DBSCAN e OPTICS
1.1 O que é agrupamento baseado em densidade?
1.2 Como o algoritmo DBSCAN aprende?
1.3 Como o algoritmo OPTICS aprende?
1.4 Porquê DBSCAN?
1.5 Executando DBSCAN
1.6 Construindo nosso primeiro modelo OPTICS
1.7 Pontos fortes e fracos do agrupamento baseado em densidade
2. Clustering baseado em distribuições (Finite Mixture Models)
2.1 O que é agrupamento de modelos de mistura?
2.2 Cálculo de probabilidades com o algoritmo EM
2.3 Construindo seu primeiro modelo de mistura gaussiana para agrupamento
2.4 Agrupamento em mclust
2.5 Pontos fortes e fracos do agrupamento de modelos de mistura
2.6 Mais sobre seleção do melhor modelo
2.6.1 Critério BIC
2.6.2 Critério ICL
2.6.3 Teste de Razão de Verossimilhança Bootstrap
2.7 Visualizando Modelos de Mistura Gaussiana
2.7.1 Gráficos para dados univariados
2.7.2 Gráficos para dados bivariados
2.7.3 Gráficos para dados dimensionais superiores
3. Fuzzy Clustering
3.1 Pacotes R necessários
3.2 Computando cluster difuso
1. Conceitos Gerais
1.1. Introdução
1.1.1. Análise de Funções Risco e Sobrevivência no Marketing
1.1.2. Retenção de clientes
1.1.3. Cálculo da Retenção
1.1.4. O que revelado pela Curva de Retenção
1.1.5. Encontrar a permanência média a partir de uma Curva de Retenção
1.1.6. Riscos
1.1.7. A ideia básica
1.1.8. Censura
1.1.9. Dos Riscos à Sobrevivência
1.1.10. Riscos proporcionais (proportional hazards)
1.1.11. Resumo
2. Estatísticas de diagnóstico
2.1. Codificação para estatísticas de diagnóstico
2.2. Razão de probabilidade (Odds ratio)
2.3. Valores preditivos positivos e negativos
2.4. Sensibilidade e Especificidade
2.5. Tamanho da amostra
2.6. Razão de Probabilidade
2.7. Curvas Receiver Operating Characteristic (ROC)
2.7.1. Cálculo dos pontos de corte
2.7.2. Ponto de corte de diagnóstico ótimo
2.7.3. Pontos de corte para testes de diagnóstico e de triagem
2.7.4. Relatar os resultados da curva ROC
3. Análise de Sobrevivência
3.1. Desenho do Estudo
3.2. Observações censuradas
3.3. Como analisar a Sobrevivência?
3.3.1. Tabelas de Vida (tábua de mortalidade)
3.3.2. Método de sobrevivência de Kaplan-Meier
3.3.2.1. Pressupostos do método de sobrevivência de Kaplan-Meier
3.3.2.2. Tamanho da amostra e codificação de dados
3.3.2.3. Estatísticas de Sobrevivência
3.3.2.4. Relatar os resultados de Kaplan-Meier
3.3.3. Regressão de Cox
3.3.3.1. Rácio de risco
3.3.3.2. Pressupostos do modelo de regressão Cox
3.3.3.3. Exemplo 1: Ensaio Clínico Aleatório de dois Tratamentos
3.3.3.4. Relatar os resultados da regressão de Cox
3.3.4. Regressão de Cox com Covariáveis dependentes do tempo
3.3.4.1. Exemplo (IBM SPSS): ficheiro de dados: recidivism.sav
3.3.4.2. Perguntas para avaliação crítica
4. Avaliação
Quem deve inscrever-se?
Riscos! Sobrevivência! Embora as raízes e a terminologia provenham da investigação médica e da análise de falhas no fabrico, os conceitos são feitos à medida para o marketing.
Assim, deve fazer parte das competências de alunos de licenciatura, mestrado e doutoramento, ou outros investigadores, em geral, de Ciências Sociais, Políticas e Humanas, Matemáticas, Agronomia, Medicina, Psicologia, Enfermagem, Ciências Farmacêuticas, Biologia, Medicina Veterinária, Ciências Biomédicas, Ciências da Saúde
1. Introdução
2. Seleção do Setor
2.1. Os seus interesses e competências
2.2. Investigação
2.3. Questões e Respostas
2.3.1. Que Qualidades procuram num estagiário
2.3.2. O que é mais importante quando se contrata um Interno - antecedentes educacionais ou interesse na indústria?
2.4. Já identificou alguns Setores?
2.5. Agências
2.6. Mantenha a mente aberta
3. Durante o Estágio
3.1. Investigação
3.2. Código de vestuário
3.3. O que trazer consigo
3.4. Horário de expediente e chegada no primeiro dia
3.5. Gerir expectativas
4. O Primeiro Dia
4.1. Chegar lá
4.2. Encontro com os seus colegas
4.3. Saúde e segurança
4.4. Visita ao local de trabalho
4.5. O seu posto de trabalho
4.6. Arranjos de almoço
4.7. Fim do dia
4.8. O seu Mentor
4.8.1. Finalidade
4.8.2. Formatos
4.8.3. Questões que deve levantar
4.8.4. Coisas para não mencionar
5. O seu patrão
5.1. Quem é o seu patrão?
5.2. Relação (In?)formal
5.3. Questões disciplinares
5.4. Os seus Colegas
5.4.1. Conhecer os colegas
5.4.2. Pedido de ajuda
5.4.3. Problemas com os colegas
5.4.4. Longe do escritório
5.4.5. Voos e relações
5.5. Meios de comunicação social e o local de trabalho
5.5.1. Política da empresa
5.5.2. Acesso aos meios de comunicação social no trabalho
5.5.3. Utilização das redes sociais para fins comerciais
5.5.4. Colegas Amigos
5.5.4.1. Facebook
5.5.4.2. Twitter
5.5.4.3. LinkedIn
5.5.5. Definição da privacidade
5.5.6. Observar o que se diz nas redes sociais
6. Vida Diária no Escritório
6.1. Email
6.2. Internet
6.3. Telefone
6.4. Calendários
6.5. Doença/ausência
6.6. Impacto
6.7. Férias
6.8. Etiqueta de escritório
6.9. Reuniões
7. Trabalho em rede
7.1. Colegas
7.2. Chefe e mentor
7.3. Colegas estagiários
7.4. Clientes
8. Depois do Estágio
8.1. Decidir se quer ficar
8.2. Encontro com o seu chefe/mentor
8.3. Falando com colegas
8.4. Seguindo em frente
9. As suas referências
9.1. Preparativos para a sua referência
9.2. Colocar um árbitro no seu CV
9.3. Referência escrita
9.4. Não é o todo nem o fim do todo
10. O seu NOVO CV
11. Educação ou experiência
11.1. O que incluir
11.2. O que deixar de fora
12. Permanecer em contacto
12.1. Registo oficial
12.2. Email
12.3. Online
12.4. Socializar
13. Investigação e Evidências
13.1. Jogo do empurra
13.2. Impacto geracional
13.3. Competências para o Futuro
13.4. Resumindo
14. Avaliação
Quem deve inscrever-se?
A transição da Escola para o Mercado de Trabalho deve ser um passo bem amadurecido, pensado, trabalhado, por ser um salto demasiado importante para ser dado no escuro! Que competências são mais valorizadas pelos empregadores? Serão as técnicas, aprendidas no percurso universitário? E o que procura o estagiário? Adquirir mais conhecimento ou emprego? Mestrado antes ou depois do estágio? Como pode ocorrer o match?
Assim, qualquer estudante, prestes a ser licenciado, ou qualquer licenciado em geral, deve estar interessado em saber como dar os passos certos, antes, durante e depois do estágio.
1. Introdução
2. Multilayer Perceptron
2.1. Conceitos
2.2. Preparação dos dados para análise
2.3. Variável partição
2.4. Discussão dos resultados
3. Função de base radial
3.1. Conceitos
3.2. Exemplo de aplicação
3.2.1. Preparação dos Dados para Análise
3.2.2. Análise RBF
3.2.3. Clustered Boxplots
3.2.4. Curva ROC
3.2.5. Gráficos de ganhos acumulados e elevador
4. Aplicações
5. Avaliação
Quem deve inscrever-se?
A minimização de uma função de erro que envolve valores-alvo para as saídas da rede, é chamada aprendizagem supervisionada (supervised learning), uma vez que para cada padrão de entrada é especificado o valor de uma saída desejada. Uma segunda forma de aprendizagem em redes neurais, chamada aprendizagem não supervisionada (unsupervised learning), não envolve a utilização de dados alvo.As redes neurais (RN) são a ferramenta preferida para muitos aplicativos de mineração de dados preditivos devido à sua força, flexibilidade e facilidade de uso. As redes neurais preditivas são úteis, principalmente em aplicativos nos quais o processo subjacente é complexo, como:
• Prever a procura do consumidor para aperfeiçoar custos de produção e entrega.
• Prever a probabilidade de resposta ao marketing direto para determinar a quais famílias numa lista de correspondência deve ser enviada uma oferta.
• Apoiar um requerente para determinar o risco de estender-lhe crédito.
• Detetar transações fraudulentas, num banco de dados, de solicitações de seguro.
Principalmente, profissionais bancários e seguros, marketing, gestão.
1. Introdução à Modelação Multinível (Hierárquica) com IBM SPSS
1.1. IBM SPSS MIXED
1.2. Modelo ANOVA unidirecional (sem preditores)
1.3. Analisar um Modelo de Nível 1 com Preditores Fixos
1.4. Adicionar as Variáveis Explicativas de Nível 2
1.5. Examinar se um determinado coeficiente declive varia entre grupos
1.6. Adição de interações transversais para explicar a variação da inclinação
1.7. Estimativa de modelos e outras questões típicas de modelação em multinível
1.8. Efeitos de Desenho, Pesos de Amostra e a Rotina das Amostras Complexas em IBM SPSS
2. Preparação e exame dos dados para Análises Multinível
2.1. Requisitos de dados
2.2. Layout do ficheiro
2.3. Familiarização com os Comandos Básicos de Dados SPSS da IBM
2.4. Centralização (Centering) na média geral
2.5. Centralização na Média de Grupo
2.6. Verificação dos dados
2.7. Resumo
3. Definir um Modelo de Regressão multinível básico de dois níveis
3.1. Da análise de nível único à análise multinível
3.2. Construção de um modelo a dois níveis
3.3. Construção de modelos multinível com IBM SPSS Mixed
4. Modelos de Regressão Univariada de Três Níveis
5. Avaliação
Quem deve inscrever-se?
A investigação em ciências sociais representa uma oportunidade para estudar fenómenos de natureza hierárquica, ou multinível. Exemplos podem ser estudantes universitários aninhados em instituições dentro dos estados ou estudantes em idade escolar, aninhados em salas de aula dentro das escolas. As pessoas dentro de determinadas organizações podem partilhar certas propriedades, incluindo padrões de socialização, tradições, atitudes e objetivos. As interações entre os indivíduos e os seus grupos sociais dentro de vários contextos prestam-se, portanto, a numerosas investigações. A modelação multinível está a tornar-se rapidamente a abordagem analítica padrão para o exame de dados em muitas áreas (por exemplo, sociologia, educação, psicologia e gestão) devido à sua aplicabilidade a uma ampla gama de desenhos de investigação e estruturas de dados (por exemplo, aninhados, classificados, transversais e longitudinais).
Copyright © 2024 Get Results - Todos os direitos reservados.