Oficina sphinx coopssol [modo de compatibilidade]

67
1 OFICINA CFES SUL/RS

Transcript of Oficina sphinx coopssol [modo de compatibilidade]

1

OFICINA CFES SUL/RS

Educador:

Décio Soares Vicente

[email protected]

Cel: (51) 8236-79512

Introduzir os profissionais nas tarefas de codificação,

tratamento e análise de dados através do software SPHINX

3

� Verificar os procedimentos de pesquisa e suaaplicação;

� Desenvolver competências de utilização doprograma SPHINX;

� Analisar sob diferentes comandos oferecidospelo SPHINX os dados coletados.

4

1. Apresentação do Software SPHINX; 2. Etapas de Pesquisa;3. Questionário Survey;4. Como Perguntar?5. Diferença Entre Enquete e Pesquisa Amostral;6. Conceitos Básicos de Estatística;7. Variável;8. Fases de Operação do SPHINX;9. Elaboração do Questionário;10.Tratamentos e Análises;11.Análise Quantitativa ou Análise Qualitativa?12.Relatório.

5

6

O olho de Horus“Decifra-me ou te devoro, qual é o enigma da esfinge?”

Marketing, Psicologia, Administração, Educação, Ciências Sociais, Serviço Social, Economia, Finanças, Saúde Pública, Pesquisa de Mercado, Pesquisa Social, Pesquisa Eleitoral, Pesquisa de Opinião, Pesquisa de Mídia, etc.

7

� Criar, definir e modificar variáveis;

� Conhecer o número de casos e calcular percentuais para cada uma das variáveis existentes em seu banco de dados;

� Calcular medidas simples e múltiplas;

� Realizar cruzamentos de variáveis;

� Gerar os mais diversos tipos de gráficos;

� Verificar a existência de associações e/ou correlações entre variáveis;

� Executar análises de variância, regressão, cluster, séries temporais, survival e muito mais.

8

9

BASE DE DADOS EXISTENTE.

� EXCEL

� ACCESS

� Dbase

� Paradox

� SPSS

� PSPP

� SPHINX10

11

� Tema (sobre o quê – e consultar o que já se sabe sobre o tema);

� Delimitação do tema (quando, onde, que aspecto);

� Justificativa (o porquê);

� Problematização (enredo que conduz à pergunta –o problema de pesquisa);

� Problema (qual é a questão, o que não é sabido);

12

� Objetivos (para quê);

� Objetivos políticos (para que fins);

� Objetivos operacionais (o que fazer para responder a pergunta/o problema de pesquisa);

� Referencial teórico (suporte conceitual);

13

� Hipóteses (suposições fundamentadas, respostas provisórias a pergunta/ o problema de pesquisa – relação causal entre variáveis –conceitos, fenômenos que variam em relação recíproca);

� Metodologia (como);� a) Selecionar a amostra (estratificação);

b) Construção do questionário;c) Construção das variáveis.

14

� Cronograma (quando);

� Orçamento;

� Ida ao campo (equipe e realização da entrevista):Pré-teste;Aplicação do instrumento de pesquisa;Checagem.

� Tratamento de dados;Digitação/inserir dados no software estatístico;Codificação das respostas (crítica);Geração de tabelas e gráficos.

15

� Análise dos dados;

� Análises descritivas e explicativas;

� Conclusões ou apenas sondagem.

� Redação do relatório

16

Survey é um instrumento de pesquisa guiado por todas as restrições lógicas possíveis, podendo diferir em termos objetivos, custos, tempo e escopo. Geralmente os surveys são utilizados para censos demográficos, pesquisas de opinião pública, pesquisas de mercado sobre preferências do consumidor, estudos acadêmicos, estudos epistemológicos, etc.

17

18

O quê? Quem? Por quê? Para quê? Como? Onde? Donde? Para onde? Quanto? Quantos? Quais?...

19

� Perguntar de forma objetiva;

� Evitar ambiguidades;

� Priorizar apenas uma questão/assunto dentro da pergunta;

� Tentar não direcionar o entrevistado.

Um bom exemplo que podemos apresentar é a pergunta utilizada no referendo sobre o desarmamento em 2005:

“O comércio de armas de fogo e munição deveser proibido no Brasil?”

20

Tende votar sim para dizer não.

� ENQUETE:

�Auto seleção = probabilidades desconhecidas;

�Possibilidade de viés;

�Sem mecanismos para perfil representativo;

�Sem limites do número de entrevistados.

21

22

� PESQUISA POR AMOSTRAGEM:

�Seleção por critérios científicos = probabilidades conhecidas;

�Mecanismos padronizados para perfil representativo;

�Menor número de entrevistas possível para a precisão pretendida (eficiência).

� UNIVERSO: População alvo

Ex.: Consumidores; eleitores; abrangência geográfica (países; regiões; municípios; etc.), etc.

23

� AMOSTRA:Parte representativa de um Universo, que conserva suas características ou atributos relevantesEx.: sexo, idade, grau de instrução, região de moradia, etc.

AMOSTRAGEM:É o processo de se colher amostras para representar determinado universo.

24

� Não probabilística:

� Intencional ou por conveniência

� Bola de neve ou cascata

� Por cotas

25

� Probabilística:

� Aleatória simples� Sistemática� Aleatória estratificada

� Por conglomerados� Área� Simples

26

� Estatística ou medida amostral: uma medida numérica que descreve alguma característica de uma amostra. É habitualmente representada por letras latinas. Por exemplo: x (média), s (desvio padrão), r

(coeficiente de correlação)

Amostra

Estatística / medida amostral

xx

Tendência Central

MédiaMediana

Moda

Quartis

Medidas

Variação

Variância

Desvio-Padrão

Coeficiente

de VariaçãoAmplitude

27

28

Tendência Central

Média Mediana Moda

� MODA: é o valor mais frequente (que possui a maior quantidade de citações);

� MÉDIA: é a soma de todos os valores numéricos dividido pela quantidade de respostas efetivas. As não-respostas não são jamais contabilizadas;

� MEDIANA: é a quantidade para a qual 50% das observações são abaixo e 50% acima. Quando as frequências de certos valores são elevados, a mediana perfeita não existe, e será então o valor do meio após classificação das observações.

29

30

Variação

Variância Desvio Padrão Coeficiente

de Variação

Variância

População

Variância Amostra

Desvio Padrão População

Desvio Padrão

Amostra

Amplitude

� AMPLITUDE: é uma medida de dispersão que pode ser definida como a diferença entre o valor maior e o valor menor de um grupo de observações. É a medida de dispersão mais simples.

� DESVIO PADRÃO: é a quantidade que caracteriza a dispersão da variável em torno da média. É a raiz quadrada da variância. A variância é a soma, para o conjunto das observações, dos quadrados do desvio entre a média e o valor para essa observação é em seguida ponderado pela quantidade de observações.

� COEFICIENTE DE VARIAÇÃO: é uma medida de dispersão empregada para estimar a precisão de experimentos e representa o desvio-padrão expresso como porcentagem da média. Sua principal qualidade é a capacidade de comparação de distribuições diferentes.

31

� Uso da curva normal

Frequência

Variável XMédia

Alta frequência

Baixa

frequência

A área sob a curva permite obter as probabilidades

33

É a característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos.

35

� Variáveis Quantitativas;

� Variáveis Discretas (número finito ou infinito). Ex.: número de filhos, etc.;

� Variáveis Contínuas (escala contínua). Ex.: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade, etc.;

36

� Variáveis Qualitativas (ou categóricas);

� Variáveis nominais (sem ordenação). Ex.: sexo, cor/etnia, etc.;

� Variáveis ordinais (hierárquicas). E.: escolaridade, etc.;

� Variáveis intervalares (escalas nominais e ordinais).

“Variável independente (x) é aquela que influencia, determina ou afeta outra variável; é fator determinante, condição ou causa para determinado resultado, efeito ou consequência; é o fator manipulado (geralmente) pelo investigador, na sua tentativa de assegurar a relação do fator com um fenômeno observado ou a ser descoberto, para ver que influência exerce sobre um possível resultado” (LAKATOS, p.137, 1994).

37

Ex: Idade e sexo

“Variável dependente (y) consiste naqueles valores (fenômenos, fatores) a serem explicados ou descobertos, em virtude de serem influenciados, determinados ou afetados pela variável independente, é o fator que aparece, desaparece ou varia à medida que o investigador introduz, tira ou modifica a variável independente; a propriedade ou fator que é efeito, resultado, consequência ou resposta a algo que foi manipulado (variável independente)” (LAKATOS, p.137, 1994).

38

Elaboração do questionário

� Definir um questionário;� Estruturar o questionário;� Produzir o questionário.

39

Tratamentos e análises

� Tabular os resultados;� Recodificar variáveis;� Analisar tabulações;� Avaliar relações;� Utilizar os métodos da

estatística descritiva;� Produzir resultados;� Editar um relatório.

Digitação ou entrada das respostas

� Digitar as respostas;� Consultar e alterar as

respostas digitadas;� Importar respostas de outro

sistema;� Exportar as respostas.

Arquivo

Editar

Estágio

Tabular dados

Recodificar

Analisar

Avançado

40

• O item Nova Enquete permite iniciar um novo trabalho;

• O item Abrir uma enquete permite retomar um trabalho já efetuado; basta selecionar no diálogo padrão de abertura de arquivos o nome do arquivo do questionário (seguido pela extensão ".QUE");

• Os quatro itens no fim do menu Arquivo, abaixo do comando Sair, permitem retomar uma das quatro últimas enquetes utilizadas.

41

QUE: contém a estrutura do questionário;

REP: contém as respostas com a exceção dos textos;

OUV: contém os textos;

TRA: contém a definição dos tratamentos: os estratos, os cruzamentos, as análises, as opções para cada tipo de tabulação;

TRI: contém o resultado do tratamento das tabulações simples e das tabulações cruzadas para a amostra total.

42

� O arquivo do questionário é armazenado, quer explicitamente (comando Salvar - gravar ou registrar - ou então Sair do menu Arquivo), quer ao passar-se para outro estágio;

� Os arquivos de respostas são automaticamente salvos à medida da digitação ou modificação de uma observação ou questionário. Os arquivos dos tratamentos e tabulações são atualizados sem a intervenção do operador.

43

• Fazer cópia de segurança (backup): pede-se um nome.

• Salvar como;

• A função não permite salvar os resultados das análises;

• Exportar os dados: um arquivo texto (ASCII - .txt) será criado com a totalidade das respostas de todas as observações;

• Converter a enquete em: escolha na lista o aplicativo de destino.

44

�Um questionário compreende:

- um cabeçalho (título, comentário, etc.);

- uma lista das questões, cada uma delas marcada por um número, um título, um nome de variável e um tipo;

- elementos de estruturação (desvios ou pulos, grupos, controles).

45

� Questão fechada única;

� Questão fechada múltipla;

� Questão fechada escalar;

� Questão aberta numérica;

� Questão aberta código;

� Questão aberta texto.

46

• Controles (questão fechada);

• Controles (questão aberta numérica);

• Controles (questão aberta código);

• Controles (questão aberta texto).

47

Os desvios ou pulos facilitam a digitação das respostas: se a resposta a uma questão (questão desvio) tem certas características (filtro do desvio), passar-se-á diretamente para uma dada questão (questão-alvo).

48

A função permite definir os parâmetros da digitação e (des)ativar os desvios ou pulos definidos no estágio de elaboração do questionário.

• Vários modos de consulta são possíveis: o modo rápido, o modo direto e o modo planilha;

• A casa Uma única categoria por linha para as questões fechadas;

• A casa Sem Enter/Return nas questões abertas texto;

49

� Tabulações simples;

� Tabulações cruzadas;

� Tabulações recapitulativas;

� Tabulações de grupos;

� Tabulações simples combinadas;

� Cruzamentos justapostos;

� Cruzamentos subdivididos;

� Tabulações de frequências quaisquer;

� Análise de médias (one-way ANOVA e teste t).

50

51

� VALORES: permite escolher a forma pela qual os dados da tabulação serão apresentados;

� TESTES: permite escolher os testes e os cálculos a serem apresentados;

� COMPARAR: permite ativar comparações de frequências, de médias, de distribuições sobre o elemento ou sobre os elementos selecionados;

� ORDENAR: permite triar ou organizar as linhas ou as colunas de uma tabulação;

� DIMENSÕES: permite modificar a exibição da tabulação;

� REAGRUPAR: permite agrupar duas ou mais linhas (ou colunas) para simplificar a tabulação;

� SUPRIMIR: ativo quando um ou vários elementos são selecionados, suprime esses elementos (linhas ou colunas) e reatualiza os cálculos;

� RENOMEAR: ativo se um único elemento foi selecionado, propõe um diálogo no qual indica-se o novo nome para a linha ou para a coluna. No caso de se tratar de um erro de ortografia, seria melhor voltar para o estágio da elaboração do questionário e corrigir o erro diretamente na enumeração das categorias (diálogo de definição das questões);

� VOLTAR: permite voltar à tabulação "bruta", todos os agrupamentos, as supressões, os aportes serão abandonados e se terá então voltado à situação inicial da tabulação.

52

Uma lista drop-down permite escolher o tipo de gráfico a ser apresentado. Botões de comandos permitem modificar a exibição. A natureza das escolhas disponíveis depende do tipo de tabulação. Sempre serão encontrados:

� o botão Opções que permite definir o tipo de informações a serem exibidas no gráfico;

� o botão Dimensões que permite configurar a dimensão ou as dimensões do gráfico.

53

54

� Teste do qui-quadrado: o qui-quadrado (Qui 2) é calculado como a soma dos quadrados dos desvios da tabela teórica (a tabela teórica é o valor da casa se a repartição estivesse equilibrada). O teste do qui-quadrado é a certeza - expressa em percentual - da dependência das duas variáveis:

Conforme o valor dessa certeza, dir-se-á que o desvio é muito significativo (1-p > 99%), significativo (99% > 1-p > 95%), pouco significativo (95% > 1-p > 85%), não significativo (1-p < 85%). Essa certeza é notada "1-p", 'p' sendo portanto o risco de erro, o qual é frequentemente utilizado como referência.

� O botão Intervalos de confiança: exibe o intervalo de confiança de cada uma das categorias;

� Enquadrar as casas significativas: se ela estiver assinalada, as casas mais importantes no cálculo do qui-quadrado serão enquadradas (até o máximo de 60%). Se a frequência for inferior à tabela teórica, a célula será exibida na cor vermelha; caso contrário, sendo superior, aparecerá na cor azul.

55

Uma tabulação cruzada (ou tabela de contingência) é uma tabulação de duas dimensões que permite confrontar duas variáveis. Cada linha corresponde a uma das categorias da primeira variável, cada coluna corresponde a uma das categorias da segunda variável. Cada casa contém o número de observações que possuem simultaneamente ambas as categorias.

56

• Os valores que podem ser exibidos numa tabela de médias são: média, desvio-padrão, soma, parte, frequência;

• A casa Sempre exibir a média: quaisquer que sejam os valores exibidos, a média relativa à casa é lembrada entre parênteses.

• Teste da média: se a casa estiver assinalada, o teste t de Student é aplicado para comparar a média da casa com a média da totalidade das observações estudadas. As casas significativamente diferentes da média são enquadradas (na cor azul se a média da casa for superior, na cor vermelha se a média for inferior à média do conjunto).

57

• O botão Novo inicia a definição de um novo estrato;

• O botão Suprimir retira o estrato selecionado da lista. O estrato corrente não pode ser suprimido;

• O botão Modificar dá acesso ao diálogo de definição de estrato. O botão está inativo para a totalidade da amostra;

• O botão Caracterizar permite dar características as observações do estrato selecionado;

• O botão Aplicar: o estrato selecionado torna-se o estrato corrente.

58

Qualiquantitativa

59

� A Análise Léxica é a forma de verificar determinado alfabeto. Quando analisamos uma palavra, podemos definir através da análise léxica se existe ou não algum caráter que não faz parte do nosso alfabeto, ou um alfabeto inventado por nós.

60

� A Análise de Conteúdo tem como objeto de estudo a linguagem. Em razão disto, foi muito usada em estudos de mensagem escrita, num primeiro estágio. Posteriormente, foi empregada na análise de comunicações não verbais, a Semiologia. Finalmente, abrangeu trabalhos de índole linguística.

� A coerência das respostas;

� O sentido total do texto (ideia central);

� As expressões;

� Vocabulário;

� Palavras chaves.

61

62

Análise das questões abertas ou de textos

Análise de Conteúdo

Codificar

Interpretar

Ler

Análise Léxica

Corpo

Estatística Lexical

Léxico

Navegação Lexical

� CONFIABILIDADE: a leitura deve ser objetiva, minimizando as diferenças dos pontos de vista;

� VALIDADE LÓGICA: o conteúdo realmente reproduz a realidade dos fatos?

� INFERÊNCIA: algumas expressões possuem mais de uma interpretação, portanto elas merecem maior atenção;

� VALIDADE EMPÍRICA: atenção ao traçar conclusões, pois o resultado é sempre relativo.

63

� HOMOGÊNEAS: não misturar “alhos-com-bugalhos”, cada categoria é uma ideia central exclusiva;

� EXAUSTIVA: esgotar a totalidade do texto, com a classificação do conteúdo;

� EXCLUSIVAS: um mesmo elemento do conteúdo não pode ser classificado em mais categorias diferentes;

� OBJETIVAS: codificações diferentes devem chegar a resultados iguais – chegar a consensos e percepções comuns;

� ADEQUADAS OU PERTINENTES: as regras devem ser adaptadas ao conteúdo e ao objetivo.

64

65

Corpo do Texto

Corpo do Texto Lematizado

Navegação Léxica

Reduzindo e Estruturando

o Léxico

Medidas Lexicais:

Intensidade banalidade

Variáveis fechadas do léxico

Verbatim

Estrutura Estatística

Os resultados das análises (tabelas, gráficos, comentários, listas, etc.) não são armazenados. Precisam ser exportados ou transferidos para outros aplicativos (editor de texto ou planilha, por exemplo).

66

Décio Soares Vicente

[email protected]

Cel: (51) 8236-7951

Skype: decio_vicente 67