AnaliseCriminal_Mod3
Short Description
Download AnaliseCriminal_Mod3...
Description
Análise Criminal
Curso Análi Análise se Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 1
Módulo 3 – Análise estatística crimi nal Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para compreender melhor as técnicas utilizadas na análise estatística criminal. Ao fi nal do módu mó dulo lo,, você vo cê dever d everá á ser capaz cap az de: - Definir os principais principais conceitos relacionados à estatística; - Correlacionar as séries estatísticas aos fatores básicos que a estruturam; - Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Identificar as técnicas t écnicas utilizadas utilizadas na estatística descritiva; e - Definir análise de regressão. O conteúdo deste módulo está dividido em cinco aulas: Aula Au la 1 – 1 – Conceitos básicos básicos Aula Au la 2 – 2 – Séries estatísticas estatísticas Aula Au la 3 – Apresentação dos dados Aula Au la 4 – 4 – Estatística descritiva descritiva Aula Au la 5 – 5 – Análise de regressão Aula Au la 1 - Conc Co nceit eit os básic bás icos os O termo estatística estatística surgiu da expressão em latim – latim – statisticum collegium – que significa palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e segurança pública. Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística. - População: População : É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.
- Censo: Censo : É uma coleção de dados relativos a todos os elementos de uma população. Curso Análi Análise se Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 2
Módulo 3 – Análise estatística crimi nal Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para compreender melhor as técnicas utilizadas na análise estatística criminal. Ao fi nal do módu mó dulo lo,, você vo cê dever d everá á ser capaz cap az de: - Definir os principais principais conceitos relacionados à estatística; - Correlacionar as séries estatísticas aos fatores básicos que a estruturam; - Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Identificar as técnicas t écnicas utilizadas utilizadas na estatística descritiva; e - Definir análise de regressão. O conteúdo deste módulo está dividido em cinco aulas: Aula Au la 1 – 1 – Conceitos básicos básicos Aula Au la 2 – 2 – Séries estatísticas estatísticas Aula Au la 3 – Apresentação dos dados Aula Au la 4 – 4 – Estatística descritiva descritiva Aula Au la 5 – 5 – Análise de regressão Aula Au la 1 - Conc Co nceit eit os básic bás icos os O termo estatística estatística surgiu da expressão em latim – latim – statisticum collegium – que significa palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e segurança pública. Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística. - População: População : É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.
- Censo: Censo : É uma coleção de dados relativos a todos os elementos de uma população. Curso Análi Análise se Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 2
- Amostra: Amostra: É uma coleção de dados relativos a uma parte da população que a representa. É usada, na maioria das vezes, por causa da impossibilidade e dos custos de coletar informações de todos os elementos da população. - Variáveis: Variáveis : São objetos que servem para guardar informações e permitem dar nomes a cada uma das partes da informação que se quer guardar. Por exemplo, tratando-se de vitimização dos indivíduos, há como variáveis distintas: quantos crimes o indivíduo sofreu, sua escolaridade, seu gênero, sua idade, etc. - Fluxo de execução da análise estatística: estatística : O trabalho de análise estatística resulta da execução de quatro etapas dispostas conforme o diagrama abaixo: coleta, crítica, apresentação e análise dos dados. A execução do fluxo da análise estatística envolve sempre a possibilidade de se ter que retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes para garantir uma boa compreensão do fenômeno estudado. Figura 6: Fluxo da execução da análise estatística
Apres Ap resent ent ação de dados Coleta de dados
Crítica de dados
Elaboração de tabelas
Análi An áli se
Elaboração de ráficos Elaboração d e m a as Elaboração do próprio conteudista.
Coleta de Dados – Após a definição do problema a ser estudado e o estabelecimento do projeto de pesquisa (objetivo, a forma pela qual os dados serão coletados, cronograma das Curso Análi Análise se Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 3
atividades, custos envolvidos, exame das informações disponíveis e delineamento da amostra), o passo seguinte é a coleta de dados, que consiste na busca ou compilação das informações em variáveis, componentes do fenômeno a ser estudado. Crítica dos dados – A revisão crítica dos dados procede com a finalidade de identificar e suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros enganos. Esses valores podem ocorrer, principalmente, por problemas de preenchimento ou digitação dos questionários. Apresentação dos dados – Convém que sejam organizados em conjunto de dados de forma prática e racional, para facilitar sua apresentação no formato de tabelas, gráficos ou mapas. A execução dessa etapa ocorre de forma interligada à próxima etapa referente à análise dos dados, pois com o desenvolvimento da análise é possível descobrir outras tabelas, gráficos ou mapas que sejam necessários para uma melhor compreensão do fenômeno estudado. Análise – Análise das informações produzidas a partir da leitura das tabelas, gráficos e mapas, sistematizando as conclusões em um relatório. Elaboração de tabelas / Elaboração de gráficos / Elaboração de mapas - Estatística descritiva: São técnicas analíticas utilizadas para resumir e apresentar os dados de uma pesquisa, visando descrevê-la. Estatística Descritiva: são técnicas analíticas utilizadas para resumir e apresentar os dados de uma pesquisa, visando descrevê-la. A execução desse fluxo da análise estatística envolve sempre a possibilidade de se ter que retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes para garantir uma boa compreensão do fenômeno estudado. Aula 2 - Séries estatísticas Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação, ou seja, uma seqüência de números que se refere a uma certa variável. Três fatores básicos estruturam a construção de séries estatísticas: Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 4
- Época – Fator temporal ou cronológico a que se refere o fenômeno analisado; - Local – Fator espacial ou geográfico onde o fenômeno acontece; e - Fenômeno – Espécie do fator que é descrito.
Esses fatores levam a existência de quatro tipos distintos de séries estatísticas: série temporal, série geográfica e série específica. Síntese dos t ipos de séries estatísticas SITUAÇÃO
TEMPORAL
GEOGRÁFICA
ESPECÍFICA
Época
Local
Fenômeno
Local e fenômeno
Época e fenômeno
Época e local
Parte variável Parte fixa
Elaboração do próprio conteudista.
Série temporal A série temporal (cronológica, histórica, evolutiva ou marcha) é identificada pelo caráter variável do fator cronológico. Tabela 2 – Existência de plantão 24 horas nas DEAMs (Brasil-2003/2005) Existência de plantão 24 horas
2003
2004
2005
N. Abs.
%
N. Abs .
%
N. Abs .
%
SIM
61
21,11
54
20,22
41
18,39
NÃO
228
78,89
213
79,78
182
81,61
Total
289
100,00
267
100,00
223
100,00
Fonte: MJ/SENASP
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 5
Série geográfica A série geográfi ca (territoriais, espaciais ou de localização) é identificada pelo caráter variável do fator loc al. Unidades da Federação
Acre Alagoas Amapá Amazonas Bahia Ceara Distrito Federal Espírito Santo Goiás Maranhão Mato Grosso Mato Grosso do Sul Minas Gerais Para Paraíba Paraná Pernambuco Piauí Rio de Janeiro Rio Grande do Norte Rio Grande do Sul Rondônia Roraima Santa Catarina São Paulo Sergipe Tocantins
Homicídios Dolosos Taxas Vítimas / Vítimas 100mil hab. 152 22,1 1.592 52,2 191 31,0 689 20,8 3.138 22,5 1.677 20,4 646 27,1 1.699 49,0 1.298 22,6 771 12,5 739 25,9 658 28,6 3.594 18,5 1.945 27,4 807 22,3 2.897 27,9 4.215 49,6 402 13,2 5.992 38,5 405 13,3 1.972 18,0 445 28,5 64 15,9 649 10,9 7.274 17,7 560 28,0 192 14,4
Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.
Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 6
Série específi ca A série específica (categórica ou por categoria) é identificada pelo caráter variável do fator fenômeno. Indicadores criminais
Número de ocorrências
Taxa por 100 mil hab. (1)
Crimes violentos letais e intencionais
40.974
23,6
Crimes violentos não-letais contra pessoa
61.232
35,2
Crimes violentos contra o patrimônio
903.773
519,6
Delitos envolvendo drogas
87.170
50,1
Delitos de trânsito
320.265
184,1
Homicídios dolosos
38.180
22,0
Tentativas de homicídio
36.080
20,7
Lesões corporais
696.774
400,6
Estupros
14.557
16,5
Atentados violentos ao pudor
10.355
7,8
Extorsões mediante seqüestro
475
0,4
Roubos
903.298
519,4
Furtos
2.022.896
1.163,1
Tabela 4 – Ocorrências registradas pelas polícias civis por número e taxas por 100 mil habitantes (Brasil – 2005) - Fonte: MJ/SENASP.
Aula 3 – Apresentação dos dados Uma vez que os dados foram coletados, deve-se ter atenção ao examiná-los, pois, muitas vezes, o conjunto de valores é extenso e desorganizado e há risco de se perder a visão global do fenômeno analisado. Para que isso não ocorra, é interessante reunir os valores em tabelas, gráficos ou mapas, facilitando sua compreensão. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 7
Um dos objetivos da construção de tabelas é sistematizar os valores que uma ou mais variáveis podem assumir , para que tenhamos u ma visão gl obal da sua variação . A tabela é uma maneira de apresentar resumidamente um conjunto de dados.
Construção de tabelas Tabela 5 – Unidades operacionais do s corpos de bomb eiros mi litares (Brasil - 2004) Título da tabela - Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? e Onde? – localizado no topo da tabela, além de contar a palavra “TABELA” e sua respectiva numeração. Corpo da tabela - É o conjunto de linhas e colunas que contêm informações sobre a variável em estudo. A substituição de uma informação da tabela pode ser feita pelos seguintes sinais: (...) informação é coletada, mas não está disponível; (–) informação não coletada e (?) quando há dúvida da validade da informação. Tipos de unidades operacionais do s corpos de bombeiros
Número de unidades operacionais N.Abs
(%)
Batalhões e grupamentos
190
17,6
Companhias e subgrupamentos
279
25,8
Centros executores de atividades operacionais
361
33,4
Destacamentos com sede própria e pelotões independentes
252
23,3
Total de unidades operacionais
1082
100,0
Fonte: MJ/SENASP. Rodapé Elementos complementares da tabela: Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 8
a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados numéricos; b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo da tabela; e c) Chamadas: Símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.
Construção de gráficos A construção de gráficos atende as mesmas finalidades da construção das tabelas – representar os resultados de forma simples, clara e verdadeira, demonstrar a evolução do fenômeno em estudo e observar a relação dos valores analisados. A disposição dos elementos é idêntica a das tabelas. - Título do g ráfico Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? e Onde? – localizado no topo do gráfico, além de contar a palavra “GRÁFICO” e sua respectiva numeração. - Corpo do gr áfico É a representação gráfica da análise efetuada. - Rodapé Elementos complementares do gráfico: a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados numéricos; b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo do gráfico; e c) Chamadas: Símbolo remissivo atribuído a algum elemento do gráfico que necessita de uma nota específica. Tipos de gráficos
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 9
Gráficos em colunas Conjunto de retângulos dispostos verticalmente, separados por um espaço. Gráfico 2 – Percentual dos custos da violência e criminalidade em relação ao PIB Municipal (São Paulo – 1999, Rio de Janeiro – 1995 e Belo Horizonte – 1999)
6
5 l a p i c i n 4 u M B I P o 3 d l a u t n e 2 c r e P
1
0 São Paulo
Rio de Janeiro Municípios
Fonte: CRISP, ILANUD e ISER
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 10
Belo Horizonte
Gráficos de Barras
Conjunto de retângulos dispostos horizontalmente, separados por um espaço. Gráfico 3 – Percentual da população que considera que a polícia faz um bom trabalho (34 países – 2002)
Fonte: Nuttall et al. 2002 .
Gráficos em setores Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 11
Representação através de um círculo, por meio de setores, sendo muito utilizado quando se quer comparar cada valor de uma série com o seu total (proporção). Gráfico 4 – Percentual dos IMLs que possuem verba própria e percentual dos IMLs conforme cobertura das despesas de manutenção pelas verbas próprias (Brasil - 2003) Existência de verba própria
Sim ( 16%) Sim ( 18%)
Não ( 84%)
Não ( 82%)
Verba própria cobre todas as despesas de manutenção
Fonte: MJ/SENASP. Gráficos em de linhas ou curvas Utilizado principalmente para representar séries temporais. Gráfico 5 – Taxa de homicídios por 100 mil habitantes (Brasil – 1980/2005) 0 3 8 2 6 l 2 i m 0 4 0 2 1 r 2 o 2 p s 0 o 2 i d i c 8 i 1 m o h 6 a 1 x a t 4 1 2 1 0 1 0 8 9 1
3 8 9 1
6 8 9 1
9 8 9 1
1 9 9 1
5 9 9 1
ano
Fonte: MS/SVS. Aula 4 – Estatística descritiva
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 12
8 9 9 1
0 0 0 2
3 0 0 2
5 0 0 2
Como você estudou na aula 1, a análise descritiva envolve técnicas para organizar, resumir e descrever os dados de uma pesquisa. Para facilitar a descrição dos dados são utilizados alguns parâmetros, apresentados a seguir, de forma didática, divididos em cinco grupos: - Parâmetros para comparação relativa; - Distribuição de freqüência; - Medidas de tendência central; - Medidas de dispersão; e - Análise de correlação. Parâmetros para comparação relativa Proporção É obtida a partir do cálculo de uma parte do conjunto sobre o seu total . Considere 10 pessoas retidas em uma delegacia, das quais 4 são homens. A proporção de homens é de 4/10 = 0,4, ou seja, temos 0,4 homens por pessoa retida na delegacia. Considere que 20 ocorrências são registradas em um município, das quais 10 são homicídios dolosos. A proporção de homicídios é de 10/20 = 0,5, ou seja, 0,5 homicídios por ocorrência registrada no município. Porcentagem As porcentagens são obti das a partir do cálculo das proporções , simplesmente multiplicando-se o quociente obtido por 100. A palavra porcentagem significa “por cem”. Uma vez que a soma das proporções é a igual a 1, a soma das porcentagens é igual a 100, a menos que as partes não sejam mutuamente exclusivas e exaustivas. Assim, nos exemplos de proporção, há 40% de homens entre as pessoas retidas e 50% de homicídios entre as ocorrências registradas no município. Razão Definida a razão de um número A em relação a um número B como “A dividido por B”, como por exemplo, a razão de policiais por viatura no Brasil é de (policiais)/(viaturas) = 618.613 / 76.074 = 8,13, ou seja, há 8,13 policiais por viatura. Resta esclarecer que a razão busca relacionar quantidades de itens diferentes, como: policiais por viatura, PIB por habitantes, recursos financeiros gastos pela polícia militar pelo total do efetivo da polícia militar, etc.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 13
Tabela 6 – Gastos das po lícias milit ares segundo tip o de gasto (Brasil – 2005) Fonte: MJ/SENASP
.
Cálculos da proporção, porcentagem e razão – Tabela 6 - Proporção de gastos com a folha de pagamento 5.516.952.440,11
Gasto com a folha de pagamento Gasto total
= 0,91
6.005.508.679,78
Para cada real gasto pelas polícias militares, 91 centavos são referentes à folha de pagamento
- Porcentagem de gastos com a folha de pagamento: 0,91 x 100 = 91% Cerca dos 91% dos gastos das polícias militares são referentes à folha de pagamento.
Razão de gastos com folha de pagamento por gastos com aquisição de viatura.
Folha de pagamento Aquisição de viaturas
5.516.952.440,11 79.226.268,00
= 69,63
Para cada um real gasto com aquisição de viatura são gastos R$ 69,63 com a folha de pagamento.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 14
Tipo de gasto das polícias militares
Valor gast o (R$)
Folha de pagamento
R$ 5.516.952.440,11
Material de consumo
R$ 162.438.522,90
Aquisição de viaturas
R$ 79.226.268,00
Outros
R$ 246.891.448,77
Total
R$ 6.005.508.679,78
Tabela 7 – Efetivo das polícias ci vis, segundo a categoria pr ofissional (Brasil – 2005) Fonte: MJ/SENASP. Categorias profissionais Polícia Civil
Total do efetivo
Delegado
5.479
Inspetor
9.655
Investigador e detetives
15.162
Agente
16.517
Papiloscopista
2.170
Escrivão
10.764
Carcereiro
2.145
Outros
8.988
Total Fonte: MJ/SENASP.
70.880
Cálculos da prop orção, porcentagem e razão – Tabela 7 - Proporção de investigadores e detetives:
15.162
= 0,23
70.880
Para cada profissional do efetivo da polícia civil, existem 0,23 investigadores e detetives. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 15
- Porcentagem de investigadores e detetives:
0,23 x 100 = 23%
Cerca dos 23% do efetivo da Polícia Civil são investigadores e detetives. Razão do efetivo de escrivães pelo efetivo de delegados:
10.764 = 1,9 5.479
Para cada delegado existem 1,9 escrivães.
Distribui ção de freqüências
A distr ibuição de freqüência é o conjunto de men surações de freqüências para os dados observados.
- Freqüência absoluta: É o número de vezes que o valor de uma determinada variável é observado. - Freqüência absolut a acumulada: É a soma das freqüências absolutas dos valores inferiores ou iguais ao valor dado. - Freqüência relativa: É a razão da freqüência absoluta pelo número total de observações. - Freqüência relativa acumulada: É a soma das freqüências relativas dos valores inferiores ou iguais ao valor dado. - Distribuição de freqüência: É uma forma de apresentar as freqüências. São apresentadas as variáveis seguidas de suas freqüências absolutas.
Exemplo - Número de homicídios oc orridos em 16 cidades distint as
Tabela 8 – Distribuição de freqüência dos homicídios Elaboração do próprio conteudista.
Cidades
Homicídios
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Cidades
Homicídios
Página 16
Cidade 1
3
Cidade 9
5
Cidade 2
9
Cidade
6
10 Cidade 3
0
Cidade
8
11 Cidade 4
3
Cidade
10
12 Cidade 5
4
Cidade
12
13 Cidade 6
5
Cidade
12
14 Cidade 7
5
Cidade
14
15 Cidade 8
5
Cidade
18
16
Número de Freqüência homicídios
absoluta
Freqüência absoluta acumulada
Freqüência relativa
Freqüência relativa acumulada
0
1
1
0,0625
0,0625
3
2
3
0,1250
0,1875
4
1
4
0,0625
0,2500
5
4
8
0,2500
0,5000
6
1
9
0,0625
0,5625
8
1
10
0,0625
0,6250
9
1
11
0,0625
0,6875
10
1
12
0,0625
0,7500
12
2
14
0,1250
0,8750
14
1
15
0,0625
0,9375
18
1
16
0,0625
1,00
Total
16
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 17
1,00
Distribui ção de freqüências - Freqüência absoluta: Na primeira coluna foram colocados, em ordem crescente, todos os possíveis números de homicídios ocorridos em 16 cidades. Na segunda coluna, aparecem quantas cidades sofreram aquele número de homicídios. Na tabela 8, a freqüência absoluta de 0 homicídio é um, ou seja, das 16 cidades analisadas somente uma delas teve 0 homicídio. A freqüência absoluta de 3 homicídios é dois, ou seja, duas cidades tiveram 3 homicídios. A freqüência absoluta de 4 homicídios é um, ou seja, uma cidade teve 4 homicídios, e assim por diante. - Freqüência absoluta acumulada: Foi construída a terceira coluna da tabela 8, somando a cada linha a freqüência absoluta. Na primeira linha, a freqüência absoluta acumulada coincide com a freqüência absoluta (1). Na segunda linha soma-se a freqüência absoluta acumulada da primeira linha (1) com a freqüência absoluta da segunda linha (2), obtendo uma freqüência acumulada 3. Na terceira linha, soma-se a freqüência absoluta acumulada anterior (3) com a freqüência absoluta dessa categoria (1), sendo a freqüência acumulada igual a 4, e assim por diante.
- Freqüência relativa: A freqüência relativa é dada pela divisão da freqüência absoluta da categoria pelo número total de cidades, obtendo-se o percentual das cidades que sofreram aquele número de crimes. Para obter a freqüência relativa de 0 homicídio divide-se a freqüência absoluta dessa categoria (1) pelo total (16) – (1)/(16) = 0,0625, ou seja, 0,0625 das cidades têm 0 homicídio. Da mesma forma encontra-se que 0,125 das cidades têm 3 homicídios, 0,625 das cidades têm 4 homicídios, 0,25 das cidades têm 5 homicídios. Multiplicando a freqüência relativa por cem, encontra-se a porcentagem das cidades com determinado número de homicídios. Por exemplo: 0,0625 x 100 = 6,25, ou seja, 6,25% das cidades não sofrem homicídios.
- Freqüência relativa acumulada: É obtida de forma similar a freqüência absoluta acumulada, ou seja, somando a cada linha a freqüência relativa das categorias dos números de homicídio. Na primeira linha, a freqüência relativa acumulada coincide com a freqüência relativa. Na segunda linha ao se somar a freqüência relativa acumulada da primeira linha (0,0625) com a freqüência relativa da segunda linha (0,125), resulta na freqüência acumulada de 0,1875.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 18
Gráficos utilizados na distribuição de freqüênciaHistograma é um gráfico de barras justapostas, com a área das barras proporcional à freqüência absoluta. Exemplo: Gráfico 6 – Histograma da distribuição de homicídios por cidade 7 6
a t u l o s b A y a i c c n n ê e u q u e q r F e
r F
5
4 3 2
1 0 0 ,0
5 ,0 2 ,5
10,0 7 ,5
15,0 12,5
17,5
de Homicídios V A R 0 0 Número 001
Elaboração do próprio conteudista.
Gráficos utili zados na distri buição de freqüência - Polígono de freqüência: É a representação gráfica de uma distribuição de freqüências absolutas. São gráficos de linhas que unem os pontos médios das bases superiores dos retângulos de um histograma. - Polígono de freqüência acumulada: É a representação gráfica de uma distribuição de freqüências absolutas acumuladas. São gráficos de linhas que unem os pontos correspondentes ao limite superior da freqüência acumulada.
Gráfico 7 – Polígonos de freqüência e freqüência acumulada relativos a distribuição de homicídios por cidade
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 19
18
Polígono de freqüência Polígono de freqüência acumulada
16
14
12
10 a i c n ê ü q e r F
8
6
4
2
0 0
3
4
5
6 8 9 Número de homicídio
10
12
14
18
Elaboração do próprio conteudista. Medidas de tendência central São indicadores que resumem a distribuição de um conjunto de dados e devem ser utilizados quando se pretende comparar distintos grupos de dados, como por exemplo, comparações entre diferentes regiões ou comparações de uma mesma região em tempos distintos, dentre outras situações.
- Média: É a soma de todos os resultados dividida pelo total dos casos. - Moda: É a observação que ocorre com maior freqüência em uma amostra. - Mediana: É o valor da variável que ocupa a posição central nos dados, ou seja, que divide a amostra ao meio. Exemplo: Considerando os dados hipotéticos da aula anterior, mostrados na tabela 8, as medidas de tendência central em relação à distribuição de homicídios por cidade é: Variável Número de homicídio
Média 7,4375
Moda Mediana 5
5,5
Elabora ão do ró rio conteudista. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 20
Como calcular a média, a moda e a mediana
Média Somam-se todos os homicídios ocorridos e divide-se por 16, que é o número de ci dades. Média = (0+3+3+4+5+5+5+5+6+8+9+10+12+12+14+18)/16 = 119/16 = 7,4375
Mediana: Há duas fórmulas para calcular a mediana: - número de observação par: Mediana = (X(n/2)+ X[(n/2)+1] )/2 - número de observação ímpar: Mediana = X[(n+1)/2] Para o cálculo da mediana, o primeiro passo é a ordenação crescente das observações, como mostrado no exemplo anterior (cálculo da média). Após a ordenação das observações, identifica-se cada uma delas por um índice numérico. No exemplo citado X 2 é igual a 3, ou seja, a cidade 2, nesta seqüência de cidades em ordem crescente de número de homicídios, possui 3 homicídios. No mesmo exemplo, a mediana é calculada da seguinte forma: Mediana = (X (n/2)+ X[(n/2)+1])/2 = (X(16/2) + X[(16/2)+1] )/2 = (X8+ X9)/2 = (5 + 6)/2 = 11/2 = 5,5
Moda: O valor que ocorreu com maior freqüência absoluta . No exemplo citado, o valor 5 ocorreu mais vezes, 4 vezes.
Outros conceitos Para compreender melhor os cálculos das medidas apresentadas, conheça mais três - Taxa bruta - é o estimador mais simples para o risco de ocorrência de um evento, definindo-se como a razão entre o número de eventos ocorridos na área e o número de pessoas expostas à oco rrência desse evento . O cálculo da taxa é desenvolvido quando se precisa comparar a incidência de fenômenos entre diferentes regiões, com tamanho populacional diferente, ou uma mesma região onde a população varia com o tempo. O valor da taxa é calculado pela divisão do número de vítimas efetivas pelo tamanho da população de Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 21
risco, ou seja, pelo tamanho da população que poderia sofrer esse crime, e o valor obtido é multiplicado por 100 mil.
Quartis São os valores que determinam uma divisão do conjunto de dados em quatro partes iguais. Decis São os valores que determinam uma divisão do conjunto de dados em dez partes iguais. Exemplo Veja a tabela 10 em anexo – Ocorrências de estupro registradas pelas polícias civis segundo unidade da federação (Brasil – 2005) Diferente da maior parte das ocorrências criminais, os estupros vitimam apenas mulheres e, por essa razão, o cálculo de sua taxa tem como denominador a população feminina. O cálculo da taxa de estupros em Rondônia é efetuado pela seguinte fórmula: número de estu ro ocorridos em Rondônia x 100.000 = 224 (população feminina em Rondôni a)
x (100.000) = 30,03 745.802
A importância do cálculo da taxa é verificada, por exemplo, quando observam que apesar da Polícia Civil de São Paulo ter registrado 3.903 vítimas de estupro, em 2005, a unidade da federação com maior incidência de estupros foi Roraima, com apenas 81 ocorrências registradas. Dado a diferença do tamanho da população dessas UFs, em São Paulo foram 18,9 vítimas para cada grupo de 100.000 mulheres e, em Roraima, 42,4 vítimas para cada grupo de 100.000 mulheres. Cálculos Para se determinar a taxa de uma região geográfica (que reúne várias UFs) não deve-se calcular a média das taxas das UFs, pois esse cálculo não leva em consideração o tamanho da população de cada UF dentro da região geográfica. O correto é somar as vítimas de todas as UFs, a população de todas as UFs e realizar o cálculo da taxa média da região geográfica. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 22
Veja a seguir a diferença gerada a partir desses dois tipos de cálculo. BRASIL, REGIÕES E
POPULAÇÃO
TOTAL DE
TAXA POR
UNIDADES DA
FEMININA
OCORRÊNCIAS DE
100.000
ESTUPRO
MULHERES
FEDERAÇÃO Região Sudeste
40.064.296
6.419
16,02
Minas Gerais
9.721.532
1.047
10,77
Espírito Santo
1.719.969
140
8,14
Rio de Janeiro
8.001.992
1.329
16,61
São Paulo
20.620.803
3.903
18,93
Taxa da Região Sudeste:
6.419 x 100.000 = 16 02 40.064.296
Média das taxas das UFs da Região Sudeste:
10,77 + 8,14 + 16,61 + 18,93 = 54,45 = 13,61 4 4
Cálculos Moda: A amostra de taxa de estupro não apresenta moda, dado que as taxas de estupro entre as 27 unidades da federação não têm valores repetidos. Mediana: Como a informação de 1 das UFs não está disponível, para o cálculo da mediana devem ser consideradas apenas 26 UFs (número par de observações). Assim, a mediana será calculada através da fórmula: (X(n/2) + X[(n/2)+1] ) 2 onde X é a taxa de estupro em cada UF e n é o numero de UFs Mediana = (X(n/2)+X[(n/2)+1])/2 = (X(26/2) +X[(26/2)+1] )/2 = (X13+X14)/2 = (18,8+18,93)/2 = 18,865 Identificação dos quartis A identificação dos quartis pode ser exemplificada da seguinte forma
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 23
4,94 6,27 7,32 8,14 8,89 10,52 10,77 11,27 11,44 11,74 16,61 16,91 18,8 18, 93 19,12 20,27 20,77 22,89 25,38 27,08 27,53 30,03 32,2 32,96 36,81 42,4
Q1
Q2
Q3
Figura 7: Identificação dos quartis para a distribuição de estupros entre as unidades da federação (Brasil / 2005) - Fonte: MJ/SENASP e IBGE. Brasil/2005A Secretaria Estadual de Segurança Pública do Paraná não encaminhou informações sobre as ocorrências de estupros no ano de 2005 para a SENASP. Portanto, essa unidade da Federação não foi considerada nos cálculos. Medidas de dispersão É um conj unto de medidas que descrevem a variabilidade de um conjunto de dados e permite verificar como os dados estão distr ibuídos em torn o da tendência central. São m edidas de dispersão: amplitude, variância e desvio p adrão. Para que você entenda melhor os cálculos das medidas de dispersão, volte aos dados hipotéticos da tabela 8. - Amplit ude:
É a diferença entre o maior e o menor valor dos dados analisados . Se os
dados são categóricos, a amplitude é a diferença entre o limite superior da última categoria e o limite inferior da primeira categoria. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 24
Como calcular a Amplitude Para calcular a amplitude subtrai-se o número de homicídios da cidade 16 (18), que é o maior , do número de homicídios da cidade 3 (0), que é o menor . Amplitude = 18 – 0 = 18 Medidas de dispersão - Variância: É a medida do grau de dispersão dos dados em torno da média . Mostra o quanto agrupado ou disperso estão os dados . A variância é representada por s 2. Como calcular a variância Para o cálculo da variância na amostra, primeiramente, subtrai-se o número de homicídios em cada cidade (X i) da média da amostra ( X ) e eleva-se esse valor a segunda potência. Média = s²=[2.(3-7,4375)]²+(9-7,4375)²+(0-7,4375)²+(4-7,4375)²+[4.(5-7,4375)]²+(6-7,4375)²+(87,4375)²+(10-7,4375)²+[2(12-7,4375)]²+(14-7,4375)²+(18-7,4375)²= 119/16 = 7,4375 s²=39,3828+2,4414+5,3164+11,8164+23,7656+2,0664+0,3164+6,5664+41,6328+43,0664+111 ,5664= Em seguida, somam-se as diferenças e divide-se o resultado pelo número de observação da amostra menos um (n-1). Novamente, X i representa o número de homicídios que ocorreram na cidade i.
s² = 337,9374
= 337,9374 15
16-1
Logo: Variância =
s
2
=
( X 1 − X ) 2
= 22,52917
+
( X 2
− X
)2
+
... + ( X n
− X
)2
( n − 1)
Média: É a soma de todos os resultados dividida pelo total dos casos. Medidas de dispersão - Desvio Padrão: É obtido através da raiz quadrada da variância . Sua representação é realizada por σ.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 25
Como calcular o desvio padrão Após descobrir o valor da variância, calcula-se a sua raiz quadrada, esse resultado, é o valor do desvio padrão.
s
=
s
2
=
22,52971 = 4,74649
Todos os pacotes estatísticos, incluindo o Excel, fazem o cálculo da variância como do desvio padrão desse valor automaticamente.
Tabela 11 – Medidas de dispersão Variável Número de homicídio
Amplitude
Variância ( σ )
Desvio padrão (σ)
18
22,52917
4,74649
Elaboração do próprio conteudista.
Exemplo prático d e uso das medidas de dispersão Após o diagnóstico da situação de um estado, identifica-se que duas (2) regiões se destacam pelas altas taxas de incidência de homicídios. Comparando as medidas de dispersão das taxas municipais de homicídios para essas duas regiões, descobre-se que em uma delas os valores estão mais dispersos do que na outra região. Isto significa que na região onde os valores estão menos di spersos o problema da alta incidência de homicídios está distribuído de forma ampla, atingindo grande parte dos muni cípios da região. Na região onde os valores estão mais dispersos ocorre o contrário: a incidência de homicídios está concentrada em alguns poucos municípios e um outro conjunto signif icativo de municípios tem incid ência baixa de homicídios . Nesse caso, identificar o grau de dispersão dos dados informará se é pr eciso planejar a ação tendo como foco todos os municípios da região ou apenas alguns que têm a situação mais pr ecária. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 26
Coefici ente de c orrelação A análise de correlação tem como objetivo medir a intensidade ou grau de associação linear entre duas variáveis , sem, no entanto, determinar a relação funcional entre elas, ou seja, que uma variável é responsável pela alteração na outra . A análise é realizada através da interpretação do coeficiente de corr elação , permitindo identificar se um fator está associado a outro: se o desemprego está associado à incidência criminal, se o aumento do número de policiais está associado a uma redução da incidência de crimes e se o aumento do salário dos policiais está associado a uma melhora na eficiência dos órgãos de segurança pública, dentre outras relações. Pelo coeficiente de correlação, é possível saber se o desemprego está associado ao aumento da criminalidade, mas não é possível saber se é o desemprego que causa o aumento do cri me ou se é o aumento d o crim e que leva ao aumento no desemprego. Coeficiente de correlação Mede a intensidade de associação linear entre duas variáveis. Por exemplo, a associação entre número de homicídio e número de armas de fogo. Seu cálculo é realizado com base na variância da amostra, através da seguinte fórmula: r = sxy / (sxsy)
s xy =
∑ ( X
i
− X )(Y i − Y )
n −1
Onde: sx é o desvio padrão da variável X, no exemplo, número de homicídio. sy é o desvio padrão da variável Y, no exemplo, número de armas de fogo. A interpretação do coeficiente de correlação não permite fazer inferências (deduções). Considerando o exemplo da arma de fogo e do homicídio, suponha que o coeficiente de correlação seja 0,6, portanto positivo. Pode-se afirmar que as duas variáveis se correlacionam positivamente, mas não pode prever o número de homicídio com base no número de arma de fogo. Para se constatar a relação funcional entre as duas variáveis e fazer a inferência, é necessário a análise de regressão, apresentada na subseção seguinte. Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 27
A interpretação desse coeficiente é simples. Considerando que r é sempre um valor entre -1 e +1, temos: - Se r = 0, não existe correlação; - Quanto mais próximo de -1 ou de +1, mais forte é a correlação; - Se r < 0 existe uma correlação negativa, ou seja, quando uma variável cresce a outra decresce. No exemplo, quando o número de arma de fogo decresce, o número de homicídio cresce; e - Se r > 0 existe uma correlação positiva, ou seja, quando uma variável cresce a outra também cresce. No exemplo, quando o número de arma de fogo cresce, o número de homicídio cresce. Os pacotes estatísticos calculam o coeficiente de correlação automaticamente.
Aula 5 – Análise de r egressão A análise de regressão procura determinar a relação funcional entre duas ou mais variáveis . O termo regressão foi introduzido pela primeira vez em 1886, por Francis Galton, no estudo da relação entre as alturas de pais e filhos. Hoje, os modelos de regressão são amplamente utilizados em várias áreas do conhecimento, inclusive na análise criminal. O principal objetivo da análise de regressão é modelar o relacionamento entre uma variável (chamada de dependente) e outras variáveis (chamadas explicativas). Em outras palavras, procura determinar em que medida as variáveis explicativas se r elacionam c om a variável dependente. Para isso, estima-se o valor médio da variável dependente, a partir dos valor es das variáveis explicativas. Veja o exemplo. No exemplo apresentado no cálculo do coeficiente de correlação (associação entre número de homicídio e número de armas de fogo), não há interesse em saber somente a correlação entre a arma de fogo e o homicídio, quer se saber em que medida um aumento ou diminuição no número de armas de fogo implica no aumento ou diminuição de homicídios. Para isso, estima-se uma regressão linear considerando como variável dependente o número de homicídio e, como variável explicativa, o número de arma de fogo. Essa estimativa fornece uma equação, através da qual, é possível inferir o número médio de homicídio de acordo com o número de arma de fogo. Entretanto, como a regressão estima uma relação estatística, ela está Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 28
sempre sujeita a um erro. Toda a análise de regressão se baseia na correção desse erro estatístico através de diversos métodos que variam de acordo com o tipo e distribuição dos dados. Para realizar a análise de regressão é necessário um conhecimento avançado em estatística e em álgebra, fugindo do escopo desse curso. O conhecimento necessário para a realização de uma análise de regressão é conteúdo suficiente para a realização de um curso especifico sobre o tema. Para os interessados em aprofundar no assunto, dois manuais bastante conhecidos na área são indicados: Wooldridge (Wooldridge, J.M. Introdução à Econometria: uma abordagem moderna, São Paulo: Pioneira Thomson Learning, 2006) e Gujarati (Gujarati, D. Econometria Básica. São Paulo, Makron, 3ª edição, 2000).
Neste módulo são apresentados exercícios de fixação para auxiliar a compreensão do conteúdo. O objetivo destes exercícios é complementar as informações apresentadas nas páginas anteriores.
1. Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação. Quando o fator básico que estrutura a construção de séries estatísticas é o fator descrito, po demos dizer que esta série é: ( ) Uma série temporal. ( ) Uma série geográfica. ( ) Uma série específica. ( ) Uma série bipartida. ( ) Uma série espacial.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 29
2. Uma vez que os dados fo ram coletados, muit as vezes o con junto de valores é extenso e desorganizado e seu exame requer atenção, pois há risco de perder a visão global do fenômeno analisado. Para que isso não o corra é interessante reunir os valores em: ( ) Tabelas, organogramas e mapas. ( ) Tabelas, cronogramas e mapas. ( ) Tabelas, fluxogramas e mapas. ( ) Tabelas, gráficos e mapas.
3. A análise descritiva se constitui de técnicas utilizadas para organizar, resumir e descrever os dados de um a pesquisa. O parâmetro para a comparação relativa, obti do a partir do cálcul o de uma parte do conjunt o sobre o seu total é denominado: ( ) Porcentagem ( ) Razão ( ) Proporção
4. “ A distr ibuição de freqüência é o conjunt o de mensurações de freqüências para os dados observados. A _____________ é o número de vezes que o valor de uma determinada variável é observado”. Marque a alternativa correta que completa a frase acima na área tracejada: ( ) Freqüência absoluta acumulada. ( ) Freqüência relativa acumulada. ( ) Freqüência relativa. ( ) Freqüência absoluta. ( ) Distribuição de freqüência.
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 30
Gabarito 1. Uma série específica. 2. Tabelas, gráficos e mapas. 3. Proporção 4. Freqüência absoluta. Este é o final do m ódulo 3 Análise estatística criminal
Curso Análise Criminal – Módulo 3 SENASP/MJ - Última atualização em 22/06/2009
Página 31
View more...
Comments