regenerating_the_data.org 4.4 KB

Dados do Observatório Digital de Saúde e Segurança do Trabalho

São duas planilhas em formato "csv", a primeira entitulada "dados_cat.csv", contém as informações extraídas de CATs(Comunicação de Acidente de Trabalho) e possui os seguintes campos: Indicador de Acidente em Feriado, Agente Causador, Ano do Acidente, Classe da Atividade Econômica, Data do Acidente, Dia da Semana, Emitente, Hora do Acidente, Idade do Acidentado, Indicador de Óbito, Município, UF, Natureza da lesão, Ocupação, Parte do Corpo Atingida, Sexo, Tipo do Acidente, Tipo do Local do Acidente.

A segunda planilha contém dados de benefícios previdenciários, entitulada "dados_beneficio.csv", possui os seguintes campos: Código da Categoria CID, Nome de Categoria CID, Descrição da Classe do CNAE, Município do Benefício, UF do Benefício, Ano do Benefício, Idade do Beneficiário, Sexo do Trabalhador, Espécie, Despesa Total, Dias perdidos, Agrupamento da Categoria CID, Agrupamento da Categoria CID - Simplificado, Agrupamento da Categoria CID - Doença.

Os nomes dos campos nos arquivos propriamente são ligeiramente diferentes, mas estas são as definições fornecidas no próprio site.

O download de ambas as planilhas pode ser realizado em https://observatoriosst.mpt.mp.br/ na aba "Sobre", no menu lateral "Conjunto de Dados"

Dados do IBGE

Os dados obtidos do IBGE são a distribuição territorial do Brasil e as estimativas populacionais dos municípios para os anos de 2012 a 2017.

A distribuição territorial pode ser obtidade aqui, a utilizada foi a última disponível, isto é, a de 2016. O arquivo contém 3 conjuntos de dados nos formatos "xls" e "ods", que apresentam a divisão territorial do Brasil, por unidade da federação, mesorregião, microrregião, município, distrito e subdistrito. Dos três conjutos de dados disponíveis o usado foi o "DTB_BRASIL_MUNICIPIO.ods".

Desse conjunto de dados foram removidas as colunas com os códigos de áreas e foi agregado manualmente uma coluna com a região a que cada Unidade Federativa pertence e os resultado foi convertido para o formato "csv".

A estimativa populacinal para os municípios do Brasil podem ser obtidas clicando aqui. Das planilhas de cada ano só foram utilizadas as colunas "Município" e "População Estimada", acrescidas de mais uma coluna com o ano da estimativa. Assim foi gerado um arquivo "csv" para cada ano de 2012 a 2017.

GeoJSON do Brasil

Observações

Para gerar mapas foram utilizados arquivos GeoJSON do Brasil, disponíveis aqui.

Regenerando os dados utilizados nas visualizações

  • Embora no site do Observatório Digital diga que os dados compreendem o período
  • de 2012 a 2017, nos dados só constam datas de 2012 a 2016.
  • CID é a sigla para "Classificação Estatística Internacional de Doenças e
  • Problemas Relacionados com a Saúde"
  • CNAE é a sigla para Classificação "Nacional de Atividades Econômicas"

Classificação de Agente Causador

    Execute o script "summary.R" de dentre da pasta "scripts", com os arquivos "dados_cat.csv" e "brasil.csv" na pasta "data".
  • A classificação de agente causador foi obtida no site tabela14 eSocial e
  • no [[https://docplayer.com.br/132223-Tabela-3-agente-causador-da-doenca-profissional-ou-do-trabalho-descricao-da-situacao-geradora-da-doenca.html][pdf]] . Ambos são fontes não oficiais.
  • Os agrupamentos das 302 categorias foram feitos com base nos arquivos
  • mencionados acima e algumas foram criadas, mantendo ao máximo a coerência entre os elementos.
  • Para itens que não puderam ser agrupados, foram classificados como "sem classificação".
  • O agrupamento resultou numa redução de 302 classes para 75.

Classificação CNAE

Classificação CBO

Classificação parte do corpo atingida

  • link
  • link
  • As partes do corpo atingidas foram classificadas em: cabeça, tronco, membros superiores, membros inferiores, e sistemas e aparelhos. A classificação foi feita arbitrariamente.