São duas planilhas em formato "csv", a primeira entitulada "dados_cat.csv", contém as informações extraídas de CATs(Comunicação de Acidente de Trabalho) e possui os seguintes campos: Indicador de Acidente em Feriado, Agente Causador, Ano do Acidente, Classe da Atividade Econômica, Data do Acidente, Dia da Semana, Emitente, Hora do Acidente, Idade do Acidentado, Indicador de Óbito, Município, UF, Natureza da lesão, Ocupação, Parte do Corpo Atingida, Sexo, Tipo do Acidente, Tipo do Local do Acidente.
A segunda planilha contém dados de benefícios previdenciários, entitulada "dados_beneficio.csv", possui os seguintes campos: Código da Categoria CID, Nome de Categoria CID, Descrição da Classe do CNAE, Município do Benefício, UF do Benefício, Ano do Benefício, Idade do Beneficiário, Sexo do Trabalhador, Espécie, Despesa Total, Dias perdidos, Agrupamento da Categoria CID, Agrupamento da Categoria CID - Simplificado, Agrupamento da Categoria CID - Doença.
Os nomes dos campos nos arquivos propriamente são ligeiramente diferentes, mas estas são as definições fornecidas no próprio site.
O download de ambas as planilhas pode ser realizado em https://observatoriosst.mpt.mp.br/ na aba "Sobre", no menu lateral "Conjunto de Dados"
Os dados obtidos do IBGE são a distribuição territorial do Brasil e as estimativas populacionais dos municípios para os anos de 2012 a 2017.
A distribuição territorial pode ser obtidade aqui, a utilizada foi a última disponível, isto é, a de 2016. O arquivo contém 3 conjuntos de dados nos formatos "xls" e "ods", que apresentam a divisão territorial do Brasil, por unidade da federação, mesorregião, microrregião, município, distrito e subdistrito. Dos três conjutos de dados disponíveis o usado foi o "DTB_BRASIL_MUNICIPIO.ods".
Desse conjunto de dados foram removidas as colunas com os códigos de áreas e foi agregado manualmente uma coluna com a região a que cada Unidade Federativa pertence e os resultado foi convertido para o formato "csv".
A estimativa populacinal para os municípios do Brasil podem ser obtidas clicando aqui. Das planilhas de cada ano só foram utilizadas as colunas "Município" e "População Estimada", acrescidas de mais uma coluna com o ano da estimativa. Assim foi gerado um arquivo "csv" para cada ano de 2012 a 2017.
Para gerar mapas foram utilizados arquivos GeoJSON do Brasil, disponíveis aqui.