Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina

Autor Vitor Martins Cernic
Orientador Laerte Sodre Junior
Tipo de programa Mestrado
Ano da defesa 2024
Palavras chave Aprendizado de Máquina
Astronomia Extragaláctica
Populações Estelares
Departamento Astronomia
Resumo

Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.

Anexo TeseMestrado_VitorCernic.pdf