Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
Autor | Vitor Martins Cernic |
Orientador | Laerte Sodre Junior |
Tipo de programa | Mestrado |
Ano da defesa | 2024 |
Palavras chave | Aprendizado de Máquina Astronomia Extragaláctica Populações Estelares |
Departamento | Astronomia |
Resumo | Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence. |
Anexo | TeseMestrado_VitorCernic.pdf |