Faltam buracos negros no Universo antigo, e os computadores andam atrás deles

Conceção artística de um buraco negro.

Conceção artística de um buraco negro. Os jactos de material expelido na direção perpendicular ao disco produzem intensa radiação nas frequências rádio. Os autores deste estudo são capazes de prever a deteção de radiogaláxias a partir da análise automática de imagens astronómicas utilizando técnicas de inteligência artificial.
Créditos: S. Dagnello (NRAO/AUI/NSF)

Os próximos rastreios do céu com telescópios nas frequências rádio irão captar milhões de galáxias nos primórdios do Universo, mas só ferramentas automáticas, como o algoritmo criado por uma equipa liderada pelo  Instituto de Astrofísica e Ciências do Espaço (IA), conseguirão ler esse dilúvio de dados e encontrar as galáxias com buracos negros massivos no seu centro.

Galáxias a perder de vista preenchem as imagens do Universo profundo. Que processos determinaram as suas formas, cores e populações de estrelas? Os astrónomos pensam que buracos negros primordiais foram os motores do crescimento e transformação das galáxias, e que podem explicar a paisagem cósmica que vemos na atualidade. 

“Temos de encontrar mais galáxias ativas no céu, porque há previsões de que deveriam existir muitas mais no começo da história do Universo. Com as observações atuais não temos esse número,”
Rodrigo Carvajal

Num artigo1 publicado hoje na revista científica Astronomy & Astrophysics, uma equipa internacional liderada por Rodrigo Carvajal, do Instituto de Astrofísica e Ciências do Espaço (IA) e da Faculdade de Ciências da Universidade de Lisboa (Ciências ULisboa), e que inclui dez investigadores do IA, apresenta um método de aprendizagem automática (machine learning2) que reconhece galáxias superluminosas no início do Universo. São galáxias que se pensa serem dominadas pela atividade de um buraco negro central devorador3. Segundo os autores, este será o primeiro algoritmo que prevê quando esta atividade emite também um intenso sinal nas frequências rádio.

As emissões no rádio são, em geral, distintas da restante luz da galáxia, e por vezes é difícil associá-las. Esta técnica de inteligência artificial permitirá aos astrónomos serem mais eficazes na procura das chamadas radiogaláxias4

Conjunto de radiogaláxias – galáxias com emissão significativa nas frequências rádio
Conjunto de radiogaláxias – galáxias com emissão significativa nas frequências rádio – observadas com o radiotelescópio LOFAR, sobrepostas à mesma região do céu observada na luz visível. É evidente a extensão da emissão rádio, que é distinta da parte visível da galáxia. Estas galáxias fazem parte do conjunto de galáxias utilizadas no treino do algoritmo de aprendizagem automática criado pela equipa deste estudo.
Créditos: Judith Croston and the LOFAR surveys team

O algoritmo, desenvolvido com a colaboração da empresa Closer, que atua no sector de soluções tecnológicas em ciência de dados, foi treinado com imagens de galáxias em vários comprimentos de onda da luz5. Quando testado com outras imagens, mostrou-se capaz de prever quatro vezes mais radiogaláxias do que os métodos convencionais com instruções explícitas. Como a aprendizagem automática desenvolve os seus próprios algoritmos, tentar compreender o seu sucesso pode ajudar a esclarecer os fenómenos físicos que estavam a acontecer nestas galáxias, 1,5 mil milhões de anos após o Big Bang, ou seja, quando o Universo tinha um décimo da idade atual.

“Este trabalho pode fornecer indícios dos processos que refrearam a formação de novas estrelas na segunda metade da história do Universo.”
Israel Matute

“Temos de encontrar mais galáxias ativas no céu, porque há previsões de que deveriam existir muitas mais no começo da história do Universo. Com as observações atuais não temos esse número”, diz Rodrigo Carvajal. Segundo este investigador, mais observações são necessárias para verificar se o entendimento atual sobre a evolução das galáxias ativas está correto ou tem de ser modificado.

“Também é importante a análise dos próprios modelos de machine learning e perceber o que está a acontecer dentro deles”, acrescenta Carvajal. “Quais são as propriedades mais relevantes para a decisão?

“Por exemplo, queremos saber se a propriedade mais importante para o modelo ter afirmado que é uma galáxia ativa é a luz que a galáxia emite no infravermelho, possivelmente indicativa de uma rápida formação de novas estrelas. Com isso conseguimos criar uma nova lei para distinguir entre o que é uma galáxia normal e uma galáxia ativa.”

Conceção artística de uma galáxia extremamente brilhante na luz infravermelha e tal como seria quando o Universo tinha cerca de um décimo da sua idade atual.
Conceção artística de uma galáxia extremamente brilhante na luz infravermelha e tal como seria quando o Universo tinha cerca de um décimo da sua idade atual. Esta galáxia foi detetada com o telescópio espacial no infravermelho, WISE, da NASA. Muitas outras galáxias observadas com este telescópio foram utilizadas no treino do algoritmo de aprendizagem automática criado pela equipa deste estudo.
Créditos: NASA/JPL-Caltech

O peso relativo das características das galáxias na decisão tomada pelo computador pode apontar para o que está na origem da sua intensa atividade, em particular na banda rádio. Num estudo em preparação, Carvajal está a explorar as implicações desta aparente dependência entre a emissão no rádio e a formação de estrelas.

Israel Matute, do IA e Ciências ULisboa, e segundo autor do artigo, esclarece: “Estes modelos são ferramentas matemáticas que nos ajudam a olhar na direção certa quando a complexidade dos dados aumenta. Este trabalho pode fornecer indícios dos processos que refrearam a formação de novas estrelas na segunda metade da história do Universo.” 

O LOFAR é uma infraestrutura europeia com estações de antenas nas radiofrequências em vários países e ligadas em rede.
O LOFAR é uma infraestrutura europeia com estações de antenas nas radiofrequências em vários países e ligadas em rede. É o maior radiotelescópio a operar nas frequências mais baixas (ou os mais longos comprimentos de onda) que é possível detetar a partir da superfície da Terra. Os seus dados fizeram parte do conjunto de dados de treino do algoritmo de aprendizagem automática implementado por esta equipa de investigação.
Créditos: ASTRON/LOFAR

Talvez as galáxias ativas aparentemente em falta no Universo primordial se encontrem nos milhões de dados que os modernos radiotelescópios irão produzir nos próximos anos. Futuros rastreios de extensas regiões do céu revelarão milhares de milhões de galáxias. Um exemplo é o Evolutionary Map of the Universe (EMU), que mapeará todo o hemisfério celeste sul com o radiotelescópio ASKAP, na Austrália.

A equipa liderada pelo IA está já a trabalhar com os dados de um projeto piloto deste rastreio. Uma vez aperfeiçoadas, estas ferramentas serão cruciais para processar a quantidade astronómica de dados que o futuro observatório Square Kilometre Array (SKAO) irá produzir. Portugal é membro do consórcio deste observatório, que já se encontra em construção . 

“Numa época em que a astronomia vai aceder a vastas quantidades de dados, é cada vez mais importante o desenvolvimento de técnicas avançadas para o seu processamento e análise”, diz  José Afonso, do IA e Ciências ULisboa e coautor do artigo. “No IA estamos a desenvolver e a implementar estas técnicas, para conseguir decifrar a origem das galáxias e dos buracos negros supermassivos que muitas albergam.” 

O ASKAP é um radiotelescópio, composto por várias antenas, instalado num dos desertos da Austrália
O ASKAP é um radiotelescópio, composto por várias antenas, instalado num dos desertos da Austrália. É um dos precursores do SKAO, o observatório intergovernamental de que Portugal faz parte. A quantidade de dados que está a obter sobre galáxias numa vasta extensão do céu só poderá ser tratada com ferramentas computacionais automatizadas, como a que foi desenvolvida por esta equipa.
Créditos: CSIRO Australia/ASKAP

A ideia da colaboração da empresa Closer com o IA partiu da coautora do artigo Helena Cruz, doutorada em Física e cientista de dados nesta empresa. O seu envolvimento foi fundamental para analisar e tratar os impactos das incertezas e inconsistências entre os diferentes dados – provenientes de vários telescópios e planos de observação – utilizados no treino do algoritmo de aprendizagem automática. 

“Apercebi-me que a astronomia é uma área com grandes oportunidades para exploração e desenvolvimento de modelos de machine learning, e fez-me sentido aplicar os meus conhecimentos profissionais a esta área”, diz Helena Cruz. “Partilhei este interesse com a Closer e ambas as partes mostraram imediatamente vontade nesta colaboração, que vejo como uma continuação do meu trabalho na empresa”. 

“A Closer vive do conhecimento dos seus colaboradores, é esse o seu capital”, acrescenta João Pires da Cruz, cofundador da Closer, professor e investigador. “Quanto mais desafiantes e sofisticados do ponto de vista científico forem os projetos em que os nossos colaboradores se envolverem, maior será o capital da empresa. Teremos colaboradores capazes de resolver problemas dos nossos clientes que são semelhantes ao problema do sinal das galáxias distantes.”


Mais imagens

Notas

  1. O artigo “Selection of powerful radio galaxies with machine learning”, de R. Carvajal et al., foi hoje publicado na revista Astronomy & Astrophysics, Vol. 679 (DOI: https://doi.org/10.1051/0004-6361/202245770).
  2. A aprendizagem automática (em inglês, machine learning) é um domínio das ciências da computação, e mais especificamente da inteligência artificial, que desenvolve software capaz de adquirir conhecimento e de tomar decisões autonomamente, sem instruções humanas. Uma das aplicações deste domínio é o desenvolvimento de algoritmos capazes de analisar e identificar regularidades em dados e de estimar probabilidades sobre eventos ou dados futuros. Estes algoritmos não recebem instruções diretas determinísticas, mas são baseados em modelos matemáticos estatísticos e na exposição a grandes quantidades de dados.
  3. As galáxias ativas são invulgarmente luminosas, sobretudo no seu núcleo, e em todos os comprimentos de onda do espectro eletromagnético. Há fortes evidências de que a fonte desta intensa emissão de luz, do rádio aos raios X, seja um disco de material em rápida rotação, e extremamente quente, em torno de um buraco negro com milhões de vezes a massa do Sol, e que está ativamente a atrair e a absorver matéria. Diz-se que a galáxia tem um núcleo galáctico ativo. 
  4. Rádiogaláxias são um tipo de galáxias com núcleo ativo que emitem potentes jatos de matéria, os quais brilham nas frequências rádio.
  5. O algoritmo de aprendizagem automática foi treinado com galáxias ativas já identificadas num conjunto de dados de elevada sensibilidade e resolução obtidos com o radiotelescópio LOFAR, nos Países Baixos, e também com dados na luz visível do telescópio Pan-STARRS, no Havai, e no infravermelho com o telescópio espacial WISE, da NASA. A sua eficácia foi depois testada noutra região do céu, uma faixa para a qual existem dados no visível e infravermelho com o rastreio Sloan Digital Sky Survey (SDSS) e no rádio com o radiotelescópio Very Large Array (VLA).

Contactos
Rodrigo Carvajal, Israel Matute, José Afonso

Grupo de Comunicação de Ciência
Sérgio Pereira; Ricardo Cardoso Reis; Filipe Pires (coordenação, Porto); João Retrê (coordenação, Lisboa)