Ep. 2048 António Branco – Albertina, Gervásio, e Serafim: Conheça os grandes modelos de linguagem em língua portuguesa

Estes modelos permitem classificar, gerar e pesquisar por informação usando técnicas de inteligência artificial generativa.

António Branco, professor e investigador no Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa (FCUL), dedica o seu trabalho ao desenvolvimento de grandes modelos de linguagem de inteligência artificial generativa em língua portuguesa.

Os grandes modelos de linguagem como o ChatGPT são sistemas que permitem fazer uma operação bastante simples: prever a próxima palavra face a um conjunto de palavras ou a uma frase que lhes é apresentada.

No entanto, como estes modelos são treinados com um grande volume de dados, é criada em nós a ilusão de que eles estão a responder a perguntas, que estão a fazer um sumário, ou uma tradução automática.

Mas, na verdade, o que eles estão a fazer é, palavra a palavra, prever qual é a próxima palavra e colá-la às anteriores, e daí prevêem a próxima, e assim sucessivamente.

A equipa de António Branco é pioneira no desenvolvimento de grandes modelos de linguagem de inteligência artificial generativa para a língua portuguesa.

“Desenvolvemos, lançámos, e distribuímos uma primeira família de modelos a que demos o nome de Albertina, poucos meses após a divulgação do ChatGPT”, relembra.

Daí para a frente foi desenvolvida e distribuída outra família de grandes modelos de linguagem, os Gervásios, e em 2024, foram apresentados os Serafins.

Todas estas famílias têm aptidões diferentes, a Albertina é um codificador, o Gervásio é um descodificador, e os Serafins são analisadores de semelhança semântica.

Cada um tem um propósito diferente. Os codificadores têm como propósito fazer classificação da informação que lhe é dada, enquanto os descodificadores são aptos para fazer geração de texto.

Já os analisadores de semelhança semântica conseguem determinar quão semelhante é o significado entre dois pedaços de texto diferentes e podem ser usados em sistemas de recuperação de informação e em motores de busca.

Saiba mais sobre o investigador em: Linkedin | Researchgate | FCUL

tecnologia,

90 seg

Ep. 563 Fernando Santos – Projeto INDTECH 4.0 está a preparar a Peugeot/Citroen em Mangualde para a fábrica do futuro

February 20, 2019

tecnologia,

90 seg

Ep. 1881 Rafael Pedro – Projeto desenvolve sistema de teleoperação para automatizar o carregamento de paletes para camiões

November 11, 2024

tecnologia,

90 seg

Ep. 2022 Sandro Pinto – Projeto Crosscon desenvolve sistema de cibersegurança para dispositivos da internet das coisas

May 27, 2025

Ep. 2048 António Branco – Albertina, Gervásio, e Serafim: Conheça os grandes modelos de linguagem em língua portuguesa

Related Episodes

Ep. 563 Fernando Santos – Projeto INDTECH 4.0 está a preparar a Peugeot/Citroen em Mangualde para a fábrica do futuro

Ep. 1881 Rafael Pedro – Projeto desenvolve sistema de teleoperação para automatizar o carregamento de paletes para camiões

Ep. 2022 Sandro Pinto – Projeto Crosscon desenvolve sistema de cibersegurança para dispositivos da internet das coisas