Estes modelos permitem classificar, gerar e pesquisar por informação usando técnicas de inteligência artificial generativa.
António Branco, professor e investigador no Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa (FCUL), dedica o seu trabalho ao desenvolvimento de grandes modelos de linguagem de inteligência artificial generativa em língua portuguesa.
Os grandes modelos de linguagem como o ChatGPT são sistemas que permitem fazer uma operação bastante simples: prever a próxima palavra face a um conjunto de palavras ou a uma frase que lhes é apresentada.
No entanto, como estes modelos são treinados com um grande volume de dados, é criada em nós a ilusão de que eles estão a responder a perguntas, que estão a fazer um sumário, ou uma tradução automática.
Mas, na verdade, o que eles estão a fazer é, palavra a palavra, prever qual é a próxima palavra e colá-la às anteriores, e daí prevêem a próxima, e assim sucessivamente.
A equipa de António Branco é pioneira no desenvolvimento de grandes modelos de linguagem de inteligência artificial generativa para a língua portuguesa.
“Desenvolvemos, lançámos, e distribuímos uma primeira família de modelos a que demos o nome de Albertina, poucos meses após a divulgação do ChatGPT”, relembra.
Daí para a frente foi desenvolvida e distribuída outra família de grandes modelos de linguagem, os Gervásios, e em 2024, foram apresentados os Serafins.
Todas estas famílias têm aptidões diferentes, a Albertina é um codificador, o Gervásio é um descodificador, e os Serafins são analisadores de semelhança semântica.
Cada um tem um propósito diferente. Os codificadores têm como propósito fazer classificação da informação que lhe é dada, enquanto os descodificadores são aptos para fazer geração de texto.
Já os analisadores de semelhança semântica conseguem determinar quão semelhante é o significado entre dois pedaços de texto diferentes e podem ser usados em sistemas de recuperação de informação e em motores de busca.
Saiba mais sobre o investigador em: Linkedin | Researchgate | FCUL