Um grande modelo de linguagem (LLM, sigla em inglês) é um modelo de aprendizagem profunda treinado com uma grande quantidade de dados. Um exemplo de um LLM é o ChatGPT.
Miguel Sales Dias, professor na Escola de Tecnologias Digitais Aplicadas do ISCTE-IUL e investigador no ISTAR – Centro de Investigação em Ciências da Informação, Tecnologias e Arquitetura, é promotor do Atlantic Crossing, uma iniciativa luso-americana que visa desenvolver pós-graduações nas áreas da Cibersegurança, Inteligência Artificial e Tecnologias da Linguagem, Inovação Empresarial, e Ensino-Aprendizagem.
No âmbito desta colaboração está a ser desenvolvido um grande modelo de linguagem em crioulo de Cabo Verde.
Neste momento ainda não existe nenhum LLM nesta língua e por esse motivo, o ISCTE-IUL uniu esforços com o Centro de Estudos Pedro Pires da Universidade de Brigewater, nos EUA, para combinar o seu conhecimento de inteligência artificial e de tecnologia de linguagem com um centro de estudos cabo-verdianos para desenvolver este modelo.
Com isto vai ser possível ter um sistema que gera crioulo de Cabo Verde, e que o traduz para português europeu ou para inglês norte-americano.
O projeto Atlantic Crossing – Atravessar o Atlântico para a cooperação científica e de ensino-aprendizagem é financiado pela Fundação Luso-Americana para o Desenvolvimento (FLAD).
Este projeto resultada de uma colaboração estreita entre o ISCTE-IUL e a Bridgewater State University, uma universidade do estado de Massachusetts nos EUA, e está a ser coordenado por Miguel Sales Dias e por António Raimundo.
Saiba mais sobre o investigador em: Researchgate | Google Scholar | ISCTE-IUL