Microsoft estreia Phi-2, seu novo modelo de IA

A Microsoft lança o modelo Phi-2, um marco em IA com capacidades ampliadas para diversas aplicações, marcando um salto na tecnologia
Microsoft estreia Phi-2, seu novo modelo de IA

Enquanto a Microsoft continua aportando bilhões na OpenAI, buscando acesso às inovações em IA da empresa responsável pelo ChatGPT, ela também avança no desenvolvimento de soluções autônomas em IA. Na última terça-feira (12), a gigante tecnológica sediada em Redmond divulgou o lançamento de uma versão atualizada de seu Modelo de Linguagem de Escala Reduzida (SLM), batizado de Phi, agora acessível aos usuários do Azure AI Studio. Além disso, a empresa destacou um comparativo de eficiência desta nova ferramenta frente aos seus rivais no mercado. Este passo reafirma o compromisso da Microsoft em liderar o setor de IA, combinando parcerias estratégicas e inovação interna. A iniciativa não só amplia o portfólio de produtos de IA da empresa, mas também promete revolucionar a forma como as organizações utilizam essas tecnologias, oferecendo soluções mais integradas e eficientes.

Os desfechos dos experimentos sugerem que a empresa está a caminho de criar um modelo de alta eficácia, mesmo tendo menos parâmetros comparado aos Modelos de Linguagem de Grande Escala usuais no setor. O Phi-2, em testes recentes, ultrapassou os resultados de modelos como o Llama 2 da Meta e a Inteligência Artificial Mistral em determinadas atividades, conforme avaliações benchmark. Esta conquista sinaliza um avanço significativo para a Microsoft no campo da IA, demonstrando que é possível atingir excelência em desempenho com estruturas mais enxutas. Este avanço não apenas coloca a Microsoft em uma posição de destaque no competitivo mercado de IA, mas também abre novas possibilidades para aplicações de inteligência artificial mais eficientes e adaptáveis a diferentes contextos. A estratégia adotada pela empresa reforça a ideia de que inovação e otimização podem caminhar juntas na busca por soluções de IA mais robustas e versáteis.

O Phi-2 representa um avanço na geração de conteúdo através da associação preditiva de palavras, sendo aprimorado ao longo de 14 dias com o uso de 1,4 trilhão de tokens. Este processo utilizou dados sintéticos e informações coletadas da internet, focando em processamento de linguagem natural e programação, conforme informado pela Microsoft. Desenvolvido pela equipe especializada em modelos fundamentais do setor de pesquisa da Microsoft, o Phi-2 ostenta um salto quantitativo em seus parâmetros, passando de 1,3 bilhão na primeira versão para 2,7 bilhões. Este desenvolvimento não só reflete o empenho da Microsoft em aprimorar as capacidades de IA, mas também mostra seu compromisso em liderar inovações no campo da linguagem natural e codificação. A evolução do Phi-2 em termos de complexidade e abrangência de parâmetros ressalta a busca contínua da empresa por soluções cada vez mais avançadas e eficazes em IA. Com esse modelo, a Microsoft não apenas eleva o padrão em tecnologia de linguagem, mas também abre caminho para novas possibilidades em aplicações inteligentes e diversificadas.

O volume de parâmetros que define as respostas do Phi-2 permanece notavelmente abaixo dos seus competidores diretos — por exemplo, o GPT-3.5 da OpenAI dispõe de 175 bilhões de parâmetros, enquanto as variantes do Llama 2 da Meta oscilam entre 7 e 70 bilhões. Contudo, os desempenhos apresentados pela Microsoft são notáveis. Conforme declarado pela empresa, “em testes complexos de benchmark, o Phi-2 iguala ou ultrapassa modelos até 25 vezes maiores, devido a avanços na escala do modelo e na seleção de dados para treinamento”. Essa eficiência demonstra um progresso significativo na otimização de IA, sugerindo que não é somente a quantidade, mas a qualidade e a eficácia da curadoria de dados que determinam o sucesso de um modelo. Esta abordagem inovadora da Microsoft destaca a importância de métodos inteligentes de treinamento e dimensionamento de modelos na era da IA. A estratégia adotada no desenvolvimento do Phi-2 pode servir de exemplo para futuras inovações no campo, mostrando como eficiência e precisão podem ser alcançadas mesmo com um menor número de parâmetros.

No processo de treinamento do modelo, utilizamos uma combinação de dados sintéticos desenvolvidos especialmente para incutir no sistema um raciocínio lógico e amplo conhecimento em áreas como ciência, atividades cotidianas e compreensão psicológica. Complementamos essa base com informações criteriosamente escolhidas da internet, priorizando a relevância educativa e a excelência do material“, destaca o comunicado no blog da Microsoft. Este método de treinamento equilibrado enfatiza a importância de uma educação abrangente para IA, visando criar um modelo não apenas tecnicamente avançado, mas também contextualmente ciente e adaptável a diferentes cenários. A estratégia da Microsoft de mesclar dados sintéticos com conteúdo da web de alta qualidade ilustra seu compromisso com a criação de modelos de IA que sejam não só poderosos, mas também culturalmente informados e eticamente responsáveis. Este enfoque inovador pode estabelecer um novo padrão para o treinamento de inteligências artificiais, priorizando uma aprendizagem holística e multidimensional.

Leia mais:

Assine nossas notícias para receber todas as novidades do mundo cripto!

Notícias

Deixe seu Comentário