Inteligência Artificial

O modelo Chinês que está destronando a OpenAI

Modelo chinês de raciocínio supera benchmarks em ciência, matemática e programação.

27/01/2025, 21:20

O modelo Chinês que está destronando a OpenAI
O modelo Chinês que está destronando a OpenAI
O modelo Chinês que está destronando a OpenAI

O laboratório de IA chinês DeepSeek lançou uma versão aberta do DeepSeek-R1, seu chamado modelo de raciocínio, que afirma ter um desempenho tão bom quanto o o1 da OpenAI em certos benchmarks de IA.

O R1 está disponível na plataforma de desenvolvimento de IA Hugging Face sob uma licença MIT, o que significa que pode ser usado comercialmente sem restrições. De acordo com a DeepSeek, o R1 supera o o1 nos benchmarks AIME, MATH-500 e SWE-bench Verified. O AIME utiliza outros modelos para avaliar o desempenho de um modelo, enquanto o MATH-500 é uma coleção de problemas de palavras. O SWE-bench Verified, por sua vez, foca em tarefas de programação.

Sendo um modelo de raciocínio, o R1 verifica efetivamente os fatos por conta própria, o que o ajuda a evitar algumas das armadilhas que normalmente atrapalham os modelos. Modelos de raciocínio demoram um pouco mais — geralmente segundos a minutos a mais — para chegar a soluções em comparação com um modelo típico sem raciocínio. A vantagem é que tendem a ser mais confiáveis em domínios como física, ciência e matemática.

O R1 contém 671 bilhões de parâmetros, revelou a DeepSeek em um relatório técnico. Parâmetros correspondem aproximadamente às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros geralmente têm um desempenho melhor do que aqueles com menos parâmetros.

De fato, 671 bilhões de parâmetros é um número massivo, mas a DeepSeek também lançou versões "destiladas" do R1 variando de 1,5 bilhão de parâmetros a 70 bilhões de parâmetros. O menor pode ser executado em um laptop. Quanto ao R1 completo, ele requer hardware mais robusto, mas está disponível através da API da DeepSeek a preços 90%-95% mais baratos do que o o1 da OpenAI.

Clem Delangue, CEO da Hugging Face, disse em um post no X na segunda-feira que desenvolvedores na plataforma criaram mais de 500 modelos "derivados" do R1 que acumularam 2,5 milhões de downloads combinados — cinco vezes o número de downloads que o R1 oficial recebeu.



Há uma desvantagem no R1. Sendo um modelo chinês, ele está sujeito a avaliações pelo regulador de internet da China para garantir que suas respostas "incorporem os valores socialistas centrais". O R1 não responderá a perguntas sobre a Praça Tiananmen, por exemplo, ou sobre a autonomia de Taiwan.

Muitos sistemas de IA chineses, incluindo outros modelos de raciocínio, recusam-se a responder a tópicos que possam irritar os reguladores do país, como especulações sobre o regime de Xi Jinping.

O R1 chega dias após o governo Biden, que está de saída, propor regras de exportação mais rigorosas e restrições às tecnologias de IA para empreendimentos chineses. Empresas na China já estavam impedidas de comprar chips de IA avançados, mas se as novas regras entrarem em vigor como estão escritas, as empresas enfrentarão limites mais rígidos tanto na tecnologia de semicondutores quanto nos modelos necessários para iniciar sistemas de IA sofisticados.

Em um documento de política na semana passada, a OpenAI instou o governo dos EUA a apoiar o desenvolvimento de IA nos EUA, para que os modelos chineses não os igualem ou superem em capacidade. Em uma entrevista ao The Information, o vice-presidente de política da OpenAI, Chris Lehane, destacou a High Flyer Capital Management, empresa-mãe da DeepSeek, como uma organização de particular preocupação.

Até agora, pelo menos três laboratórios chineses — DeepSeek, Alibaba e Kimi, que é de propriedade da unicórnio chinesa Moonshot AI — produziram modelos que afirmam rivalizar com o o1. (Vale notar que a DeepSeek foi a primeira — anunciou uma prévia do R1 no final de novembro.) Em um post no X, Dean Ball, pesquisador de IA na Universidade George Mason, disse que a tendência sugere que os laboratórios de IA chineses continuarão a ser "seguidores rápidos".

"O desempenho impressionante dos modelos destilados da DeepSeek […] significa que raciocinadores muito capazes continuarão a se proliferar amplamente e poderão ser executados em hardware local", escreveu Ball, "longe dos olhos de qualquer regime de controle de cima para baixo."

Últimas notícias

Últimas notícias

Um produto:

Copyright © 2025 Design Team - Todos os direitos reservados.

Um produto:

Copyright © 2025 Design Team - Todos os direitos reservados.

Um produto:

Copyright © 2025 Design Team - Todos os direitos reservados.

Um produto:

Copyright © 2025 Design Team - Todos os direitos reservados.