Deepseek - The cheat sheet


DeepSeek é uma empresa chinesa de inteligência artificial, fundada em 2023 por Liang Wenfeng, com sede em Hangzhou, Zhejiang. A empresa desenvolve modelos de linguagem de grande escala (LLM) de código aberto e é financiada exclusivamente pelo fundo de hedge chinês High-Flyer.

Recentemente, o seu modelo de IA, o DeepSeek-R1, tem sido destaque nas notícias por superar modelos ocidentais como o ChatGPT. Lançado em 10 de janeiro de 2025, o DeepSeek-R1 rapidamente se tornou a aplicação gratuita mais descarregada na App Store da Apple nos Estados Unidos, ultrapassando o ChatGPT. Este feito é notável, especialmente considerando que o DeepSeek-R1 foi desenvolvido com um orçamento significativamente menor, estimado em 6 milhões de dólares, em contraste com os 100 milhões de dólares gastos no desenvolvimento do GPT-4 da OpenAI em 2023.

A ascensão do DeepSeek-R1 gerou preocupações no setor tecnológico ocidental, levando a uma queda nas ações de empresas como a Nvidia. A eficiência e o baixo custo do modelo chinês levantam questões sobre o futuro da liderança ocidental em IA e a eficácia das sanções destinadas a restringir o acesso da China a semicondutores avançados.

Em termos de capacidades, o DeepSeek-R1 é comparável aos modelos ocidentais de última geração, demonstrando proficiência em tarefas como matemática, programação e redação. No entanto, a aplicação tem sido criticada por evitar responder a perguntas políticas relacionadas com a China, o que levanta preocupações sobre censura e liberdade de expressão.

A abordagem de código aberto da DeepSeek contrasta com a de outras empresas, tornando os seus algoritmos, modelos e detalhes de treino disponíveis para a comunidade. Esta transparência pode fomentar colaborações e acelerar avanços no campo da IA.

Em suma, o DeepSeek representa um avanço significativo na IA, demonstrando que é possível desenvolver modelos eficientes e de alto desempenho com recursos limitados. No entanto, a sua ascensão também destaca desafios relacionados com a transparência, censura e a dinâmica geopolítica no domínio da tecnologia.

Comentários