Sinal diário · IA & tecnologia de fronteira
EN PT ES
◆ Sinal · 04 · 29

A história interessante da semana não é mais um lançamento de modelo — é que três laboratórios distintos pararam, em silêncio, de publicar suas avaliações. Capacidade está se movendo para dentro de novo. Ler →

Hoje · Manchete Publicado 09:12 ET
Sala de audiência do USAISI com placas paralelas para OpenAI e Anthropic, papéis sobre a mesa de testemunhas. Hoje · síntese
Dois dos três laboratórios concordaram.
Matéria № 248 · 14 veículos

Anthropic e OpenAI vão compartilhar casos de segurança de modelos de fronteira com o USAISI — mas em termos diferentes.

Os dois laboratórios assinaram acordos paralelos dando ao U.S. AI Safety Institute acesso pré-lançamento às avaliações de fronteira. As letras miúdas é que são a história: um lado reserva o direito de redigir dados de treinamento; o outro não.

A Perspectiva Humana — Gui

"Acesso pré-lançamento" é o enquadramento errado. O que acabou de acontecer é que o governo dos EUA tem, pela primeira vez, um jeito legível de perguntar o que esse modelo sabe antes de ele ir ao ar — e dois dos três laboratórios que importam concordaram. O terceiro vai ser a história até julho.

5 fontes · 4 min de leitura 14 veículos · 3 enquadramentos
§Substack · Último ensaio Pub. 04 / 27
Laboratório de pesquisa madrugada adentro — uma única analista em sua estação de trabalho, colegas em reunião atrás de um vidro sob um quadro branco com 'CONFIDENCIAL: MUDANÇA DE FASE'. § Substack · capa
Mais quieto é o novo alto.
Edição 04 · 27 · 2.400 palavras

Os laboratórios estão ficando mais quietos, e essa é a coisa mais interessante sobre eles.

Um ensaio longo sobre o sigilo das capacidades, a morte lenta do benchmark público e o que significa que o modelo do qual estamos falando não é mais o modelo que está sendo entregue.

Do ensaio

"Por dez anos o campo competiu em público. O novo padrão é competir em particular e anunciar apenas as conclusões. Devemos tratar isso como uma mudança de fase, não como uma estratégia de imprensa."

2.400 palavras · 12 min Ler no Substack ↗