◆ Hoy · síntesis Dos de los tres laboratorios aceptaron.
Anthropic y OpenAI compartirán los casos de seguridad de modelos de frontera con el USAISI — pero en términos distintos.
Ambos laboratorios firmaron acuerdos paralelos que dan al U.S. AI Safety Institute acceso prelanzamiento a las evaluaciones de frontera. La letra chica es la historia: un lado se reserva el derecho a redactar datos de entrenamiento; el otro no.
"Acceso prelanzamiento" es el encuadre equivocado. Lo que acaba de pasar es que el gobierno de EE.UU. tiene, por primera vez, una manera legible de preguntar qué sabe este modelo antes de que salga — y dos de los tres laboratorios que importan aceptaron. El tercero será la historia para julio.