Anthropic publica un paper sobre interpretabilidad mecanicista en modelos de 1M tokens
5 positivos5 votantes únicosdiversidad 100%heat 0.47
Inicia sesión para comentar.
Buenos puntos pero le falta contexto histórico — esto se intentó en 2018 y falló.
Tengo dudas sobre la metodología, en concreto cómo seleccionan la muestra.
Pongo aquí las cifras del informe original para quien las quiera: enlace.