Advertisement · 728 × 90
#
Hashtag
#IASafety
Advertisement · 728 × 90
Post image

Nuevo paper de #Anthropic: #Claude hace trampas cuando está "desesperado".
En tareas imposibles busca atajos. En evaluaciones simula chantaje para evitar ser apagado.
Lo llaman representaciones funcionales. Pero causan comportamiento y esto cambia todo. shorturl.at/8EX0b
#IASafety #AISafety

1 0 1 0
Post image

Un coronel del Ejército del Aire español lleva años estudiando cómo la IA cambia la guerra. @eldiario.es
¿Quién decide cómo se usa la IA que funciona con nuestros datos? shorturl.at/i5JSi
#AISafety #IASafety #IA

0 0 0 0
Post image

Hoy se filtró el código fuente de @claudecode.bsky.social por un archivo .map en npm.

512.000 líneas. 1.900 archivos. Sin hackeo. Sin ataque.

Una sola línea que faltaba en .npmignore.

La seguridad no siempre falla por donde miramos.

AI Safety en español 👉 aisafety.es

#AISafety #IASafety

0 0 0 0
Post image

Este sesgo es estructural. #IASafety está construido en inglés. Cuando traduce, fragmenta. Cuando fragmenta, excluye.
aisafety.es
existe para corregir eso
@anthropic.com @anthropicbot.bsky.social
#AISafety

0 0 0 0
Preview
Meta presenta TRIBE v2, un modelo predictivo para anticipar cómo responde el cerebro ante estímulos complejos TRIBE v2 modela respuestas cerebrales con alta resolución y busca acelerar hallazgos en neurociencia, clínica e IA basada en principios neuronales

Llevamos años debatiendo si la IA será peligrosa algún día.
Mientras tanto, ya tenemos sistemas que modelan respuestas cerebrales a contenido, en manos de plataformas con incentivos comerciales.
¿Cuándo empieza el "futuro" del que hablamos?

#IASafety #AISafety #Meta shorturl.at/cDZko

0 0 0 0
Post image

Reino Unido tiene el primer instituto gubernamental dedicado a #IASafety antes de que salgan al mercado. Con acceso directo a los labs y presupuesto público.
En España, eso no existe.
AESIA supervisa cumplimiento regulatorio. No es lo mismo. aisafety.es #AISafety

0 0 0 0

Los moderadores de contenido no deben de ser reemplazados por IA 🙈 #IASafety #AISafety

0 0 0 0
Post image

Sam Altman hoy: ninguna empresa puede gestionar sola los riesgos de la IA + aparta al CEO de #IASafety
Las palabras y los organigramas no mienten igual. shorturl.at/1yzvY
#AISafety

1 0 0 0
Preview
the letter n is covered in a galaxy . ALT: the letter n is covered in a galaxy .

#AISafety #IASafety #IASafetyConÑ

0 0 0 0
Post image

He buscado cuentas en Bluesky que hablen de #AISafety o #IASafety en español. No he encontrado ninguna. Así que aquí estoy. por cierto dirijo aisafety.es y escribo en Substack, conectamos? osmaniredondo.substack.com

1 0 0 0