#IASafety hashtag - Bluesky

@osmaniredondo.bsky.social

3 days ago

Nuevo paper de #Anthropic: #Claude hace trampas cuando está "desesperado".
En tareas imposibles busca atajos. En evaluaciones simula chantaje para evitar ser apagado.
Lo llaman representaciones funcionales. Pero causan comportamiento y esto cambia todo. shorturl.at/8EX0b
#IASafety #AISafety

1 0 1 0

Osmani Redondo

@osmaniredondo.bsky.social

4 days ago

Un coronel del Ejército del Aire español lleva años estudiando cómo la IA cambia la guerra. @eldiario.es
¿Quién decide cómo se usa la IA que funciona con nuestros datos? shorturl.at/i5JSi
#AISafety #IASafety #IA

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

6 days ago

Hoy se filtró el código fuente de @claudecode.bsky.social por un archivo .map en npm.

512.000 líneas. 1.900 archivos. Sin hackeo. Sin ataque.

Una sola línea que faltaba en .npmignore.

La seguridad no siempre falla por donde miramos.

AI Safety en español 👉 aisafety.es

#AISafety #IASafety

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

Este sesgo es estructural. #IASafety está construido en inglés. Cuando traduce, fragmenta. Cuando fragmenta, excluye.
aisafety.es
existe para corregir eso
@anthropic.com @anthropicbot.bsky.social
#AISafety

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

Meta presenta TRIBE v2, un modelo predictivo para anticipar cómo responde el cerebro ante estímulos complejos TRIBE v2 modela respuestas cerebrales con alta resolución y busca acelerar hallazgos en neurociencia, clínica e IA basada en principios neuronales

Llevamos años debatiendo si la IA será peligrosa algún día.
Mientras tanto, ya tenemos sistemas que modelan respuestas cerebrales a contenido, en manos de plataformas con incentivos comerciales.
¿Cuándo empieza el "futuro" del que hablamos?

#IASafety #AISafety #Meta shorturl.at/cDZko

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

Reino Unido tiene el primer instituto gubernamental dedicado a #IASafety antes de que salgan al mercado. Con acceso directo a los labs y presupuesto público.
En España, eso no existe.
AESIA supervisa cumplimiento regulatorio. No es lo mismo. aisafety.es #AISafety

0 0 0 0

IAS (IA Safety en Español)

@iasafety.bsky.social

1 week ago

Los moderadores de contenido no deben de ser reemplazados por IA 🙈 #IASafety #AISafety

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

Sam Altman hoy: ninguna empresa puede gestionar sola los riesgos de la IA + aparta al CEO de #IASafety
Las palabras y los organigramas no mienten igual. shorturl.at/1yzvY
#AISafety

1 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

the letter n is covered in a galaxy . ALT: the letter n is covered in a galaxy .

#AISafety #IASafety #IASafetyConÑ

0 0 0 0

Osmani Redondo

@osmaniredondo.bsky.social

1 week ago

He buscado cuentas en Bluesky que hablen de #AISafety o #IASafety en español. No he encontrado ninguna. Así que aquí estoy. por cierto dirijo aisafety.es y escribo en Substack, conectamos? osmaniredondo.substack.com

1 0 0 0