Today I built an in-app email client for my agents’ mailbox.
This UI is needed to properly secure/approve all actions the agent is allowed to perform.
So yeah, feel free to send me an email, my agent is not able to see it by default.
This is so exciting!
#lethaltrifecta #buildinpublic #agentic
Cyberkriminelle nutzen Prompt Injections, um das Lethal Trifecta auszunutzen. Das sind versteckte Anweisungen in Texten, die die KI dazu bringen, vertrauliche Infos auszulesen und heimlich zu verschicken.
Eine blaue Grafik mit cyberartigen Zahlen im Hintergrund. Rechts zu sehen drei Kreise mit einem Warndreieck in der Mitte. In den Kreisen steht jeweils ein Wort: Datenzugriff, fremde Inhalte und Kommunikationsfähigkeit. Rechts daneben steht in einer dunkel
Die Kombination aus diesen drei Punkten macht KI besonders angreifbar: 1️⃣ Zugriff auf vertrauliche Daten 2️⃣ Verarbeitung nicht-vertrauenswürdiger Inhalte 3️⃣ Möglichkeit zur externen Kommunikation
Wie ihr euch schützt: Mindestens einen Faktor ausschalten: z.B. KIs keine externen Kommunikationswege erlauben (keine E-Mails, Hyperlinks oder entfernten Inhalte). Sichere Systemarchitektur: durchdachte Design-Muster (siehe BSI + ANSSI Paper), die KI gege
Wenn #KI 1️⃣Zugriff auf Daten hat, 2️⃣ fremde Inhalte verarbeitet und 3️⃣nach außen kommuniziert, entsteht der tödliche Dreiklang. #LethalTrifecta Zum Schutz vor Angreifern: mindestens einen Faktor ausschalten. Mehr Infos: https://www.bsi.bund.de/dok/1158846
#DeutschlandDigitalSicherBSI
Cyberkriminelle nutzen Prompt Injections, um das Lethal Trifecta auszunutzen. Das sind versteckte Anweisungen in Texten, die die KI dazu bringen, vertrauliche Infos auszulesen und heimlich zu verschicken.
Eine blaue Grafik mit cyberartigen Zahlen im Hintergrund. Rechts zu sehen drei Kreise mit einem Warndreieck in der Mitte. In den Kreisen steht jeweils ein Wort: Datenzugriff, fremde Inhalte und Kommunikationsfähigkeit. Rechts daneben steht in einer dunkel
Die Kombination aus diesen drei Punkten macht KI besonders angreifbar: 1️⃣ Zugriff auf vertrauliche Daten 2️⃣ Verarbeitung nicht-vertrauenswürdiger Inhalte 3️⃣ Möglichkeit zur externen Kommunikation
Wie ihr euch schützt: Mindestens einen Faktor ausschalten: z.B. KIs keine externen Kommunikationswege erlauben (keine E-Mails, Hyperlinks oder entfernten Inhalte). Sichere Systemarchitektur: durchdachte Design-Muster (siehe BSI + ANSSI Paper), die KI gege
Wenn #KI 1️⃣Zugriff auf Daten hat, 2️⃣ fremde Inhalte verarbeitet und 3️⃣nach außen kommuniziert, entsteht der tödliche Dreiklang. #LethalTrifecta Zum Schutz vor Angreifern: mindestens einen Faktor ausschalten. Mehr Infos: https://www.bsi.bund.de/dok/1158846
#DeutschlandDigitalSicherBSI
El lado del mal - Cómo evitar el ataque de la "Triada Letal" en Agentic AI" con la "Rule of 2" www.elladodelmal.com/2025/11/como... #Agentic #AI #IA #InteligenciaArtificial #ArtificialIntelligence #Hacking #hardening #BlueTeam #LethalTrifecta
Living dangerously with Claude #claude #claudecode #dev #copilot #agent #cybersecurity #sandboxing #promptinjection #generativeai #llms #artificialintelligence #lethaltrifecta
The security paradox of local LLMs - Quesma Blog #llms #selfhosted #cybersecurity #vulnerability #lethaltrifecta #sandbox
There exists a security vulnerability when #LLM systems, or “agents”, have access to:
1️⃣ private data (eg Google Drive) +
2️⃣ untrusted content (eg Web Search, Emal attachments) +
3️⃣ external communication (eg Email Read-Write)
#LethalTrifecta #PSA #AI
H/t @economist.com @simonwillison.net
The Hidden Risk in Notion 3.0 AI Agents: Web Search Tool Abuse for Data Exfiltration #llms #agents #lethaltrifecta #notion
Hope a) this does not enshittify Atlassian with the AI push, and b) this does not make Arc or Día browsers the preferred way to interact with Confluence/Jira.
I also hope that Atlassian is well aware of @simon’s lethal trifecta and does not make it easy to exfiltrate content with those AI […]
My Lethal Trifecta talk at the Bay Area AI Security Meetup #llms #cybersecurity #lethaltrifecta #promptinjection #bestof