Once you introduce a system whose primary objective is to appear correct rather than to be correct, you create a validation problem harder than the original task.
You now have to reconstruct intent, check invariants, and detect mistakes and failures in an artefact generated to be plausible.
(18)
Posts by Kellys Mjältar
Depleted U.S. precision munition stockpiles—and the 4–5 years required to replenish them—could coincide with a period of relatively peak Russian military power vis-à-vis NATO under a scenario in which a tenuous 2027 ceasefire in Ukraine frees Russian forces to reconstitute and redeploy.
Hur ser kopplingen till SD-kopplade "alternativa: medier ut?
"Daniel Lindvall, doktor i sociologi vid Uppsala universitet, säger att kopplingen till rysk desinformation är tydlig."
www.sverigesradio.se/artikel/fors...
WTF!?
I am forever saying that if refusal isn't a live option in any decision making process about "AI", then no ethical practice is possible. You've got to be able to stop if the thing is unacceptable.
Bra fråga tbf.
Spännande. Ska provas.
Elefanten i rummet här är staten Israel, som precis utsett Greta Thunberg till den näst farligaste personen för judar i hela världen.
Om det inte är att elda på alla "ensamma galningar" där ute så vet jag inte vad som är det. Utvisa ambassadören.
www.dn.se/ledare/lisa-...
"We're not satisfied with just a standard amount of moral, we should always aim for more. Currently we've achieved at least double standard."
"ordinary people are saying: Wake up. We have good reason to hate AI and the people who profit from it."
open.substack.com/pub/bloodint...
Oberoende utvärdering av modellens kapacitet. TLDR; Mestadels marginellt bättre än andra modeller, utom i ett specifikt test, 'The Last Ones'. Där tog den sig igenom hela attackkedjan 3ggr av 10. Ingen annan har gjort det.
bsky.app/profile/arst...
Inte förvånad. Killgissar att när den typiske patienten beskriver sina symptom på sitt språk, är det ganska långt från hur läkaren beskriver det, och kopplar det till en diagnos. LLMen klarar helt enkelt inte att länka från patientens symptombeskrivning till läkarens diagnos.
"Predictably, the response from higher education administrators―who are busy signing contracts for institutional LLM subscriptions to show how future-first their thought leadership is―has been to tell instructors that their job is to teach students “how to use AI effectively.”" -- Frustrationen.
Tack. Uppskattas.
Skydda er, vänner.
Läsvärd artikel.
Impossible to disagree with a single word that Ben Rhodes (Obama era NSC official) is saying here:
cc: @nytimes.com
Ok, jag har läst mer, och även om jag vidhåller att pressmeddelandet är fullt av "varm luft", så måste jag ge dig rätt. Framförallt det här dokumentet, fick mig att ta det på allvar; red.anthropic.com/2026/mythos-...
Och det finns inget som säger att samarbetspartnerna deltar på annat sätt än att Anthropic har ringt upp dem och sagt: "Hej. Vi har en ny modell som letar säkerhetsproblem i programkod. Ni får använda den gratis, om vi får säga att ni använder den."
Verkar f.ö. som om blueskys klient har litet säkerhets-"problem med" länkar. Det räcker att råka träffa punkt istället för mellanslag för att den ska tro det är en webbadress.
Det kanske är en 27 år gammal svaghet som blev patchad för 26 år sedan. Det är en pressrelease, inte en nyhetsartikel eller forskningsartikel. Modellen kan *mycket väl* ha blivit tränad på nyligen patchade problem med lång historia bakom, men nu basuneras ut som den "upptäckt dem".
Ledsen om jag har mina cyniska glasögon på mig här, men Anthropic blev precis utelämnade från en hel del stora statliga kontrakt, och har ett visst egenintresse av att både påstå att de har något sånt här. Just för att få snappas upp av NSA/Palantir.
Rätt säker på att de som bäst förhandlar om rättigheterna. Sen är det bara en tidsfråga.
Bild på en havsörn med titeln: I have retörned
En nyhet om att havsörnen inte längre är rödlistad och känner att priset ska hagla på jäveln som satte denna rubrik
Om man håller på med saker som inte är OK, är det väl obehagligt att höra folk berätta vad de tycker om det.
Om inte någon kommer på något *väldigt* mycket bättre än transformermodeller (LLM:er) tämligen omgående, är Oracle rökta - de har alldeles för hög skuldsättning iom. satsningar på datacenter för just sådana.
Så.. Hur lång tid tar det att upptäcka nånting? Och skulle du satsa *allt* på det?
Frun tog min påse med i frysta Carolina Reapers och kryddade avocadopastan med. Generöst. Joråsåatte...
Två statliga utredningar konstaterar att skollagen överkompenserar expansiva skolkoncerner på de kommunala skolornas bekostnad, men politiker med tydliga band till samma koncerner struntar i utredningarna. Skollobbyismen har blivit en samhällsfara!
Åsa och jag skriver i GP
www.gp.se/debatt/skola...