🖤 Good Night Sweet Prince of Darkness
Posts by Stefan Trockel
Wenn man etwas raus zoomt kommt man zu einer ebenso wichtigen Grafik:
Die dem. Parteien des Bundestags repräsentieren nur 54% der deutschen Wahlberechtigten.
Es sind mehr Stimmen ohne Repräsentanz im BT, als auf die Union entfallen. Trotz höchster Wahlbeteiligung im wiedervereinigten Deutschland!
Trump 2 .0: A New World Order
He's back. And this time he means business.
If only the left had got their house in order...
youtube.com/watch?v=R3XO...
I just deleted my account on the thing that used to be Twitter. Not that this would be a big deal, but I feel here is a good place to make a note.
Oasis 🥱
TV on the Radio 🙏
Bezog sich auf deinen vorherigen comment.
Ja, genau deshalb finde ich die Frage so spannend. Fast forward zu GPT-X und praktisch vollständiger Automation von Wissensarbeit.
Nur wenn wir den Wert von ‚human generated content‘ im Trainingsset erkennen, wird sich die Wertschöpfung des Models verteilen, statt nur dem Model owner zuzufallen.
Ja, es läuft auf die Bedeutung von Copyright hinaus. Ich finde hier den Begriff ‚Verwertungdrechte‘ zielführender. Verwertet wurden die Texte. Und aus der Verwertung wird Wert geschöpft.
Die Trainingsdaten liefern also auf statistischen Weg das faktische grounding.
Nimm zwei identische LLMs, eins mit NYT Artikeln, eins ohne. Du wirst Unterschiede in den Completions sehen. Gerade bei Themen, die dort stark repräsentiert sind.
Bei LLMs geht es um die Wahrscheinlichkeit des nächsten Tokens. Stell Dir ein Thema vor, was bisher nicht in den Trainingsdaten vorkommt.
Dann generiert die GenAI zu diesem Thema nichts sinnvolles, sondern halluziniert.
Wenn du ihr nun Traingsdaten zu dem Thema gibst, werden die Outputs besser.
Ich denke, die Frage geht deutlich tiefer, und die gesellschaftliche Antwort darauf betrifft auch weitaus mehr als nur die Verlage.
An tragfähigen Argumente zur Gegenposition zur Times wäre ich interessiert.
Die Times kann aufgrund des relativ großen Anteils ihrer Texte an den Trainingsdaten vermutlich schlüssig argumentieren, dass die Gewichte und Wahrscheinlichkeiten in der Generierung zu vielen Themen ohne ihren Corpus gänzlich anders aussähen.
Ich will nicht sagen, dass ich deiner Position widerspreche. Nur das ‚GenAI ist nicht Search‘ Argent ist nicht das, was die Frage klärt. Deshalb suche ich ja nach guten Argumenten für Gegenposition zur Tines.
Funktionsweise von LLMs ist klar.
Aber ist es nicht dennoch ‚reproductive use‘?
Wenn ein Roman verfilmt wird, ist das oft eine freie Adaption des Originals, aber eindeutig IP.
Oder nimm manche Heil- oder Coching Methoden: Man zahlt für das erlernen und wendet sie später gegen Gebür an.
In der Tat interessant.
Wie ist deine Argumentation die zu so einer eindeutigen Einschätzung kommt?
Ich finde die Frage deutlich nuancierter und wäre gespannt deine Argumente zu hören.
There is no ‘wrong season’ for pizza.
Good for X, that their fines will become lower and lower over time 😂
Die Überlegungen zu Hashtags auf bsky sind übrigens hier nachzulesen. Recht interessant. github.com/bluesky-soci...
Not that I recall, and mostly with low precision. 😉
Habe ein paar geschickt. Für gute Leute.
On the other hand, the Band ‘The Slackers’ can be highly recommended 👉 open.spotify.com/artist/2QRPuDfRA9LtoeGFa...
The context of this news story is more interesting than the presence of violence in major religious scripture. It‘s an activist response to book banning legislature.
And yes, my catholic school & reading the bible introduced me to violence before movies and other books and video games. But hey… 🤷♂️
Hello to blue skies ;) Let's see if this can bring back the fun to social media. Thanks @amir.blue for the invite!