Et j’ai vérifé dans mes logs
$ zgrep tdmrep /var/log/nginx/*
<vide>
Y’a littéralement personne qui vient vérifier l’opt-out…
www.w3.org/community/re...
Posts by aeris
Mais oui, ce III me semble bizarre là comme ça. Il sort un peu de nul part. En soit une licence restrictive est de toute façon une opposition.
Et non juriste, non juriste, faut pas abuser non plus 🤣
On m’a quand même proposé plusieurs fois de passer le barreau 😅
Ah non, je trouve juste assez étonnant la formulation de cet article, qui annihile totalement le droit d’auteur dans un tel cas.
L’exposé des motifs au Sénat est assez clair aussi.
Le III est donc extrêmement mal rédigé.
Ah ben après que les gens essaient de tordre la législation dans tous les sens pour parvenir à leurs fins, ça c’est pas nouveau. Mais vu la directive, c’est très clair que c’est recherche only. Ça n’aurait aucun sens sinon, ça annihile le copyright tout court sinon.
Et on le retrouve à l’article 3, c’est bien exclusivement à fin de recherche
Non, c’est même très explicite juste en dessous
bsky.app/profile/aeri...
Le III se réduit donc exclusivement aux personnes faisant de la recherche scientifique. Au sens strict du terme et pour des finalités strictement de recherche. Ce que n’est pas un LLM.
C’est d’ailleurs encore plus visible au point 17 de la directive tient
Et le III n’est que la transpo de la directive que tu cites, qui ne vise que l’usage strictement académique et recherche. Ce n’est pas « toute personne » au sens très large.
Pour beaucoup oui. On combat les bots depuis des plombes, mais les LLM ne respectent pas les robots.txt. Et passent même par des proxys résidentiels pour contourner les restrictions. J’en suis un peu à ça si tu veux
ipset list | wc -l
13233
Le NYT a démontré le contraire. Ils ont ressorti des centaines d’articles, au mot près, des LLM.
Au 3 pardon. D’ailleurs très clairement le législateur a légèrement merdé sur la transpo du III, ça devrait être « personne physique ». Sinon le texte n’aurait aucun intérêt légal, ça le vide de sa substance.
Ben parce que t’es dans aucun des cas suivants. Et c’est bien « aux seules fins » et « fins exclusives »
Et quand au 2 : imirhil.fr/robots.txt (j’aurais même du mettre plus git.imirhil.fr/robots.txt, faut que je change ça)
(Oui, le blog de Stallman est en ND 🤣)
J’étais persuadé d’avoir mis du ND d’ailleurs 😅
Pour les mêmes raisons que Stallman 🤣
Euh oui pardon, c’est du share alike, donc même licence. Avec le moteur de recherche, tu peux identifier la licence en tout cas. Avec le LLM, tu vas juste violer ma licence.
C’est toujours difficile à identifier, mais ça semble venir de komut.io/rails-uygula...
Site sous copyright, sans réutilisation autorisée donc
Le même avec chatgpt
Chez qui a-t-il récupéré ce code ? Je sais pas.
Est-ce que c’était sous CC-NC-SA ? Je sais pas.
Le moteur de recherche ne viole pas ça. Il respecte l’intégralité de la licence. Il me cite bien, ne modifie pas ce qu’il présente au visiteur, n’en réalise pas un contenu dérivé, etc.
Spoiler. Non derivative. Non commercial. Un LLM qui indexe ça viole la législation.
Exemple typique d’un moteur que viole au contraire un LLM
Faut lire les 2 skeets derrière hein.
Qu’un moteur de recherche ne viole ainsi pas mon propre droit à licence AGPL par exemple. Tout usage de mon code doit avoir la référence à l’auteur.
Ne serait que parce qu’un moteur de recherche… te redonne le texte exact et généralement les moyens d’en retrouver la source, la licence, l’auteur…
Ben si, des tonnes…
Et le 2nd paragraphe est tout aussi pourri. Le fair use n’a jamais été fondé sur ce type de critère.
C’est l’EFF qui avance sur le « ça ne substitue pas ». Ça n’a jamais été un argument valide pour le fair use ou non.
Le fair use n’est invocable **QUE** si ton usage est **EXCLUSIVEMENT** à vocation de recherche, critique, commentaire, etc.