Zum Thema Evaluation im Theorie-Teil (@SarahOberbichler) des Workshops LLMs unter Kontrolle: kurze Fragen der Teilnehmenden zu Verfallsdatum von Benchmarks wenn LLMs mit den Evaluationsdaten trainiert werden und zu (Nicht-)Steuerbarkeit von LLM Harvesting mit robots.txt/llm.txt
Dann Thema […]
Und jetzt zweiter Theorie-Teil mit @SarahOberbichler: LLM als Tool oder als Werkzeug, was sind typische Nutzungsszenarios in den DH? Zu berücksichtigen: Risikobewertung, systematische Evaluation.
A propos Infrastruktur: mehr als die Hälfte der Teilnehmenden hätten wohl Zugang zu […]
Danach erster Hands-On Teil mit Kai Niebes: Lokales Ausführen von Olmo2/3 (in LMStudio), wie kann ich über ein Python-Skript auf den Chat, seine Konfiguration und seine Nachrichten zugreifen, was muss ich an System/User Prompts verändern, um Aufgaben auszuführen, wie kann ich Olmo pdf-Dokumente […]
Jetzt Evaluation und Benchmarks. Bei der Frage nach DH-spezifischen LLM-Benchmarks sieht es mau aus.
Immerhin gibt es https://rise-unibas.github.io/humanities_data_benchmark Die haben nicht so schlechte Informationen und eine offene Einladung zum Mitmachen!
Tragt Eure DH Benchmarks bei!! […]
Gerade diskutiert @spinfocl die verschiedenen Aspekte von Offenheit bei LLMs: Gewichte, Inferencing Code, Trainingsdaten, Trainingslogik.
https://opensource.org/ai/open-source-ai-definition
https://isitopen.ai/
https://doi.org/10.48550/arXiv.2405.15802
https://doi.org/10.1145/3630106.3659005 […]
Der Workshop "LLMs unter Kontrolle. Offene Modelle in Forschung und Praxis" von @spinfocl , Kai Niebes, @SarahOberbichler und mir ist gut besucht und gut gestartet. Genügend Plätze und Steckdosen vorhanden (Seminarraum 1), die TN haben im Großen und Ganzen die Vorbereitungen durchführen können […]
I hope you understand the world-shaking implications of #RVA23 chips and going off #Microsoft, #Oracle and #Amazon to build sovereign stacks with #PostgresQL, #NoSQL, #Linux, #TorchTPU, #openLLM.
Both #Google and #Apple could be made to drastically expand in Canada as well or offer sovereign stack.
#AgentSkills
Agentskills.io
#openLLM #openweights #openprompts #FOSS
vt.tiktok.com/ZSP4cYh4M/
#AIbubble explained perfectly.
Use #RVA23 #ChineseGPU #ZLUDA and #openLLM only. Just ignore all American tech it's collapsing in a catastrophic way.
#endAmerica
Only the two on the far right, #FeiFeiLi and #FrancoisChollet
fchollet.com
Are if any note whatsoever. #AIbubble will pop and those in the middle should go to jail, though #LisaSu & #MarkZuckerberg have contributed much to #openLLM and #openCompute.
Almost as if they're pumping the mid stocks.
1️⃣ Webinaire #GTnum #GenIAL – Littératie de l'IA et outils pour la médiation
Deux initiatives à découvrir : #Vittascience et #OpenLLM 🇫🇷 🇪🇺, présentées par Léo Briand et Bastien Masse. Le replay du webinaire est en ligne !
👉 chaireunescorelia.univ-nantes.fr/2025/10/09/w...
Code World Model (CWM): 32‑Billion Open LLM Advances Code Generation
The Code World Model (CWM), a 32‑billion‑parameter open‑weights LLM with a 131,000‑token context window, achieved 65.8% pass@1 on SWE‑bench Verified and 96.6% on Math‑500. getnews.me/code-world-model-cwm-32-... #codemodel #openllm #ai
In case you missed it, the Swiss are bringing you an open LLM. Have a read here: ethz.ch/en/news-and-...
#AINews #OpenLLM #AcademicSky