🏳️‍🌈👨🏻‍💻 Jan Oliver Rüdiger 🦄🌼🌸🏵️ (@notesjor) Bsky

Cool development: the Python library tg-clients. It provides direct access to all data (metadata, texts, images...) from the repository in Python, and much more. Here is the documentation with examples: dariah-de.pages.gwdg.de/textgridrep/... and here is a poster: zenodo.org/records/1070...

2 days ago 8 9 0 0

Ich sehe das pragmatisch. Ein schlechter Text ist ein schlechter Text. Unsaubere Quellen. Wiederholungen. Keine Idee. Keine vernünftige Forschungsfrage. Dann ist es egal ob mit oder ohne KI erstellt.

2 weeks ago 1 0 1 0

Bei Forschungsdaten ist es ja eher wichtig, das wenn es mal läuft, es bis in alle Ewigkeit läuft 🤣🤭 viel Erfolg für einen guten Launch und einen reibungslosen Dauerbetrieb 😊💚🩷🩵

2 weeks ago 1 0 0 0

Die soziale Herkunft entscheidet weiterhin über den Bildungsweg, zeigt eine neue #Studie.

Selbst bei gleichen Noten erhalten Kinder aus bessergestellten Familien häufiger eine Empfehlung fürs Gymnasium. #Ungleichheit #Chancengleichheit

1 month ago 70 34 4 1

Heute bei #dhd2026 war ich bei der AG #dhrse treffen (Research Software Engineering in den Digital Humanities) und wir haben viele interessante Themen diskutiert! https://dh-rse.github.io/@SabinaMollenhauer@fedihum.org

1 month ago 4 4 0 0

Foto-Eindrücke vom 1. IDS-Diversitätstag. Copyright: IDS Mannheim

Programm zum 1. IDS-Diversitätstag.

Eindrücke vom IDS-Diversitätstag. Foto: IDS

Kürzlich fand der erste IDS-Diversitätstag statt. 🧡 Wir danken Sila Kilinc & Jan Oliver Rüdiger herzlich für die Orga, allen Vortragenden für die spannenden Einblicke, den Teilnehmenden für ihr Interesse und dem Queeren Zentrum MA für die gute Zusammenarbeit! 🤝 Einblicke ins Programm: ⬇️ Fotos: IDS

2 months ago 2 2 0 0

Screenshot des Programms der DHD2026 mit folgendem Inhalt: Titel: Empirische Untersuchungen zur Gegenwartsliteratur. Das Literatur-Korpus DeLiKo@DNB und erste Analysen Vortragende: Fotis Jannidis, Philippe Genêt, Leonard Konle, Marc Kupietz, Steffen Martus, Carolin Müller-Spitzer, Samira Ochs Dieses Panel stellt das erweiterte Korpus DeLiKo-XL@DNB vor, das in einer Zusammenarbeit von DNB und IDS entstanden ist, sowie zwei Untersuchungen, die es für je eine linguistische und eine literaturwissenschaftliche Analyse verwenden. Das Korpus umfasst einen Großteil aller EPUBs mit fiktionaler Prosa aus dem Bestand der DNB, insgesamt 287.585 Publikationen aus den Jahren 2005-2024. Es steht über eine offene Schnittstelle allen Interessierten für Analysen zur Verfügung. Die linguistische Analyse untersucht genderinklusive Formulierungen von Figurenreferenzen: Wie häufig lassen sich solche Formen in der Gegenwartsliteratur finden? Können Sie bestimmten Genres oder Zeiträumen zugeordnet werden? Die literaturwissenschaftliche Untersuchung überprüft drei Thesen zur Umstrukturierung des literarischen Feldes, die sich zusammenfassend als dessen 'Genrefizierung' beschreiben lassen. Das Panel soll zum einen mit dem Korpus und den Möglichkeiten des Zugriffs sowie den konzeptuellen und technischen Schwierigkeiten, die sich dabei stellen, vertraut machen, zum anderen soll es der Diskussion der Entwicklungsperspektiven des Korpus dienen. Details zur Session: Donnerstag 1:1: Donnerstag 1:1 – Panel Zeit: 26.02.2026: 9:00-10:30 · Ort: BIG-Hörsaal

Kleiner #dhd2026 Teaser: Morgen (09:00-10:30) sind Kolleg*innen auf der #dhd2026 unterwegs, um euch etwas über "Empirische Untersuchungen zur Gegenwartsliteratur. Das Literatur-Korpus DeLiKo..." zu erzählen. Es geht um die Analyse der Buchpreis-Daten der #dnb mittels #KorAP @idsmannheim.bsky.social

1 month ago 4 1 0 0

Interessante Daten - inwiefern sind hier Timeinterval-Bias, Survivor-Bias und Kohorteneffekte berücksichtigt? - Bsp.: Blogs gibt es noch nicht so lange, ebenso die #DH - Wenn ich also nach 'alten' Blogs suche, limitiert das automatisch.

1 month ago 1 0 1 0

Folie zeigt Lebensdauer von wissenschaftlichen Blogs

So alt werden die Blogs (leider) gar nicht mal. #DHd2026 #IBIgoesDHd

1 month ago 6 1 2 1

Not just Text, Intertext! Neue Wege der semantischen Modellierung und Annotation für intertextuelle Bezüge Laura Untner, Bernhard Oberreither, Jan Horstmann, Julia Nantke, Christof Schöch, Paula Wojcik Das Panel widmet sich der Frage, wie intertextuelle Beziehungen digital modelliert und annotiert werden können. Im Fokus stehen theoretische und technische Ansätze zur systematischen Erfassung, Strukturierung und maschinenlesbaren Bereitstellung intertextueller Bezüge. Die Beiträge beleuchten unterschiedliche Arten von Intertextualität, diskutieren epistemische Potenziale semantischer Technologien und thematisieren Grenzen der Übertragbarkeit geisteswissenschaftlicher Methodik in digitale Kontexte. Zugleich wird gefragt, welche Textbegriffe der Modellierung zugrunde liegen und wie sie das Verständnis von Textbeziehungen prägen. Die Spannweite reicht von der vergleichenden Annotation von Figureneigenschaften über die Entwicklung intuitiver Annotationstools und theorieoffener Ontologien bis hin zu quantitativen Verfahren und einer traditionell-literaturwissenschaftlichen Fallstudie. Das Panel versteht sich somit als exemplarischer Beitrag zur kritischen Reflexion und Bestandsaufnahme intertextueller Annotations- und Modellierungsverfahren in der digitalen Literaturwissenschaft – insbesondere zur Modellierung von Textbeziehungen als Linked Data.

Bald starten wir bei der #DHd2026 durch mit Intertextualität, Textähnlichkeit und Linked Open Data!

Mit Laura Untner, Bernhard Oberreither, Jan Horstmann, Julia Nantke, Christof Schöch, Paula Wojcik

1 month ago 4 2 0 0

LIDO Paradaten

Toller Vortrag von Lina Franken und Sabina Mollenhauer zur Nutzung von
Paradaten (Aussagen über Daten, Prozessdaten) zur Verringerung der Unsicherheit bei der Modellierung von Kulturdaten @dhdkonferenz.bsky.social
#DHd2026 #DH

1 month ago 3 1 0 1

Happy 2026 from the Observable team!

With the start of the new year, we're reminded that time flies and there's always a need to understand how things change as it does. Learn about 8 charts that clarify patterns, reveal anomalies, and help you track performance with time series data👇

3 months ago 4 1 0 0

AI Doesn’t Reduce Work—It Intensifies It One of the promises of AI is that it can reduce workloads so employees can focus more on higher-value and more engaging tasks. But according to new research, AI tools don’t reduce work, they consisten...

So langsam brauche ich glaube ich einen extra Ordner: hbr.org/2026/02/ai-d...

2 months ago 2 0 0 0

MKNetwork-Korpora

Milestone: 4 million tokens of the Moravian periodical “Gemeinnachrichten” are digitized. We are releasing it, for now, as a trilingual version (German, English, Afrikaans) in a working and reading version. Take a look: dhh-hypotheses-org.translate.goog/4396?_x_tr_s.... #linguistics #Linguistik

2 months ago 5 3 0 0

Hierzu gleich die nächste Studie - sogar von #Anthropic - www.anthropic.com/research/AI-... - Menschen programmieren schneller mit #AI die Ergebnisse sind aber schlechter - lustig auch der Versuch, das zu relativieren. Zumal Debugging der Standard und nicht die Ausnahme ist.

2 months ago 3 0 1 0

Golem.de: IT-News für Profis

Jetzt gibt #GitHub zu: Generierter Code erfüllt häufig nicht die Qualitätsrichtlinien www.golem.de/news/open-so... - wenn gut läuft, wird #AI ein nettes Tool für Programmier - wenn's schlecht läuft, nen fetter Börsencrash - oder beides 🤷‍♂️

2 months ago 3 0 1 0

Interessanter Verlauf: Vor 2 Jahren waren alle begeistert #AI wird die Programmierung revolutionieren, wir brauchen keine Programmier mehr. Seit einem Jahr mehren sich die Stimmen: Naja, #AI wie #Copilot usw coden doch nicht soooo gut - aber egal. Trotzdem sieht man Jobabbau in der IT.

2 months ago 3 0 1 0

@stefanhartmann.bsky.social wenn ich mich richtig erinnere, ist das ein Fall für dich, oder?

2 months ago 1 0 0 0

Tabellen mit Wortformen, die zu den Lemma-Abfragen in OWIDplusLIVE für das Fokus-Jahr 2025 passen/matchen.

Hier noch die Tabellen mit den Matches für die Lemma-Abfragen

2 months ago 0 0 0 0

Frequenzverlauf in OWIDplusLIVE - zu den Lemma: Verwantwortung, verantwortlich und Verantwortlichkeit.

Fragt man die Lemma Verantwortung, verantwortlich und Verantwortlichkeit ab - sieht man recht schnell, dass die häufigsten verantwortlich und Verantwortung sind. Verantwortlichkeit kommt zwar vor - aber in 2025 kommt es in unserem Korpus nur im Plural (Verantwortlichkeiten) vor.

2 months ago 0 0 1 0

Screenshot der Anwendung OWIDplusLIVE - der die 10 häufigsten Token (Stand 31.01.2026) im Korpus zeigt, die auf "lichkeit" enden. Dies sind: Öffentlichkeit, Möglichkeit, Wirklichkeit, Menschlichkeit, Wahrscheinlichkeit, Persönlichkeit, Männlichkeit, Punktlichkeit, Ehrlichkeit und Bestechlichkeit

Hier eine Übersicht, der aktuellen TOP-10 *lichkeit(en).

2 months ago 0 0 1 0

lichkeit_2026-02-01.tsv Leibniz-Institut für Deutsche Sprache Cloud - Sync und Share Dienst

Da wir aktuell die Web-Oberfläche überarbeiten, dauert die Abfrage etwas: www.owid.de/plus/live-20... - aber wer mag, hier die Daten im TSV-Format zu *lichkeit direkt zum Download: cloud.ids-mannheim.de/s/LM6fLnYwe3... - Alternativ zum selbst abfragen: www.owid.de/plus/live-20...

2 months ago 0 0 1 0

Eine spannende Frage: Hier ein paar Notizen zu Analysen mit OWIDplusLIVE (tagesaktuelle N-Gramme aus 13 öffentlich zugänglichen RSS-Feeds deutschsprachiger Medien: www.owid.de/plus/cowidpl... - aktuell 163'713'095 Token - Stand: 31.01.2026). Für 2025 gibt es 343 Token, die auf *lichkeit enden.

2 months ago 0 0 1 0

Ok, wenn es konkrete Fragen gibt, melde dich gerne 😎
Generell: Ich würde immer versuchen, die Geschichte der Daten vom großen hin zum kleinen zu erzählen. Also ein Überblick und dann besonders schlagende Beispiele zu finden.

3 months ago 1 0 0 0

Also fürs Bereinigen nehme ich gerne #OpenRefine und für einfache Tests VSCode mit #DataWrangler - kommt aber auch immer auf den Workflow an. Wie viele Zeilen? Wie viele Spalten? - kannst du etwas mehr über die Daten erzählen?

3 months ago 1 0 1 0

Ein schöner Artikel 💚💛🧡💜

Anbei auch der Verlauf zu "Stadtbild" in OWIDplusLIVE (tagesaktuelle N-Gramme in ausgewählten RSS-Feeds): www.owid.de/plus/live-20...
in der Grafik geglättet über 16 Wochen.

3 months ago 1 0 0 0

university campus klagenfurt. sign in german, slovenian, and austrian sign language

welcome slide queer linguistics at the interface between grammatical and social structure ÖLT 2025 Klagenfurt, Austria 05-12-2025 – 08-12-2025 Oliver Bunk, Nicholas Catasso, Mx Gaul, Vroni Zieglmeier

Netzwerk Queerlinguistik on tour: Our members Oliver Bunk @lvrbk.bsky.social and Vroni Zieglmeier @vzie.bsky.social are co-hosting (with Nicholas Catasso & Mx Gaul) a workshop on queer linguistics at the Austrian Linguistics Conference #ÖLT2025 in Klagenfurt!

4 months ago 12 4 1 0

Neues Projekt im Akademienprogramm:
„Global Basic Lexicon (GloBasLex)“ ist eine frei zugängliche digitale Datenbank, die für rund 2.200 Sprachen einen einheitlich erfassten Grundwortschatz bereitstellt. Es wird über 15 Jahre mit 520k€ p.a. gefördert.
www.hadw-bw.de/sites/defaul...
Grafik: G. Jäger

4 months ago 9 5 1 0

oh nooooo - a common OCR Error 😂
🌞 > 🥳🎉🎈

4 months ago 0 0 0 0

"fun" - Google Search

This could also be a data artifact. Google NGram Viewer offers the possibility to view the books. Here is the link. IMHO this could be traced back to several English dictionaries that were indexed. However, this is only a guess based on an initial curatorial review.
www.google.com/search?q=%22...

4 months ago 0 0 1 0

Posts by 🏳️‍🌈👨🏻‍💻 Jan Oliver Rüdiger 🦄🌼🌸🏵️