Workshop: Text analysis without Strg + F

Build your own corpus analysis tool at home without programming skills

POV: Du möchtest einen Text statistisch auswerten, der nicht in existierenden Korpusanalyse-Tools verfügbar ist, und überlegst, Textstellen manuell zu zählen… Excuse me, wir haben 2023!

Der Workshop zeigt einen Weg, ein eigenes Python-Script anzupassen, mit dem digitales Textmaterial ausgewertet werden kann – von Foliensätzen über digitalisierte Tagebücher bis hin zu WhatsApp-Chats oder Blogartikeln. Wir werden zusammen ein Skript benutzen, das mithilfe von regular expressions wie bei den meisten Online-Korpora Textstellen auffinden, zählen und anzeigen kann – von ganzen Sätzen bis hin zu beliebigen Kombinationen aus Buchstaben und Wörtern. Das Einlesen der Daten und die Verwendung der Abfrageausdrücke üben wir gemeinsam. Über diese Methode können sprachliche Muster fast jeder Art operationalisiert werden. Dafür sind keine Programmierkenntnisse notwendig!

The workshop shows a way to use a python script for analysing digital(ized) textual data – from slides over diaries to whatsapp chats or blog articles. Together we will learn to adjust the script to work with our own data and queries. Like most online corpus tools, we can use regular expressions to find, count, and give out sentences, words, or any combination of characters. With this method we can easily operationalize almost every textual structure. No programming skills needed!

Requirements:
- A Google account with access to Google Drive (which equals access to Google Colab)
- An already installed python environment like PyCharm (https://www.jetbrains.com/help/pycharm/installation-guide.html#standalone)
- Text data you want to analyse

Info

Day: 2023-05-27
Start time: 13:35
Duration: 01:20
Room: SH 2.109
Track: Diverse

Links:

Feedback

Click here to let us know how you liked this event.

Concurrent Events