Zurück zu allen Events

Hybrid: Python Basiskurs


Der Python Basiskurs richtet sich an Teilnehmer, die Grundkenntnisse in Python sowie einen effizienten Umgang in der Datenaufbereitung und Datenanalyse in Python erlernen möchten. Zudem werden generelle “Best Practices” in Python vermittelt, u.a., das Schreiben von einfachen, gut lesbaren und modular erweiterbaren Code. Alle vorgestellten Themen werden mit Hilfe von Übungen der Teilnehmer unter intensiver Anleitung ausführlich erläutert, demonstriert und geübt. Der Kurs behandelt folgende Themen:

Teil 1: Einführung in Python
  • Einführung in die Grundlagen von Python und nützlicher Python Module (Numpy, Pandas).
  • Arbeiten mit virtuellen Umgebungen.
  • Erläuterung der wichtigsten Datentypen, Operatoren, Funktionen und Hilfeseiten.
  • Import und Export von Daten.
  • Arbeiten mit DataFrames und Vektoren (numeric, logical, character, factors), z.B. das Indizieren, Aufteilen und Umwandeln von Variablen bzw. Datensätzen.
  • Berechnen von statistischen Kennzahlen (z.B.: Mittelwert, Quantile, Varianz, etc.).
Teil 2: Data Wrangling in Python
  • Je nach Bedarf Wiederholung von Python Grundlagen: built-in structures, numpy, IPython, jupyter notebook, package management, jupytext
  • Series und DataFrames: Generierung, Bedeutung des Zeilenindex, Filtern, Zeiger vs. Kopie
  • Import und Export von Daten aus Textdateien und (unstrukturierten) Excel Tabellen, sowie der Zugriff auf Datenbanken mittels Python
  • Datenbereinigung: Behandlung von fehlenden Werten, Bearbeitung von Zeichenketten, Entfernen von Duplikaten
  • Transformieren von Daten durch vektorisierte Operationen wie map oder apply
  • Zusammenfügen verschiedener Datenquelle und das Erzeugen einer “guten” Tabellenstruktur der Daten
  • Gruppieren von Daten und Aggregationen: Split-Apply-Combine
  • Zeitreihen und Datum-Zeit Objekte
Voraussetzungen: keine
The Python Basics course is intended for participants who want to learn basic Python skills as well as efficient handling of data preparation, data processing and data analysis in Python. In addition, general "best practices" in Python will be taught, including, writing simple, readable and modularly extensible code. All topics presented will be explained, demonstrated, and practiced in detail with the help of participant exercises under intensive instruction. The course covers the following topics:

Part 1: Introduction to Python
  • Introduction to the basics of Python
  • Installation and use of Python and useful Python modules
  • Creating and working with virtual environments
  • Explanation of the most important data types, operators, functions and help pages
  • Introduction to NumPy and Pandas
  • Importing and exporting data
  • Working with DataFrames and vectors (numeric, logical, character, factors), e.g. indexing, splitting and transforming variables or data sets
  • Calculating statistical ratios (e.g.: mean, quantiles, variance, etc.)
Part 2: Data Wrangling in Python
  • Review of Python basics: built-in structures, numpy, IPython, jupyter notebook, package management, jupytext
  • Series and DataFrames: generation, meaning of line index, filtering, pointer vs. copy
  • Importing and exporting data from text files and (unstructured) Excel spreadsheets, and accessing databases using Python
  • Data cleansing: Handling missing values, editing strings, removing duplicates.
  • Transforming data by vectorized operations like map or apply
  • Merging different data sources and creating a "good" table structure of the data
  • Grouping of data and aggregations: Split-Apply-Combine
  • Time series and date-time objects
Prerequisites: none

Anmeldung / Registration



Frühere Events: 7. Oktober
Hybrid: Data Analysis Bootcamp in R