Was dich bei uns erwartet:
- Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer
- Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric
- Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform)
- Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher
- Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf
- Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases
- Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig
