In dieser Rolle baust Du die Grundlage dafür, dass Unternehmenswissen aus unterschiedlichsten Quellen strukturiert, semantisch verknüpft und für AI Anwendungen nutzbar wird. In dieser Rolle arbeitest du an der Schnittstelle von Data Engineering, Knowledge Graphs und moderner AI Infrastruktur und gestaltest aktiv mit, wie aus komplexen Daten echte Intelligenz entsteht. Dabei bist du in einem Umfeld unterwegs, das viel Raum für Eigeninitiative bietet und in dem du neue Technologien und Ansätze kontinuierlich weiterentwickelst. Die Position entsteht im Zuge wachsender Projektanforderungen in einem stark projektgetriebenen Umfeld mit Fokus auf AI, moderne Datenplattformen und Enterprise Kunden.
Position: (Semantic) Data Engineer (m/w/d)
Standort: Wuppertal und Home-Office-Möglichkeit
Anstellungsart: Vollzeit (32-40h)
Das Jahresgehalt liegt je nach Erfahrung zwischen 60.000 78.000 € (brutto bei Vollzeit).
Was dich bei uns erwartet:
- Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer
- Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric
- Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform)
- Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher
- Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf
- Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases
- Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig
Was du mitbringst:
- Du hast einschlägige Berufserfahrung in einer ähnlichen Rolle im Bereich Data Engineering und kennst dich mit Azure Data Factory, Azure Foundry, Azure Synapse Analytics und/oder Azure Databricks aus
- Du bist begeistert von den neuesten Entwicklungen im Data & AI Bereich und experimentierst gerne mit neuen Technologien
- Du weißt große Datenmengen effizient zu verarbeiten und kennst dich mit Python, SQL, PySpark und SparkSQL aus
- Du hast Erfahrung mit Kundenberatung, Projektleitung und Stakeholdermanagement und arbeitest strukturiert und lösungsorientiert
- Du hast sehr starke Kommunikationsfähigkeiten in Deutsch und Englisch, um effektiv mit Teammitgliedern, Stakeholdern und Kunden zu interagieren
- Du hast idealerweise Erfahrung in der Verarbeitung und Strukturierung von Dokumenten sowie erste Berührungspunkte mit NLP, Knowledge Graphs oder Vector-Datenbanken
- Du bringst als Pluspunkt agile Arbeitserfahrung (z.B. Scrum), DevOps-Kenntnisse und Erfahrung mit Tools wie Azure Devops Boards oder JIRA mit
Starte deine Reise bei Macaw und gestalte mit uns die digitale Zukunft!
Macaw – your guide in the era of AI.
Wir schätzen Vielfalt und setzen uns aktiv für Chancengleichheit ein. Daher freuen wir uns über Bewerbungen von Menschen unabhängig von Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion oder Weltanschauung, Behinderung, Alter oder sexueller Identität. Unser barrierefreies Büro in Wuppertal und flexible Arbeitszeiten schaffen ein inklusives und unterstützendes Arbeitsumfeld.
Relevant für: (Semantic) Data Engineer / Data Engineer / Semantic Data Engineer / AI Engineer / Azure Data Engineer / Microsoft Fabric / Azure Databricks / Azure Data Factory / Azure Synapse / Data & AI / Data Platform Engineer / Knowledge Graph / Knowledge Graphs / Vector Database / Vector Databases / Semantic Search / Enterprise AI / AI Infrastructure / Datenplattform / Data Engineering / ETL Pipelines / Data Pipelines / Big Data / Python / SQL / PySpark / SparkSQL / NLP / Natural Language Processing / Embeddings / Azure AI / Microsoft Azure / AI Use Cases / Unstructured Data / Structured Data / Data Modeling / Cloud Data Engineer / Enterprise Data / AI Solutions / Data Architecture / Azure DevOps / Machine Learning Infrastructure / Generative AI / Retrieval Augmented Generation / RAG / Data Integration / Data Transformation / AI Data Platform / Intelligent Search / Modern Data Stack / Semantic Layer / Enterprise Knowledge / AI Projects / Microsoft Ecosystem / Wuppertal / Hybrid Job / Home Office / Vollzeit / Karriere IT / AI Karriere / Data Engineering Jobs / Azure Jobs / Microsoft Jobs / Wuppertal / Remote / Chancengleichheit