Holger Arndt

Ihr Experte für Big Data Analyse, maschinelle Lernverfahren, künstliche Intelligenz, neuronale Netze und Text Mining

Als selbständiger Projektmanager und Data Scientist entwickle ich intelligente Lösungen für datenintensive Problemstellungen und biete Expertenwissen zu maschinellen Lernverfahren, Big Data Analyse, künstlicher Intelligenz, neuronalen Netzen und Data Mining bzw. Text Mining.

Projektanfrage Info für Recruiter


Ich biete

Für Ihre Projekte stehe ich Ihnen als Projektmanager, Data Scientist, Softwareentwickler oder Berater zur Verfügung.

Ich arbeite öfter mit Start-Ups zusammen und kenne daher die besonderen Herausforderungen und Schwierigkeiten in diesem Umfeld. Als Coach oder Consultant kann ich Sie dabei unterstützen, Ihre Geschäftsidee mit Hilfe von "Big Data" und maschinellen Lernverfahren im Businessplan fundiert auszuarbeiten und in die Realität umzusetzen.

Projektmanagement

  • Projekt- und Teamleitung (zertifizierter PMP®)
  • Interim-CTO
  • Coaching und Beratung
  • Agile Softwareentwicklung, Scrum, Kanban

Datenanalyse

  • Data Mining für biomedizinische Daten (InnoCentive award in 2008)
  • Data Mining für Customer Relationship Management Datenbanken
  • Analyse von sozialen Netzwerken
  • Analyse von unstrukturierten oder semi-strukturierten Daten (insbes. Text)
  • Automatische Emailanalyse
  • Social Media Monitoring
  • Portfolioanalyse
  • Churn Analyse
  • Sentiment Analysis
  • Betrugserkennung
  • Risikoanalyse

Consulting

  • Entwicklung von Business Intelligence Strategien
  • Data Mining und Reporting Lösungen
  • Analyse von Cross-Selling Potenzialen
  • Optimierung von Marketing Strategien
  • Kostenschätzung für Data Mining Projekte

Software-Entwicklung

  • Definition von Software-Architekturen
  • Skalierung für Big Data
  • Information Extraction und Information Retrieval Systeme
  • Erstellen von Triple Store Datenbanken ausgehend von unstrukturierten Daten (Text2RDF)
  • Implementierung von Softwarelösungen z.B. für Bio-Informatik oder biomedizinische Probleme
  • Decision Support Systeme
  • Systeme für non-standard BI Lösungen


Expertise

Maschinelle Lernverfahren

Künstliche Neuronale Netze, Deep Learning, Entscheidungsbäume, lineare/logistische Regression, Support Vector Machine (SVM), KNN, Bagging, Boosting, Random Forest

Cluster-Analyse

K-Means, Hierarchical Clustering, Self-Organizing Map (SOM), DBSCAN, t-SNE

Grafische Modelle

Bayesianische Netze, Naïve Bayes, Conditional Random Fields (CRF), Hidden Markov Models (HMM), Statistik

Text Mining

Named Entity Recognition, Relation Extraction, Topic Models, Semantic Web, Part-of-speech Tagging, Ontologien, Apache Lucene, Elasticsearch

Optimierungsverfahren

Simulated Annealing, Genetische Algoritmen, Ant Colony Optimization

Programmiersprachen

Java, C, C++, C#, .NET, WPF, Matlab, PHP, JavaScript, Perl, Bash, Basic, Pascal, LaTex

Betriebssysteme

Windows, Linux, Xen, VMWare, Amazon AWS, VirtualBox

Datenbanken

MySQL, MariaDB, PostgreSQL, Microsoft SQL Server, Oracle, SQLite, HSQLDB, Derby, MS Access, ORM, Hibernate

Web Technologien

HTML5, CSS3, XML, jQuery, Apache, Tomcat, Jetty, Bootstrap, Rest, SOAP, Axis, AJAX, WordPress, Google Adwords, Google Analytics, Piwik

Kommunikationsprotokolle

TCP/IP, EOBD, OBD-II, ISO15765-4 CAN, ISO14229 UDS, ISO14230-4 KWP2000, ISO9141-2, KWP1281, SAE-J1850, SAE-J2411, RS-232

Projektmanagement

PMP®, Scrum, Kanban, Jira, Confluence, Mantis, ZenDesk, Word, Excel, Powerpoint, Project

Entwicklungswerkzeuge

Eclipse, Visual Studio, IntelliJ, PhpStorm, CVS, SVN, Git, Maven, Selenium

Sprachen

Deutsch (Muttersprache), Englisch (verhandlungssicher), Französisch (Grundkenntnisse), Italienisch (Grundkenntnisse), Spanisch (Grundkenntnisse)


Projekte

Jun 2010 – heute

autoaid Logo
autoaid GmbH, Berlin
Position: Technischer Leiter (CTO)
Aufgabe: Entwicklung eines selbstlernenden Kfz-Diagnosesystems
Technologien: maschinelle Lernverfahren neuronale Netze Text-Mining Elasticsearch CAN Microcontroller
www.autoaid.de
Sep 2009 – Mai 2010

autoaid Logo
autoaid GmbH, Berlin
Position: Technischer Berater und Softwareentwickler
Aufgabe: Entwicklung eines selbstlernenden Kfz-Diagnosesystems
Technologien: maschinelle Lernverfahren neuronale Netze Text-Mining
www.autoaid.de
Aug 2008 – Nov 2009

Refined Labs Logo
Refined Labs GmbH, München
Position: Software Engineer Data Analytics
Aufgabe: Entwicklung eines automatisierten Bid-Management Systems
Technologien: Java Linux MySQL SVN maschinelle Lernverfahren Optimierungsverfahren
www.refinedlabs.com
Sep 2007 – Aug 2008

Siemens Logo
Siemens AG, München
Position: Data Scientist und Softwarentwickler
Aufgabe: Entwicklung einer webbasierten Plattform zur Text-Analyse
Technologien: Named Entity Recognition Relation Extraction Topic Models Bayesianische Netze Grafische Modelle
www.siemens.de
Sep 2006 – Aug 2007

Siemens Logo
Siemens AG, München
Position: Data Scientist und Softwarentwickler
Aufgabe: Weiterentwicklung einer webbasierten Plattform zur Analyse und Verwaltung biomedizinischer Daten
Technologien: Webservices Axis SOAP Lucene Ontologien
www.siemens.de
Jun 2007 – Jul 2007

Hospimed Logo
Hospimed International, Regensburg
Position: Softwareentwickler und Berater
Aufgabe: Dienstleistungen in den Bereichen Server und Datenbanken
Technologien: Linux Apache Virtualisierung SQL Java PHP Perl
www.hospimed.de
Sep 2005 – Aug 2006

Siemens Logo
Siemens AG, München
Position: Data Scientist und Softwarentwickler
Aufgabe: Entwicklung einer webbasierten Plattform zur Analyse und Verwaltung biomedizinischer Daten
Technologien: Java Tomcat HTML XML MySQL PostgreSQL ORM Hibernate
www.siemens.de
Mai 2006 – Jul 2007 ENETX eBusiness oHG, Regensburg
Position: Softwareentwickler und Berater
Aufgabe: Dienstleistungen in den Bereichen Web und Datenbanken
Technologien: HTML SQL PHP
www.enetx.de
Jul 2003 – Aug 2005

Siemens Logo
Siemens AG, München
Position: Softwareentwickler und Data Scientist
Aufgabe: Projekte im Bereich Computational Neuroscience, Implementierung von Algorithmen und Visualisierungstools
Technologien: Java Matlab C C++ neuronale Netze maschinelle Lernverfahren Clustering
www.siemens.de


Publikationen

Jul 2010 Semi-Automatic Assignment of Work Items Full Paper
Jonas Helming, Holger Arndt, Zardosht Hodaie, Maximilian Koegel, Nitesh Narayan
5th International Conference on Evaluation of Novel Approaches to Software Engineering (ENASE) , Athens, Greece
Download
Jun 2010 Universal Java Matrix Package Workshop Abstract and Poster
Holger Arndt
Workshop on Machine Learning Open Source Software, 27th International Conference on Machine Learning (ICML) , Haifa, Israel
Download
Mai 2010 From Informal Project Management Artifacts to Formal System Models Workshop Paper
Jonas Helming, Nitesh Narayan, Holger Arndt, Maximilian Koegel, Walid Maleej
Flexitools Workshop, International Conference for Software Engineering (ICSE) , Capetown, South Africa
Download
Jul 2009 Towards a Next-Generation Matrix Library for Java Full Paper
Holger Arndt, Markus Bundschus, Andreas Nägele
33rd Annual IEEE International Computer Software and Applications Conference (COMPSAC) , Seattle, USA
Download
Jul 2009 The Java Data Mining Package – A Data Processing Library for Java Abstract and Poster
Holger Arndt
33rd Annual IEEE International Computer Software and Applications Conference (COMPSAC) , Seattle, USA
Download
Jun 2008 Large-Scale Genetic Network Learning Full Paper
Andreas Nägele, Holger Arndt, Mathäus Dejori
18th European Conference on Artificial Intelligence (ECAI)
Jul 2006 Developing Gestural Input Workshop Paper
Matthias Kranz, Stefan Freund, Paul Holleis, Albrecht Schmidt, Holger Arndt
6th International Workshop on Smart Appliances and Wearable Computing (IWSAWC)
Download
Mai 2003 Parallelimplementierung von rekurrenten selbstorganisierenden Karten Diplomarbeit
Holger Arndt
Lehrstuhl für Kommunikationsnetze , Technische Universität München
Download


Software

Da ich oft mit Problemstellungen konfrontiert bin, die sich nicht mit Standardmethoden lösen lassen, habe ich dafür eigene Toolboxen für lineare Algebra, Datenanalyse und maschinelle Lernverfahren entwickelt. Diese Softwarepakete für Java stehen unter einer Open Source Lizenz jedem zur Verfügung und werden mittlerweile weltweit von Firmen und Forschungsintituten zur Datenanalyse eingesetzt. Eine komerzielle Nutzung ist ausdrücklich erlaubt und kostenlos möglich.

Universal Java Matrix Package

Das Universal Java Matrix Package (UJMP) ist eine Java Toolbox, die eine Reihe von Implementierungen für dichte und dünnbesetzte Matrizen bereitstellt, sowie eine große Anzahl an Rechenoperationen für lineare Algebra wie Multiplikation, Addition oder Subtraktion. Auch komplexere Methoden wie Mittelwertbildung, Korrelationskoeffizient, Standardabweichung, Ersetzungsverfahren für fehlende Werte oder Mututal Information sind vorhanden.

Für den Datenimport oder -export stehen zahlreiche Dateiformate zur Verfügung, auch direkte Verbindungen zu JDBC Datenbanken sind möglich.

Mehr erfahren

Java Data Mining Package

Das Java Data Mining Package (JDMP) ist eine Java Toolbox für Datenanalyse. Es erleichtert den Zugriff auf Datenquellen und maschinelle Lernverfahren wie Clustering, Regression, Klassifikation, Grafische Modelle, oder Optimierungsverfahren und stellt Module zur Visualisierung bereit. JDMP enthält eine Reihe von Algorithmen und Werkzeugen, stellt aber auch Interfaces zu anderen Paketen für maschinelles Lernen oder Data Mining zur Verfügung (u.a. Weka, LibSVM, Mallet, Lucene, Octave, Matlab, R).

Mehr erfahren


Kontakt

Ich freue mich auf Ihre Projektanfrage und bin offen für spannende Herausforderungen, egal ob in München, Berlin, Deutschland oder im Ausland.