Holger Arndt
Ihr Experte für Big Data Analyse, maschinelle Lernverfahren, künstliche Intelligenz, neuronale Netze und Text Mining
Als selbständiger Projektmanager und Data Scientist entwickle ich intelligente Lösungen für datenintensive Problemstellungen und biete Expertenwissen zu maschinellen Lernverfahren, Big Data Analyse, künstlicher Intelligenz, neuronalen Netzen und Data Mining bzw. Text Mining.
Projektanfrage Info für Recruiter
Ich biete
Für Ihre Projekte stehe ich Ihnen als Projektmanager, Data Scientist, Softwareentwickler oder Berater zur Verfügung.
Ich arbeite öfter mit Start-Ups zusammen und kenne daher die besonderen Herausforderungen und Schwierigkeiten in diesem Umfeld. Als Coach oder Consultant kann ich Sie dabei unterstützen, Ihre Geschäftsidee mit Hilfe von "Big Data" und maschinellen Lernverfahren im Businessplan fundiert auszuarbeiten und in die Realität umzusetzen.
Projektmanagement
- Projekt- und Teamleitung (zertifizierter PMP®)
- Interim-CTO
- Coaching und Beratung
- Agile Softwareentwicklung, Scrum, Kanban
Datenanalyse
- Data Mining für biomedizinische Daten (InnoCentive award in 2008)
- Data Mining für Customer Relationship Management Datenbanken
- Analyse von sozialen Netzwerken
- Analyse von unstrukturierten oder semi-strukturierten Daten (insbes. Text)
- Automatische Emailanalyse
- Social Media Monitoring
- Portfolioanalyse
- Churn Analyse
- Sentiment Analysis
- Betrugserkennung
- Risikoanalyse
Consulting
- Entwicklung von Business Intelligence Strategien
- Data Mining und Reporting Lösungen
- Analyse von Cross-Selling Potenzialen
- Optimierung von Marketing Strategien
- Kostenschätzung für Data Mining Projekte
Software-Entwicklung
- Definition von Software-Architekturen
- Skalierung für Big Data
- Information Extraction und Information Retrieval Systeme
- Erstellen von Triple Store Datenbanken ausgehend von unstrukturierten Daten (Text2RDF)
- Implementierung von Softwarelösungen z.B. für Bio-Informatik oder biomedizinische Probleme
- Decision Support Systeme
- Systeme für non-standard BI Lösungen
Expertise
Maschinelle Lernverfahren
Künstliche Neuronale Netze, Deep Learning, Entscheidungsbäume, lineare/logistische Regression, Support Vector Machine (SVM), KNN, Bagging, Boosting, Random Forest
Cluster-Analyse
K-Means, Hierarchical Clustering, Self-Organizing Map (SOM), DBSCAN, t-SNE
Grafische Modelle
Bayesianische Netze, Naïve Bayes, Conditional Random Fields (CRF), Hidden Markov Models (HMM), Statistik
Text Mining
Named Entity Recognition, Relation Extraction, Topic Models, Semantic Web, Part-of-speech Tagging, Ontologien, Apache Lucene, Elasticsearch
Optimierungsverfahren
Simulated Annealing, Genetische Algoritmen, Ant Colony Optimization
Programmiersprachen
Java, C, C++, C#, .NET, WPF, Matlab, PHP, JavaScript, Perl, Bash, Basic, Pascal, LaTex
Betriebssysteme
Windows, Linux, Xen, VMWare, Amazon AWS, VirtualBox
Datenbanken
MySQL, MariaDB, PostgreSQL, Microsoft SQL Server, Oracle, SQLite, HSQLDB, Derby, MS Access, ORM, Hibernate
Web Technologien
HTML5, CSS3, XML, jQuery, Apache, Tomcat, Jetty, Bootstrap, Rest, SOAP, Axis, AJAX, WordPress, Google Adwords, Google Analytics, Piwik
Kommunikationsprotokolle
TCP/IP, EOBD, OBD-II, ISO15765-4 CAN, ISO14229 UDS, ISO14230-4 KWP2000, ISO9141-2, KWP1281, SAE-J1850, SAE-J2411, RS-232
Projektmanagement
PMP®, Scrum, Kanban, Jira, Confluence, Mantis, ZenDesk, Word, Excel, Powerpoint, Project
Entwicklungswerkzeuge
Eclipse, Visual Studio, IntelliJ, PhpStorm, CVS, SVN, Git, Maven, Selenium
Sprachen
Deutsch (Muttersprache), Englisch (verhandlungssicher), Französisch (Grundkenntnisse), Italienisch (Grundkenntnisse), Spanisch (Grundkenntnisse)
Projekte
Jun 2010 – heute |
autoaid GmbH, Berlin Position: Technischer Leiter (CTO) Aufgabe: Entwicklung eines selbstlernenden Kfz-Diagnosesystems Technologien: maschinelle Lernverfahren neuronale Netze Text-Mining Elasticsearch CAN Microcontroller www.autoaid.de |
Sep 2009 – Mai 2010 |
autoaid GmbH, Berlin
Position: Technischer Berater und Softwareentwickler Aufgabe: Entwicklung eines selbstlernenden Kfz-Diagnosesystems Technologien: maschinelle Lernverfahren neuronale Netze Text-Mining www.autoaid.de |
Aug 2008 – Nov 2009 |
Refined Labs GmbH, München Position: Software Engineer Data Analytics Aufgabe: Entwicklung eines automatisierten Bid-Management Systems Technologien: Java Linux MySQL SVN maschinelle Lernverfahren Optimierungsverfahren www.refinedlabs.com |
Sep 2007 – Aug 2008 |
Siemens AG, München Position: Data Scientist und Softwarentwickler Aufgabe: Entwicklung einer webbasierten Plattform zur Text-Analyse Technologien: Named Entity Recognition Relation Extraction Topic Models Bayesianische Netze Grafische Modelle www.siemens.de |
Sep 2006 – Aug 2007 |
Siemens AG, München Position: Data Scientist und Softwarentwickler Aufgabe: Weiterentwicklung einer webbasierten Plattform zur Analyse und Verwaltung biomedizinischer Daten Technologien: Webservices Axis SOAP Lucene Ontologien www.siemens.de |
Jun 2007 – Jul 2007 |
Hospimed International, Regensburg Position: Softwareentwickler und Berater Aufgabe: Dienstleistungen in den Bereichen Server und Datenbanken Technologien: Linux Apache Virtualisierung SQL Java PHP Perl www.hospimed.de |
Sep 2005 – Aug 2006 |
Siemens AG, München Position: Data Scientist und Softwarentwickler Aufgabe: Entwicklung einer webbasierten Plattform zur Analyse und Verwaltung biomedizinischer Daten Technologien: Java Tomcat HTML XML MySQL PostgreSQL ORM Hibernate www.siemens.de |
Mai 2006 – Jul 2007 |
ENETX eBusiness oHG, Regensburg Position: Softwareentwickler und Berater Aufgabe: Dienstleistungen in den Bereichen Web und Datenbanken Technologien: HTML SQL PHP www.enetx.de |
Jul 2003 – Aug 2005 |
Siemens AG, München Position: Softwareentwickler und Data Scientist Aufgabe: Projekte im Bereich Computational Neuroscience, Implementierung von Algorithmen und Visualisierungstools Technologien: Java Matlab C C++ neuronale Netze maschinelle Lernverfahren Clustering www.siemens.de |
Publikationen
Jul 2010 |
Semi-Automatic Assignment of Work Items
Full Paper
Jonas Helming, Holger Arndt, Zardosht Hodaie, Maximilian Koegel, Nitesh Narayan 5th International Conference on Evaluation of Novel Approaches to Software Engineering (ENASE) , Athens, Greece Download |
Jun 2010 |
Universal Java Matrix Package
Workshop Abstract and Poster
Holger Arndt Workshop on Machine Learning Open Source Software, 27th International Conference on Machine Learning (ICML) , Haifa, Israel Download |
Mai 2010 |
From Informal Project Management Artifacts to Formal System Models
Workshop Paper
Jonas Helming, Nitesh Narayan, Holger Arndt, Maximilian Koegel, Walid Maleej Flexitools Workshop, International Conference for Software Engineering (ICSE) , Capetown, South Africa Download |
Jul 2009 |
Towards a Next-Generation Matrix Library for Java
Full Paper
Holger Arndt, Markus Bundschus, Andreas Nägele 33rd Annual IEEE International Computer Software and Applications Conference (COMPSAC) , Seattle, USA Download |
Jul 2009 |
The Java Data Mining Package – A Data Processing Library for Java
Abstract and Poster
Holger Arndt 33rd Annual IEEE International Computer Software and Applications Conference (COMPSAC) , Seattle, USA Download |
Jun 2008 |
Large-Scale Genetic Network Learning
Full Paper
Andreas Nägele, Holger Arndt, Mathäus Dejori 18th European Conference on Artificial Intelligence (ECAI) |
Jul 2006 |
Developing Gestural Input
Workshop Paper
Matthias Kranz, Stefan Freund, Paul Holleis, Albrecht Schmidt, Holger Arndt 6th International Workshop on Smart Appliances and Wearable Computing (IWSAWC) Download |
Mai 2003 |
Parallelimplementierung von rekurrenten selbstorganisierenden Karten
Diplomarbeit
Holger Arndt Lehrstuhl für Kommunikationsnetze , Technische Universität München Download |
Software
Da ich oft mit Problemstellungen konfrontiert bin, die sich nicht mit Standardmethoden lösen lassen, habe ich dafür eigene Toolboxen für lineare Algebra, Datenanalyse und maschinelle Lernverfahren entwickelt. Diese Softwarepakete für Java stehen unter einer Open Source Lizenz jedem zur Verfügung und werden mittlerweile weltweit von Firmen und Forschungsintituten zur Datenanalyse eingesetzt. Eine komerzielle Nutzung ist ausdrücklich erlaubt und kostenlos möglich.
Universal Java Matrix Package
Das Universal Java Matrix Package (UJMP) ist eine Java Toolbox, die eine Reihe von Implementierungen für dichte und dünnbesetzte Matrizen bereitstellt, sowie eine große Anzahl an Rechenoperationen für lineare Algebra wie Multiplikation, Addition oder Subtraktion. Auch komplexere Methoden wie Mittelwertbildung, Korrelationskoeffizient, Standardabweichung, Ersetzungsverfahren für fehlende Werte oder Mututal Information sind vorhanden.
Für den Datenimport oder -export stehen zahlreiche Dateiformate zur Verfügung, auch direkte Verbindungen zu JDBC Datenbanken sind möglich.
Java Data Mining Package
Das Java Data Mining Package (JDMP) ist eine Java Toolbox für Datenanalyse. Es erleichtert den Zugriff auf Datenquellen und maschinelle Lernverfahren wie Clustering, Regression, Klassifikation, Grafische Modelle, oder Optimierungsverfahren und stellt Module zur Visualisierung bereit. JDMP enthält eine Reihe von Algorithmen und Werkzeugen, stellt aber auch Interfaces zu anderen Paketen für maschinelles Lernen oder Data Mining zur Verfügung (u.a. Weka, LibSVM, Mallet, Lucene, Octave, Matlab, R).
Kontakt
Ich freue mich auf Ihre Projektanfrage und bin offen für spannende Herausforderungen, egal ob in München, Berlin, Deutschland oder im Ausland.