Top 5 Programmiersprachen für Data Scientists

Die wohl wichtigste Technologie zeigt sich klar beim Vergleich der meistnachgefragten Programmiersprachen: in 68% der Data Science-Projekte sind Programmierkenntnisse in Python gefragt! Erst mit großem Abstand folgt R, das in knapp 20% der Projekte nachgefragt wird. Noch weniger verbreitet sind Java, Scala und MATLAB, die allesamt in deutlich weniger als 10% der Projekte verwendet werden.

Top 3 Cloud Provider für Data Scientists

Weit weniger eindeutig ist das Ergebnis hingegen bei den Cloud Providern. Hier liegen Azure und AWS fast gleichauf und werden in jeweils 16% bzw. 15% der Projekte nachgefragt.

 

Google Cloud schafft es mit 4% dagegen nur auf den abgeschlagenen dritten Platz. Diese Zahlen zeigen auch, dass Cloud Computing-Kenntnisse in einer hohen Anzahl an Data Science-Projekten gefragt sind und somit zum festen Skillset eines Data Scientists gehören sollten.

Top 5 Technologien für Data Scientists

Außerhalb von Programmiersprachen und Cloud Computing sind vor allem Technologiekenntnisse aus den Bereichen Datenanalyse und Distributed Computing begehrt.

 

Bei der Datenanalyse werden, wenig überraschend, besonders SQL-Kenntnisse gesucht, aber auch Microsoft Power BI wird bei 10% der Projekte nachgefragt. Im Bereich Distributed Computing sind insbesondere Apache Spark, Apache Hadoop und Databricks relevant.

 

Insgesamt zeigt sich also eine breitgefächerte Nachfrage für Technologiekenntnisse im Bereich Data Science.

 

Eine gute Möglichkeit diese zu erfüllen ist der Aufbau eines T-förmigen Kompetenzprofils, bei dem Basiskompetenzen in allen wichtigen Technologien und gesondertes Fachwissen in einigen wenigen Bereichen, z. B. der Python-Programmierung oder dem Cloud Computing, erworben werden.