Datenwissenschaft ist ein interdisziplinäres Feld, das Methoden und Techniken aus Bereichen wie Statistik, maschinelles Lernen, Bayesian usw. enthält. Sie alle zielen darauf ab, spezifische Erkenntnisse aus den Daten zu gewinnen. In diesem Artikel listen wir einige hervorragende datenwissenschaftliche Bücher auf, die die Vielzahl der Themen unter Data Science abdecken.
1. Das Element des Datenanalysestils

Dieses Buch gibt einen Überblick über Data Science. Data Science ist ein sehr großer Überbegriff und dieses Buch ist gut für alle, die versuchen, im Feld zum ersten Mal nasse Füße zu bekommen. Lesen Sie es, um zu verstehen, was Data Science ist, was einige allgemeine Aufgaben und Algorithmen sind und einige allgemeine Tipps und Tricks.
2. Grundlagen der Datenwissenschaft
Foundations of Data Science ist eine Abhandlung über ausgewählte Bereiche, die die Grundlage der Datenwissenschaft bilden, wie Lineare Algebra, LDA, Markov-Ketten, Grundlagen des maschinellen Lernens und Statistik. Die idealen Leser für das Buch sind unerfahrene Datenwissenschaftler, die ihr mathematisches und theoretisches Verständnis des Fachgebiets verbessern möchten.
3. Mining riesiger Datensätze
Das Buch basiert auf den Stanford-Kursen CS246 und CS35A und hilft Benutzern, Themen für das Data Mining mit großen Datensätzen zu erlernen. Oft besteht ein sehr häufiges Problem, das ein Datenwissenschaftler lösen muss, darin, einfache numerische Aufgaben (die Sie erledigen können, indem Sie kleine Programmteile schreiben) an einem sehr großen Datensatz auszuführen. MMDS arbeitet genau darauf hin. Hinzu kommen Themen wie Dimensionsreduktion und Empfehlungssysteme, die Ihnen helfen, mehr über die Anwendung linearer Algebra und metrischer Distanzen in der realen Welt zu erfahren. Ein absolutes Muss für alle Datenwissenschaftler.
4. Python-Handbuch zur Datenwissenschaft

Das Python Data Science Handbook lehrt die Anwendung verschiedener Data-Science-Konzepte in Python. Wahrscheinlich das beste Buch, um Data Science in Python zu lernen (nur gleichwertig ist Wes McKinneys Mausbuch), dieses Buch kann auch kostenlos auf Github gelesen werden. So kannst du lernen, ohne Geld auszugeben.
5. Praktisches maschinelles Lernen und Big Data

6. Denken Sie an Statistiken

Think Stats vermittelt den Lesern die Grundlagen der Statistik, das heißt, die Leser werden statistische Konzepte und Verteilungen auf reale Datensätze anwenden und versuchen, mithilfe mathematischer Merkmale mehr über Daten zu erfahren. Wahrscheinlich eines der besten Bücher für den Einstieg, wenn Sie Statistik mit Python lernen möchten.
7. Denken Sie an Bayes

Bayesian Statistics funktioniert etwas anders als normale Statistiken. Aufgrund der Konzepte der Unsicherheit und der Anpassung von Verteilungen an reale Datensätze eignen sich Bayes-Methoden besser, um mehr über reale Datensätze zu erfahren. Prof. Downeys extrem cooler „Learn by programming it in Python“ -Stil macht das Buch zu einem Leckerbissen für Anfänger mit Bayesschen Methoden.
8. Einführung in lineare dynamische Systeme
Dieses Buch lehrt angewandte Lineare Algebra in realen Systemen. Die Anwendungen umfassen Schaltungen, Signalverarbeitungs-, Kommunikations- und Steuerungssysteme. Einen Link zu den Kursnotizen der vergangenen Jahre von Professor Boyd finden Sie hier.
9. Konvexe Optimierung

Konvexe Optimierung ist das, was viele Algorithmen für maschinelles Lernen (und fast alle Deep-Learning-Algorithmen) im Hintergrund verwenden, um den optimalen Parametersatz zu ermitteln.
10. Grundlagen der Metaheuristik

Metaheuristiken sind schnell erlernbare probabilistische Methoden, um Aufgaben zu erledigen, für die Sie sonst Programme schreiben müssten, um mit Brute Force zu suchen. Bei vielleicht kleinen Daten erfordert die Implementierung von Brute-Force-Ansätzen weniger Aufwand, sie erschöpfen sich jedoch sehr schnell mit der Menge der hinzugefügten Daten. Dieses Buch ist wahrscheinlich die beste Einführung in metaheuristische Methoden wie Genetische Algorithmen, Bergsteigen, Co-Evolution und (grundlegendes) Reinforcement Learning.
11. Maschinelles Lernen in Python: Hauptentwicklungen und Technologietrends in den Bereichen Datenwissenschaft, maschinelles Lernen und künstliche Intelligenz
Ein guter Überblick über Python-Tools in Data Science. Ein sehr gutes Dokument für einen erfahrenen Python-Entwickler, der in die Datenwissenschaft einsteigen möchte, oder für jemanden, der von R for Data Science zu Python wechselt. Insgesamt sollten Sie diesen Artikel lesen, wenn Sie verstehen möchten, was Python für Data Science tun kann.
12. Angewandte Datenwissenschaft

Applied Data Science von Langmore und Krasner ist ein Buch, das einen sehr praktischen Ansatz für den Unterricht in Data Science verfolgt. Von der Verwendung von Git über die Vermittlung von Basic Python bis hin zur Vermittlung von Grundlagen verschiedener Algorithmen, die im Bereich der Datenwissenschaft häufig verwendet werden.
13. Das Banditen-Buch
Da immer mehr Daten angesammelt werden, ist die Entscheidungsfindung nicht mehr eine Funktion der Intuition, sondern eine Funktion der gesammelten Daten. Was ist die richtige Farbe eines Kauf-Buttons auf einer E-Commerce-Website für Drogentests und finanzielle Portfolioentscheidungen? Banditenalgorithmen werden überall eingesetzt? Ein sehr gutes Buch, um sich mit dem Thema „Banditentum“ vertraut zu machen!
14. Kommentierte Algorithmen
Ein Buch, das dir beibringt, viele numerische Algorithmen in Python zu codieren. Eine hervorragende Ressource, wenn Sie lernen möchten, wie mathematische Programme implementiert werden, oder Python mit interessanten Problemstellungen lernen möchten.
15. Statistische Inferenz zum Computerzeitalter

Ein Buch von Efron und der legendären Hastie, die darüber nachdenken, wie statistische Inferenz (sowohl frequentistisch als auch bayesianisch) in der Neuzeit mit der heute verfügbaren Rechenleistung durchgeführt werden sollte, und nicht mit dem Stift-and-Paper-Ansatz, den die meisten anderen Bücher verfolgen. Es ist eine Pflichtlektüre für jeden (Anfänger oder Fortgeschrittenen), der beabsichtigt, Statistik im wirklichen Leben einzusetzen.
16. Buch über kausale Inferenz
„Korrelation ist keine Kausalität“ ist ein Satz, den Datenwissenschaftler häufig verwenden. Aber wie trennt man die beiden? Dieses Buch gibt Antworten, indem es Datenwissenschaftlern Techniken zur kausalen Inferenz beschreibt. Zum Lesen benötigen Sie gute Wahrscheinlichkeitsgrundlagen, nichts für Anfänger.
17. Rechnergestützter optimaler Transport
Optimaler Transport ist die Mathematik der Zuordnung von einer Gruppe von Verteilungen in eine andere. Dies ist wahrscheinlich einer der wenigen Bereiche der Datenwissenschaft, der mehr als eine Fields-Medaille (die höchste Auszeichnung in Mathematik) gewonnen hat. Die mathematischen Konzepte werden in vielen Algorithmen für maschinelles Lernen und Deep Learning als Entfernungsmetriken und zur Lösung von Aufgabenproblemen verwendet.
18. Algebra, Topologie, Differentialrechnung und Optimierungstheorie für Informatik und maschinelles Lernen
Das Buch zielt darauf ab, verschiedene mathematische Bereiche zu unterrichten, die in Informatik und maschinellem Lernen erforderlich sind. Ziemlich mathematisch und eine gute Quelle für diejenigen, die aus mathematischen Fachgebieten in die Datenwissenschaft einsteigen möchten.
19. Data Mining und Analyse

Data Mining ist, wie Sie vielleicht in dem bereits erwähnten bekannteren MMDS-Buch gesehen haben, eine Methode, um Berechnungen mit einem großen Datensatz effektiv durchzuführen. Diese Berechnungen können mit Brute-Force-Methoden durchgeführt werden und funktionieren möglicherweise bei kleinen Datensätzen gut, bei großen Datensätzen kann es jedoch sehr lange dauern. Ein gutes Einführungs- und Nachschlagewerk für Data Mining.
20. Rechnergestütztes und inferentielles Denken
Untersucht verschiedene Aspekte der Datenwissenschaft von der Programmierung in Python über Kausalität, Tabellen, Visualisierung bis hin zu grundlegenden Statistiken. Aus einem Grundkurs an der UC Berkeley, also eine gute Ressource für Anfänger.
21. Mathematische Grundlagen der Datenwissenschaft

Wie der Name schon sagt, enthält und erklärt das Buch eine mathematische Abhandlung, die hinter datenwissenschaftlichen Konzepten wie konvexer Optimierung und Dimensionalitätsreduktion steckt. Dieses Buch wird empfohlen, wenn Sie Mathematik mögen oder speziell die Mathematik hinter diesen Konzepten lernen möchten.
22. Informationstheorie für intelligente Menschen
Informationstheorie ist neben linearer Algebra, konvexer Optimierung und Statistik eine der vier mathematischen Theorien, die Sie in der Datenwissenschaft finden. Dies ist ein gutes Tutorial, um die Theorie zu verstehen. Das Gute ist, dass das Tutorial für Anfänger zugänglich ist.
23. Einführung in die angewandte lineare Algebra — Das VMLS Book

Mein Lieblingsbuch zur linearen Algebra von den vielen, die ich in dieser Liste erwähnen werde. Es ist für Anfänger zugänglich und hat ein sehr angewandtes Gefühl, sodass sich der Leser nicht in vielen mathematischen Konzepten verliert.
24. Lineare Algebra — Hefferson

Viele Leute glauben, dass es die besten Ressourcen für lineare Algebra für Anfänger sind, die nach Strangs Bibel verfügbar sind. Auch sehr praktisch (Programmierübungen in SAGE, was im Grunde Python ist), aber eher für Anfänger als für Praktiker.
25. Lineare Algebra — Als Einführung in die abstrakte Mathematik
Dieses Buch fühlt sich an wie mein College-Buch über lineare Algebra (das von vielen Studenten geliebt wurde, die bei mir Ingenieurwissenschaften studiert haben). Ich verliere mich ein bisschen, wenn es zu viel Mathematik und etwas weniger Anwendungen gibt, aber viele würden die Eleganz solcher Bücher genießen.
26. Grundlagen der linearen Algebra und Optimierungen
Dieses Buch kombiniert Lineare Algebra mit Optimierungsalgorithmen. Nochmals, mehr mathematische Bücher für Leute, die den Stil mögen.
27. Vorlesungsnotizen zur linearen Algebra - Lerner
Ich fand es wirklich gut, es ist, als würde man dir mehrere gelöste Probleme zeigen, damit du lernst. Nicht so streng wie in früheren Büchern und mehr „Lernen durch Zeigen“. Gute Auffrischung für Leute, die Lineare Algebra schon lange nicht mehr benutzt haben.
28. Vorlesungsskript zur randomisierten linearen Algebra
Nicht jeder wird das Buch lesen müssen, da es sich mit probabilistischen Algorithmen zur Lösung linearer Algebra-Probleme befasst. Nützlich, wenn Sie an großen Matrizen und Vektoren arbeiten, bei denen einfache Algorithmen nicht funktionieren.
29. Lineare Algebra mit Produkten für den Außenbereich
Eine ganz andere Art, Lineare Algebra zu betrachten. Wenn Sie Lineare Algebra cool finden, sollten Sie versuchen, Probleme auf diese neue Art zu visualisieren.
30. Lineare Algebra — Cherney et al.
Ein weiteres kostenloses Buch für Lineare Algebra auf Hochschulniveau. Gut für Anfänger. Es gibt auch Probleme mit den Hausaufgaben, wenn Sie üben möchten.
31. Die Matrixrechnung, die Sie für Deep Learning benötigen
Wie der Name schon sagt, hilft Ihnen das Tutorial dabei, die Matrixrechnung zu verstehen, die Sie für Deep Learning benötigen.
32. Optimierung: Eine Einführung
Die Optimierung von Parametern ist bei Problemen in allen technischen Bereichen erforderlich. Konvexe Optimierung wird zwar in vielen Deep-Learning-Algorithmen verwendet, aber wenn man sich mit anderen Algorithmen wie der linearen Programmierung auskennt, erweitert Simplex den eigenen Horizont.
33. Scipy Vorlesungsnotizen

Wenn Sie im Bereich Data Science arbeiten möchten, müssen Sie den wissenschaftlichen Python-Stack lernen. Wahrscheinlich das beste allgemeine Tutorial, um Numpy, Scipy, Scikit-Learn, Scikit-Image und alle Bibliotheken zu lernen, die Sie benötigen.
34. Pandas Mega-Tutorial
Dieses umfangreiche Tutorial wurde vom Pandas-Entwicklungsteam erstellt, um die Bibliothek zu erlernen und zu verstehen. Pandas ist eine Bibliothek, die Sie unbedingt lernen müssen, wenn Sie in der Datenwissenschaft arbeiten. Es gibt kein Entkommen.
35. Kalman- und Bayessche Filter in Python
Kalman-Filter und andere Bayes-Filter sind nützlich, wenn Sie mit verrauschten Daten arbeiten, die mit Zeit einhergehen und die an ein bestimmtes Modell angepasst werden können, wobei Parameter abgeleitet werden können. Diese Modelle leiten zum einen die Parameter ab und modellieren zum anderen das Rauschen. Obwohl die am häufigsten verwendeten Beispiele Standortdaten sind, können ähnliche Filter auch bei Prognosen gut funktionieren. (Auch verfügbar unter Github)
36. Statistische Inferenz für die Datenwissenschaft

Wir haben uns zuvor mehrere Bücher zur statistischen Inferenz angesehen, aber dieses wurde speziell unter Berücksichtigung von Datenwissenschaftlern geschrieben. Wenn Sie ein Datenwissenschaftler sind und versuchen, statistische Inferenz schnell in den Griff zu bekommen, ist dies Ihr Buch.
37. Mathematik für maschinelles Lernen

Ein ausführliches Buch, das Ihnen Mathematik beibringt, das benötigt wird, um die meisten Algorithmen für maschinelles Lernen zu verstehen. Anfängerfreundlich.
38. Theorie sehen
Ein Buch, das das Erlernen von Wahrscheinlichkeiten mithilfe interaktiver Visualisierungen einfach macht.
39. Grundlagen der Statistik
Ein Buch, das Sie in das Studium der Statistik einführt. Anfänger, die noch nie Statistik gelernt haben, sollten hier beginnen.
40. Statistik öffnen
Kombination aus Buch und Videovorträgen, die den Lesern die Statistik näher bringen.
41. Fortgeschrittene Datenanalyse aus elementarer Sicht
Eine allgemeine Einführung in verschiedene Konzepte von Data Science. Dazu gehören Kausalmodelle, Regressionsmodelle, Faktormodelle und so weiter. Die Beispielprogramme befinden sich in R.
42. Schnelle Daten, intelligent und skalierbar
Buch, das die Optimierung von Datenbanken für schnelle Abfragen erklärt. Es erzählt von verschiedenen möglichen Modellen in der realen Welt.
43. Einführung in die Geschichte der mehrarmigen Banditen
Multiarmierte Banditen sind Algorithmen, die im Laufe der Zeit unter Unsicherheit eine Entscheidung treffen. Dieses Buch ist eine einführende Abhandlung über mehrarmige Banditen.
44. Vorlesungen zur Quantenökonomie
Vorlesungen über Quantitative Ökonomie und Code in Ihren bevorzugten Programmiersprachen: Python oder Julia.
45. Statistiken mit Julia
Statistiker lernt Julia oder (etwas weniger wahrscheinlich) Julia-Programmierer lernt Statistik? Probiere dieses Buch aus.
46. Informationstheorie, Inferenz- und Lernalgorithmen
Informationstheorie und Inferenz werden im Allgemeinen unterschiedlich behandelt, aber das Buch des späten Professors MacKay versucht, beide Themen anzugehen.
47. Wissenschaftliche Verbesserung der Entscheidungsfindung und des Risikomanagements
Ein nicht allzu technisches Tutorial zur probabilistischen Entscheidungsfindung.
48. Dreiunddreißig Miniaturen: Mathematische und algorithmische Anwendungen der linearen Algebra
Dies ist nicht wirklich ein Buch über lineare Algebra, sondern ein paar coole Anwendungen der linearen Algebra, die in einem Buch zusammengefasst sind.
49. Ein Tutorial zu genetischen Algorithmen
Genetische Algorithmen sind Werkzeuge, die alle Datenwissenschaftler irgendwann in ihrem Leben verwenden müssen. Dieses Tutorial hilft Anfängern zu verstehen, wie genetische Algorithmen funktionieren.
50. Rechnen in der Betriebsforschung mit Julia
Wenn Sie an Warteschlangen oder anderen operativen Forschungsproblemen arbeiten, ist Julia möglicherweise eine Programmiersprache, die Ihnen sehr gefallen könnte. Die Programme sind wie Python leicht lesbar und laufen unglaublich schnell.
Wenn Sie ein angehender Datenwissenschaftler sind und glauben, dass Sie das Zeug dazu haben, vor Ort zu arbeiten, senden Sie uns Ihre fortsetzen um die Chance zu bekommen, Teil des Parallele Punkte Datenwissenschaftsteam.

.jpg)