Abhandlung über das Erstellen eines Notebooks in Azure Data Studio

Ein Notebook ist ein interaktives Dokument, das Code (in verschiedenen Programmiersprachen), Text und Visualisierungen kombiniert. Diese Funktion ist besonders nützlich für Datenanalysen, Berichte und Dokumentationen, da Codeblöcke direkt ausgeführt und die Ergebnisse eingebettet werden können. Azure Data Studio ist eine beliebte Entwicklungsumgebung, die speziell für Datenbankadministratoren und Datenanalysten entwickelt wurde. Hier zeige ich dir Schritt für Schritt, wie du ein Notebook in Azure Data Studio erstellst und damit arbeitest.

Voraussetzungen

Bevor wir loslegen, solltest du sicherstellen, dass du folgende Voraussetzungen erfüllst:

  • Azure Data Studio muss auf deinem Computer installiert sein.
  • Die Notebook-Erweiterung für Azure Data Studio muss aktiviert sein (diese ist standardmäßig dabei, aber wir überprüfen es trotzdem).

Schritt 1: Installation und Vorbereitung

  1. Azure Data Studio installieren:
  • Lade Azure Data Studio von der offiziellen Microsoft-Website herunter und installiere es.
  • Folge den Installationsanweisungen für dein Betriebssystem (Windows, Mac, oder Linux).
  1. Erweiterungen überprüfen:
  • Öffne Azure Data Studio.
  • Klicke auf das Symbol für Erweiterungen auf der linken Seitenleiste (oder verwende die Tastenkombination Ctrl+Shift+X).
  • Suche nach „Notebooks“. Wenn die Erweiterung bereits installiert ist, ist alles bereit. Falls nicht, installiere die Erweiterung.

Schritt 2: Ein Notebook erstellen

  1. Neues Notebook anlegen:
  • Öffne Azure Data Studio.
  • Gehe zum Menü Datei und wähle Neues Notebook (alternativ kannst du auch in der Startansicht auf die Option Notebook klicken).
  1. Kernel auswählen:
  • Nachdem das Notebook geöffnet wurde, musst du den richtigen Kernel auswählen. Der Kernel gibt an, welche Programmiersprache du im Notebook verwenden willst.
  • Standardmäßig sind zwei Haupt-Kernel verfügbar:
    • SQL: Zum Ausführen von SQL-Abfragen.
    • Python: Für Analysen und Skripte mit Python.
  • Du kannst den Kernel oben rechts im Notebook-Fenster auswählen, je nach Bedarf (z.B. SQL für Datenbankabfragen oder Python für komplexe Analysen).

Schritt 3: Arbeiten mit Zellen

Ein Notebook besteht aus verschiedenen Zellen, die entweder Code oder Text enthalten. Hier erkläre ich dir, wie du die beiden Zellentypen verwendest.

  1. Textzellen (Markdown):
    • Textzellen verwenden das Markdown-Format. Sie sind perfekt geeignet, um Erklärungen, Kommentare und Dokumentationen hinzuzufügen.
    • Um eine neue Textzelle hinzuzufügen, klicke auf das + Text-Symbol.
    • Du kannst Formatierungen wie Überschriften (# für H1, ## für H2 usw.), Listen, Links und sogar Bilder einfügen.
    • Beispiel für Markdown:
      • # Überschrift
        Dies ist ein Beispieltext.
        – Punkt 1
        – Punkt 2
  2. Codezellen:
    • Codezellen sind der Kern des Notebooks, in denen du den ausführbaren Code schreibst.
    • Um eine neue Codezelle hinzuzufügen, klicke auf das + Code-Symbol.
    • Je nach gewähltem Kernel kannst du entweder SQL- oder Python-Code in die Zelle schreiben.
    • Beispiel für eine SQL-Abfrage:
      • SELECT * FROM Employees;

Schritt 4: Code ausführen

Um den Code in einer Zelle auszuführen, folge diesen Schritten:

  1. Klicke auf das Play-Symbol in der oberen rechten Ecke der Zelle, oder drücke Shift + Enter, um die Zelle auszuführen.
  2. Die Ergebnisse werden direkt unterhalb der Codezelle angezeigt. Bei SQL-Abfragen siehst du eine Tabelle, während Python-Visualisierungen wie Diagramme oder DataFrames angezeigt werden können.

Schritt 5: Notebook speichern und teilen

Sobald du deine Analyse abgeschlossen hast, kannst du das Notebook speichern und später erneut verwenden oder es mit anderen teilen.

  1. Speichern: Klicke auf Datei > Speichern unter, um das Notebook im .ipynb-Format zu speichern.
    • Das .ipynb-Format ist das Standardformat für Jupyter-Notebooks, was bedeutet, dass du es auch in anderen Umgebungen wie Jupyter Notebook öffnen kannst.
  2. Teilen: Du kannst das gespeicherte Notebook mit Kollegen teilen, die ebenfalls Azure Data Studio oder ein anderes Notebook-Tool verwenden. Alternativ kannst du das Notebook auch als statisches Dokument exportieren (z.B. als PDF).

Schritt 6: Erweiterungen und Anpassungen

Azure Data Studio unterstützt eine Vielzahl von Erweiterungen, die die Funktionalität von Notebooks erweitern können. Einige interessante Erweiterungen sind:

  • Plotly und Matplotlib für interaktive und statische Diagramme in Python.
  • Spark für die Verarbeitung großer Datenmengen direkt aus dem Notebook.
  • PowerShell Kernel für das Schreiben und Ausführen von PowerShell-Skripten.

Fazit

Notebooks in Azure Data Studio bieten eine leistungsstarke Möglichkeit, SQL-Abfragen, Python-Analysen und Dokumentationen in einem einzigen, interaktiven Dokument zu kombinieren. Es ermöglicht nicht nur die Ausführung von Code, sondern auch die einfache Visualisierung von Daten und das Erstellen von Berichten. Durch die einfache Bedienung und die Unterstützung mehrerer Sprachen sind Notebooks ein unverzichtbares Werkzeug für alle, die regelmäßig mit Daten arbeiten.

Mit den hier gezeigten Schritten kannst du schnell und einfach ein eigenes Notebook erstellen und nutzen, um deine Datenanalysen effektiver zu gestalten.