PostgreSQL Histogramm mit Daten erstellen Create

Während der gesamten Datenverarbeitung und -analyse unterstützen Sie Histogramme dabei, die Häufigkeitsverteilung darzustellen und auf einfache Weise Erkenntnisse zu gewinnen. Wir werden uns einige verschiedene Methoden ansehen, um die Häufigkeitsverteilung in PostgreSQL zu erhalten. Um ein Histogramm in PostgreSQL zu erstellen, können Sie eine Vielzahl von PostgreSQL-Histogrammbefehlen verwenden use. Wir werden jeden einzeln erklären.

Stellen Sie zunächst sicher, dass die PostgreSQL-Befehlszeilen-Shell und pgAdmin4 auf Ihrem Computersystem installiert sind. Öffnen Sie nun die PostgreSQL-Befehlszeilen-Shell, um mit der Arbeit an Histogrammen zu beginnen. Sie werden sofort aufgefordert, den Servernamen einzugeben, an dem Sie arbeiten möchten. Standardmäßig ist der 'localhost'-Server ausgewählt. Wenn Sie beim Springen zur nächsten Option keine eingeben, wird die Standardeinstellung beibehalten. Danach werden Sie aufgefordert, den Datenbanknamen, die Portnummer und den Benutzernamen einzugeben, an dem Sie arbeiten möchten. Wenn Sie keine angeben, wird mit der Standardeinstellung fortgesetzt. Wie Sie dem unten angehängten Bild entnehmen können, arbeiten wir an der 'Test'-Datenbank. Geben Sie zuletzt Ihr Passwort für den jeweiligen Benutzer ein und machen Sie sich bereit.

Beispiel 01:

Wir müssen einige Tabellen und Daten in unserer Datenbank haben, an denen wir arbeiten können. Also haben wir eine Tabelle 'Produkt' in der Datenbank 'Test' erstellt, um die Aufzeichnungen verschiedener Produktverkäufe zu speichern. Diese Tabelle belegt zwei Spalten. Eine ist 'order_date', um das Datum zu speichern, an dem die Bestellung abgeschlossen wurde, und die andere ist 'p_sold', um die Gesamtzahl der Verkäufe an einem bestimmten Datum zu speichern. Versuchen Sie die folgende Abfrage in Ihrer Befehlsshell, um diese Tabelle zu erstellen.

>> CREATE TABLE product( order_date DATE, p_sold INT);

Im Moment ist die Tabelle leer, also müssen wir einige Datensätze hinzufügen. Versuchen Sie dazu den folgenden INSERT-Befehl in der Shell.

>> IN PRODUKTWERTE EINFÜGEN ('2021-03-01',1250), ('2021-04-02',555), ('2021-06-03',500), ('2021-05-04' ,1000), ('2021-10-05',890), ('2021-12-10',1000), ('2021-01-06',345), ('2021-11-07',467 ), ('2021-02-08',1250), ('2021-07-09',789);

Jetzt können Sie mit dem SELECT-Befehl wie unten angegeben überprüfen, ob die Tabelle Daten enthält.

>> AUSWÄHLEN * VOM Produkt;

Nutzung von Boden und Mülleimer:

Wenn Sie möchten, dass PostgreSQL-Histogramm-Bins ähnliche Zeiträume bereitstellen (10-20, 20-30, 30-40 usw.).), führen Sie den folgenden SQL-Befehl aus. Wir schätzen die Bin-Nummer aus der folgenden Aussage, indem wir den Verkaufswert durch eine Histogramm-Bin-Größe, 10 ., teilen.

Dieser Ansatz hat den Vorteil, dass die Bins dynamisch geändert werden, wenn Daten hinzugefügt, gelöscht oder geändert werden. Es fügt auch zusätzliche Bins für neue Daten hinzu und/oder löscht Bins, wenn ihre Zählung Null erreicht. Dadurch können Sie in PostgreSQL effizient Histogramme erstellen generate.

Umstellung Floor(p_sold/10)*10 mit Floor(p_sold/100)*100 zur Erhöhung der Behältergröße auf 100.

Verwenden der WHERE-Klausel:

Sie erstellen eine Häufigkeitsverteilung unter Verwendung der CASE-Deklaration, während Sie die zu generierenden Histogramm-Bins verstehen oder wie die Histogramm-Container-Größen variieren. Für PostgreSQL ist unten eine weitere Histogramm-Anweisung:

>> WÄHLEN SIE '100-300' ALS Preis_ZWISCHEN, ANZAHL(P_verkauft) ALS ANZAHL FROM Produkt WHERE p_verkauft ZWISCHEN 100 UND 300 UNION (WÄHLEN Sie '300-600' ALS Preis_zwischen, ANZAHL(P_Verkauft) ALS ZAHL VON Produkt WHERE P_verkauft ZWISCHEN 300 UND 600 ) UNION (SELECT '600-900' AS price_ between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 600 AND 900) UNION (SELECT '900-1300' AS price_ between, COUNT(p_sold) AS COUNT FROM product WHERE p_sold BETWEEN 900 UND 1300);

Und die Ausgabe zeigt die Histogramm-Häufigkeitsverteilung für die Gesamtbereichswerte der Spalte 'p_sold' und die Zählnummer. Die Preise reichen von 300-600 und 900-1300 hat eine Gesamtzahl von 4 separat. Der Verkaufsbereich von 600-900 hat 2 Zählungen, während der Bereich 100-300 0 Verkaufszahlen hat.

Beispiel 02:

Betrachten wir ein weiteres Beispiel zur Veranschaulichung von Histogrammen in PostgreSQL. Wir haben eine Tabelle 'student' erstellt, indem wir den unten zitierten Befehl in der Shell verwendet haben. In dieser Tabelle werden die Informationen zu den Schülern und die Anzahl der fehlgeschlagenen Zahlen gespeichert.

>> CREATE TABLE student(std_id INT, fail_count INT);

Die Tabelle muss einige Daten enthalten. Daher haben wir den Befehl INSERT INTO ausgeführt, um Daten in die Tabelle 'student' wie folgt hinzuzufügen:

>> EINSETZEN IN Schülerwerte (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 .) , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 .) ), (127, 40), (128, 8);

Jetzt wurde die Tabelle mit einer enormen Datenmenge gemäß der angezeigten Ausgabe gefüllt. Es hat zufällige Werte für std_id und die fail_count der Schüler.

>> AUSWÄHLEN * VOM Schüler;

Wenn Sie versuchen, eine einfache Abfrage auszuführen, um die Gesamtzahl der Fehler eines Schülers zu erfassen, erhalten Sie die unten angegebene Ausgabe. Die Ausgabe zeigt nur einmal die separate Anzahl von Fehlern jedes Schülers aus der 'count'-Methode, die für die Spalte 'std_id' verwendet wird. Das sieht nicht sehr befriedigend aus.

>> AUSWÄHLEN fail_count, COUNT(std_id) FROM student GROUP BY 1 ORDER BY 1;

Wir werden in diesem Fall für ähnliche Zeiträume oder Spannen wieder die Floor-Methode verwenden. Führen Sie also die unten angegebene Abfrage in der Befehlsshell aus. Die Abfrage teilt den 'fail_count' der Schüler durch 100.00 und wendet dann die Bodenfunktion an, um einen Behälter der Größe 100 . zu erstellen. Dann fasst es die Gesamtzahl der Studenten zusammen, die in diesem bestimmten Bereich wohnen.

Fazit:

Wir können mit PostgreSQL ein Histogramm mit einer der oben genannten Techniken erstellen, abhängig von den Anforderungen. Sie können die Histogramm-Buckets auf jeden gewünschten Bereich ändern; einheitliche Intervalle sind nicht erforderlich. In diesem Tutorial haben wir versucht, die besten Beispiele zu erklären, um Ihr Konzept zur Histogrammerstellung in PostgreSQL zu verdeutlichen. Ich hoffe, dass Sie mit einem dieser Beispiele bequem ein Histogramm für Ihre Daten in PostgreSQL erstellen können.