Άλγεβρα δεδομένων πάνω από Polars Ready for Production Use – Win Vector LLC

Άλγεβρα δεδομένων πάνω από Polars Ready for Production Use – Win Vector LLC

März 2, 2023 0 Von admin

Με John Mount επί

ο άλγεβρα δεδομένων είναι ένα σύστημα για τη σύνθεση εργασιών χειρισμού δεδομένων στην Python. Στην άλγεβρα δεδομένων, οι σωληνώσεις χειριστή (ή ακόμα και τα κατευθυνόμενα άκυκλα γραφήματα) είναι τα κύρια αντικείμενα. Η εφαρμογή λειτουργιών συνθέτει μικρές αγωγούς δεδομένων σε μεγαλύτερες. Αυτό επιτρέπει την προδιαγραφή υγρών, την επιθεώρηση και την κοινή χρήση των εργασιών επεξεργασίας και προετοιμασίας δεδομένων στην Python.

Η ίδια η άλγεβρα δεδομένων μπορεί στη συνέχεια να εφαρμοστεί σε αποθήκες δεδομένων ή σε αναπαραστάσεις δεδομένων σε πίνακα όπως τα Pandas, πολικός ή βάσεις δεδομένων SQL (BigQuery, PostgreSQL, SQLite, SparkSQL, και ούτω καθεξής). Αυτό σημαίνει ότι ο ίδιος μετασχηματισμός δεδομένων μπορεί να πραγματοποιηθεί ή να υλοποιηθεί είτε στη μνήμη είτε σε μαζική κλίμακα.

Η ανακοίνωσή μου εδώ είναι: Αισθάνομαι ότι ο προσαρμογέας Polars της άλγεβρας δεδομένων είναι έτοιμος για χρήση στην παραγωγή! Πρόσφατα ολοκλήρωσα αρκετά τεστ αποδοχής που είμαι ικανοποιημένος που μπορεί κανείς να χρησιμοποιήσει με ασφάλεια αυτόν τον συνδυασμό στην παραγωγή δεδομένων πελατών. Αυτό είναι καινούργιο, επομένως θα υπάρξουν μερικά χτυπήματα.

Για μένα αυτό είναι πολύ συναρπαστικό. Χρησιμοποιώντας την ίδια σημείωση άλγεβρας δεδομένων, μπορούμε τώρα να εργαστούμε ρευστά σε πολλαπλά συστήματα δεδομένων στην Python.

Εξακολουθώ να εργάζομαι για συντονισμό και τεκμηρίωση. Αλλά θα προσφέρω προσαρμοσμένη εκπαίδευση σε ομάδες που ενδιαφέρονται να ενσωματώσουν την άλγεβρα δεδομένων στις ροές εργασίας τους.

Κατηγορίες: Συναρπαστικές Τεχνικές Γνώμη

Με ετικέτα: άλγεβρα δεδομένων επιστήμη δεδομένων Polars pydata

John Mount