Αυτό προκύπτει από το νέο Ενημερωτικό Δελτίο της Επιτροπής Ανταγωνισμού ενώ όπως έχει επισημανθεί «συγκεκριμένα, εξετάστηκε κυρίως το φαινόμενο της ασυμμετρικής προσαρμογής των τιμών των καυσίμων σε μεταβολές του κόστους κτήσης προϊόντος μεταξύ των τριών σταδίων παραγωγής και διανομής (αναφερόμενο και ως φαινόμενο της «ρουκέτας και του φτερού» ή Rockets & Feathers)».
Πιο αναλυτικά, όπως αναφέρεται η ομάδα Data Science της Επιτροπής Ανταγωνισμού, το 2022 και το 2023 αφορούσε την προετοιμασία και την επεξεργασία δεδομένων για τη χαρτογράφηση των αγορών καυσίμων και την Αναφορά Έρευνας Αγοράς των ετών 2022 και 2023. Η ομάδα προχώρησε στη συλλογή δεδομένων αναφορικά με τις τιμές για την περίοδο από το 3ο τρίμηνο του 2019 – 3ο τρίμηνο του 2022, σε σχέση με τα διαφορετικά επίπεδα της αλυσίδας εφοδιασμού καυσίμων. Πιο αναλυτικά η έρευνα διενεργήθηκε με τους εξής άξονες:
-Πληροφορίες για τις τιμές αργού πετρελαίου
-Τιμολόγια από διυλιστήρια σε μεγάλους χονδρεμπόρους (Διυλιστήριο προς Χ)
Τιμολόγια από χονδρεμπόρους σε πρατήρια καυσίμων (Χ προς Λιανοπωλητές)
-Τιμές πρατηρίου για βενζίνη, ντίζελ και πετρέλαιο θέρμανσης, κάθε πρατηρίου στην Ελλάδα. (Λιανοπωλητές προς Καταναλωτές)
Ενώ ο εκτιμώμενος χρόνος χειρωνακτικής επεξεργασίας δεδομένων ήταν αρχικά 2 μήνες με τη συμμετοχή 4 εργαζομένων, η ομάδα Data Science της επιτροπής κατάφερε να ολοκληρώσει αυτήν την εργασία σε 3 εβδομάδες, με τη συμμετοχή 2 υπαλλήλων. Η συλλογή δεδομένων περιπλέκεται από το γεγονός ότι δεν ήταν δημοσιοποιημένες όλες οι πληροφορίες για τις τιμές.
-Υπήρχαν πληροφορίες για τις τιμές του αργού πετρελαίου, ωστόσο η ομάδα χρησιμοποίησε μια τεκμαρτή τιμή για τις ημέρες που οι τιμές του βαρελιού Brent & WTI δεν ήταν διαθέσιμες.
-Όσον αφορά τα τιμολόγια από διυλιστήρια σε μεγάλους χονδρεμπόρους (Διυλιστήριο προς Χ), οι περισσότερες εκπτώσεις εφαρμόζονταν απευθείας στο τιμολόγιο, ενώ άλλες χορηγούνταν μέσω «Πιστωτικών Τιμολογίων» αρνητικής αξίας και χρησιμοποιούνταν για χορήγηση εκπτώσεων ή πριμοδοτήσεων σε πελάτες. Η ομάδα χρειάστηκε επίσης να προβεί σε επεξεργασία των τιμολογίων για να αντλήσει την πραγματική, τελική τιμή ανά λίτρο, λαμβάνοντας υπόψη τις εκπτώσεις, τα πιστωτικά τιμολόγια και τον ΦΠΑ. Η ομάδα αντιστοίχισε τα ονόματα των χονδρεμπόρων από τα τιμολόγια του διυλιστηρίου με τα τιμολόγια του χονδρεμπόρου χρησιμοποιώντας το όνομα του χονδρεμπόρου ως μοναδικό αναγνωριστικό στοιχείο.
-Όσον αφορά τα τιμολόγια από χονδρεμπόρους προς πρατήρια καυσίμων (Χ προς Λιανοπωλητές), όπως και πριν, η ομάδα χρειάστηκε να προβεί σε επεξεργασία των τιμολογίων για να αντλήσει την πραγματική, τελική τιμή ανά λίτρο, λαμβάνοντας υπόψη τις εκπτώσεις, τα πιστωτικά τιμολόγια και τον ΦΠΑ. Επίσης αντιστοίχισε τα ονόματα των λιανοπωλητών από τα τιμολόγια του χονδρέμπορου με τις τιμές του πρατηρίου λιανικής χρησιμοποιώντας το όνομα του λιανοπωλητή ως μοναδικό αναγνωριστικό στοιχείο. Σημειώνεται ότι πολλοί λιανοπωλητές είχαν υποστεί μεταβολή του καθεστώτος διαχείρισης και, ως αποτέλεσμα αυτού, άλλαξε η στήλη με την επωνυμία του πρατηρίου. Αυτή η μεταβολή δημιούργησε πρόβλημα καθώς πολλά πρατήρια καυσίμων θα μπορούσαν να εμφανίζονται με κοινή φυσική διεύθυνση, κάτι που θα ήταν πρακτικά αδύνατο. Η ομάδα χρησιμοποίησε στην αρχή ασαφή αντιπαραβολή αλφαριθμητικών και στη συνέχεια NLP για να διασφαλίσει ότι κάθε διεύθυνση πρατηρίου περιγράφει μοναδικά ένα πρατήριο.
-Όσον αφορά τις λιανικές τιμές βενζίνης, πετρελαίου και πετρελαίου θέρμανσης κάθε πρατηρίου στην Ελλάδα (Λιανοπωλητές προς Καταναλωτές), η ομάδα Data Science συνέλεξε πληροφορίες σε επίπεδο πρατηρίου καυσίμων από τη δημόσια βάση δεδομένων fuelprices.gr οι οποίες δηλώνονται από τα πρατήρια και καλύπτουν ολόκληρη τη χώρα, μολονότι προχώρησε και σε διόρθωση ορισμένων σφαλμάτων στη βάση δεδομένων καθώς πολλά κρίσιμα στοιχεία της, όπως διευθύνσεις, επωνυμίες πρατηρίων και ταχυδρομικοί κώδικες, ήταν εσφαλμένα ή μη διαθέσιμα. Για την επίλυση του προβλήματος χρησιμοποιήθηκε γεωκωδικοποίηση διευθύνσεων της Google Maps (Google Maps geocoding API).