Το Bloomberg φέρνει την τεχνητή νοημοσύνη στον χρηματοοικονομικό κλάδο με ένα μοντέλο που εφαρμόζει σε βάθος τις "τεχνικές" AI σε σύνολα οικονομικών δεδομένων.
Το τερματικό του Bloomberg αποτελεί κύρια πηγή στοιχείων και πληροφοριών για τον κόσμο των συναλλαγών, των αγορών -και εν γένει για τα χρηματοοικονομικά- εδώ και πάνω από τέσσερις δεκαετίες. Το πρακτορείο έχει αποκτήσει ή αναπτύξει μεγάλο αριθμό συνόλων δεδομένων, τα οποία είτε του ανήκουν αποκλειστικά είτε τα έχει επεξεργαστεί. Τα δεδομένα αυτά αποτελούν πολύτιμα "περιουσιακά στοιχεία" και το BloombergGPT τα ενσωματώνει για να αναδειχθεί σε ένα πρωτόγνωρο εργαλείο χρηματοοικονομικής έρευνας και ανάλυσης.
Τα μεγάλα γλωσσικά μοντέλα που τροφοδοτούν τέτοια πειράματα τεχνητής νοημοσύνης είναι συντακτικής και σημασιολογικής φύσης και χρησιμοποιούνται για την πρόβλεψη ενός νέου αποτελέσματος με βάση τις υπάρχουσες σχέσεις εντός και μεταξύ των κειμένων-πηγών.
Οι αλγόριθμοι μηχανικής μάθησης "διδάσκονται" τα δεδομένα από την πηγή και παράγουν ένα μοντέλο. Αυτή η εκπαίδευση για το μοντέλο BloombergGPT απαιτούσε περίπου 53 ημέρες υπολογισμών που εκτελούνταν σε 64 servers. Για λόγους σύγκρισης, όταν χρησιμοποιούμε το ChatGPT, παρέχουμε σε ένα μοντέλο (ή τύπο) μια "προτροπή", και το μοντέλο παράγει μια απάντηση. Η παραγωγή αυτών των μοντέλων απαιτεί τεράστιες ποσότητες υπολογιστικής ισχύος και έτσι το Bloomberg συνεργάστηκε με την NVIDIA και την Amazon Web Services για την παραγωγή του μοντέλου BloombergGPT.
Δεδομένου ότι κάθε GPU κοστίζει δεκάδες χιλιάδες δολάρια -εάν αγοραστεί καινούργια- και η χρήση της για τη δημιουργία μοντέλων περιορίζεται σε σχετικά μικρό χρονικό διάστημα, η ομάδα του BloombergGPT επέλεξε να χρησιμοποιήσει τις υπηρεσίες cloud της AWS για την εκτέλεση των υπολογισμών. Δεδομένου ότι το κόστος ανά server είναι 33 δολάρια/ώρα (όπως διαφημίζεται έως τώρα), μπορούμε να κάνουμε μια εκτίμηση κόστους άνω των 2,7 εκατ. δολαρίων μόνο για την παραγωγή του μοντέλου.
Μέρος της τροφοδοσίας περιεχομένου σε ένα μοντέλο μηχανικής μάθησης περιλαμβάνει τον κατακερματισμό του περιεχομένου. Για να αντιληφθούμε τι μπορεί να είναι αυτά τα "tokens" αρκεί να σκεφτούμε το πώς "σπάμε" ένα κείμενο: προφανώς, σε λέξεις - αλλά υπάρχουν και άλλες στρατηγικές για την κατανομή ή τον κατακερματισμό ενός κειμένου, όπως το σπάσιμο σε προτάσεις ή παραγράφους. Ένας αλγόριθμος tokenizer καθορίζει ποιο μοντέλο κατακερματισμού θα ακολουθηθεί. Αν σπάσουμε ένα κείμενο σε γράμματα, ίσως χάσουμε τα συμφραζόμενα ή το νόημα. Ένας τέτοιος κατακερματισμός είναι πολύ λεπτομερής και χάνει την πρακτική του χρησιμότητα. Το BloombergGPT κατακερματίζει την πηγή οικονομικών δεδομένων του σε 363 δισεκατομμύρια "tokens" χρησιμοποιώντας ένα μοντέλο Unigram, το οποίο προσφέρει πλεονεκτήματα.
Η ομάδα του Bloomberg χρησιμοποίησε το PyTorch, ένα δημοφιλές δωρεάν και ανοικτού κώδικα πακέτο μάθησης, βασισμένο στην Python, για να εκπαιδεύσει το BloombergGPT.
Στην περίπτωση του BloombergGPT, τα σύνολα δεδομένων που το τροφοδοτούν περιλαμβάνουν κάποιες σταθμισμένες αναλογίες οικονομικών ειδήσεων, εταιρικών εγγράφων, δελτίων τύπου και περιεχομένου από το Bloomberg News, τα οποία συλλέγονται και επιμελούνται από το Bloomberg επί δεκαετίες. Εκτός από αυτές τις εξειδικευμένες πηγές για τα χρηματοοικονομικά, το BloombergGPT ενσωματώνει και ορισμένα ευρύτερα και κοινά σύνολα δεδομένων, όπως το The Pile, το Colossal Clean Crawled Corpus ή C4 και τη Wikipedia. Συνδυαστικά, το BloombergGPT μπορεί να αποτελέσει ένα εντελώς νέο εργαλείο χρηματοοικονομικής έρευνας.
Όσον αφορά τα δεδομένα του Bloomberg που χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου, αυτά αφορούν την περίοδο από την 1η Μαρτίου 2007 έως τις 31 Ιουλίου 2022. Το Bloomberg αναφέρεται σε αυτή τη συγκέντρωση δεδομένων ως FINPILE. Η FINPILE αποτελείται από πέντε βασικές πηγές χρηματοοικονομικού περιεχομένου. Συγκεκριμένα
Χρηματοοικονομικό Διαδίκτυο. Χρησιμοποιείται διαδικτυακό περιεχόμενο (όπως ιστότοποι και έγγραφα), αλλά από συγκεκριμένους ιστότοπους που μπορούν να χαρακτηριστούν ως χρηματοοικονομικού ενδιαφέροντος. Από αυτούς το BloomberGPT επιλέγει μόνο όσους θεωρεί αξιόπιστους.
Οικονομικές ειδήσεις. Εκτός από τα sites οικονομικής ενημέρωσης, ενσωματώνονται και ευρύτερα ειδησεογραφικοί ιστότοποι. Χρειάζεται όμως πιο αυστηρή επιμέλεια του υλικού, το οποίο μπορεί να αποτελείται από pdf έως φωτογραφίες.
Εταιρικά έγγραφα/αρχεία. Όποιος πραγματοποιεί έρευνα για μια δημόσια εταιρεία πρέπει να εξετάσει τα εταιρικά της έγγραφα και αρεία. Στις ΗΠΑ, η βάση δεδομένων EDGAR της Επιτροπής Κεφαλαιαγοράς είναι ο κύριος τόπος αναζήτησης και ανάκτησης τέτοιων στοιχείων.
Δελτία Τύπου. Η επίσημη δημόσια ανακοίνωση μιας εταιρείας συχνά μπορεί να περιέχει οικονομικές πληροφορίες. Και αυτή είναι μια πηγή που χρησιμοποιεί το BloombergGPT.
Bloomberg News. Δεδομένου ότι το Bloomberg είναι και μέσο ενημέρωσης, χρησιμοποιήθηκε το ειδησεογραφικό του περιεχόμενο και ενσωματώθηκε στο BloombergGPT. Το περιεχόμενο αυτό περιλαμβάνει άρθρα γνώμης και αναλύσεις.
Παρόλο που δεν έχει ακόμη διαπιστωθεί πώς το BloombergGPT θα επηρεάσει τον κλάδο της χρηματοοικονομικής, ορισμένες από τις πιθανές χρήσεις του είναι οι εξής:
1. Να δημιουργήσει το draft ενός εγγράφου που θα κατατεθεί στην Επιτροπή Κεφαλαιαγοράς. Όπως το ChatGPT μπορεί να παράγει μια προσωρινή κατάθεση διπλώματος ευρεσιτεχνίας ή έναν προσαρμοσμένο κώδικα προγραμματισμού, έτσι μπορεί να είναι εφικτή η δημιουργία ενός εγγράφου που κατατίθεται στην Επ. Κεφαλαιαγοράς, μειώνοντας ενδεχομένως το σχετικό κόστος.
2. Να δημιουργήσει περιεκτικό νόημα ή μήνυμα -σαν τίτλο- από μια είδηση ή ένα κείμενο χρηματοοικονομικής φύσεως.
3. Να παράγει το εταιρικό διάγραμμα ενός οργανισμού και τις διασυνδέσεις ενός ατόμου με διαφορετικές εταιρείες. Εφόσον οι ονομασίες των εταιρειών και τα ονόματα των στελεχών τροφοδοτούνται στο BloombergGPT, είναι πολύ πιθανό να μπορεί να μπορεί να απαντήσει τουλάχιστον για τη δομή ενός οργανισμού σε επίπεδο στελεχών.
4. Να αυτοματοποιήσει τη δημιουργία drafts ή τυπικών εκθέσεων και ενημερώσεων της αγοράς προς ενημέρωση.
5. Να ανακτήσει οικονομικές καταστάσεις ή στοιχεία για συγκεκριμένες περιόδους μέσω μιας ενιαίας προτροπής.
Το BloombergGPT είναι ένα σημαντικό βήμα προόδου για τον κόσμο των χρηματοοικονομικών και της τεχνητής νοημοσύνης. Προς το παρόν, το μοντέλο δεν είναι προσβάσιμο στο κοινό και δεν διαθέτει API (Αpplication Programming interface), ούτε διεπαφή συνομιλίας. Δεν είναι σαφές αν -και πότε- θα γίνει προσβάσιμο στο ευρύ κοινό ή εάν η υφιστάμενη του έκδοση αναθεωρηθεί. Η ομάδα του BloombergGPT καταλήγει στην πρόσφατη ανακοίνωσή της ότι "ακολουθούμε την οδό της προσοχής και την πρακτική άλλων προγραμματιστών LLM, και δεν δημοσιοποιούμε το μοντέλο μας ούτε το διαθέτουμε στο κοινό".
Με την αποτίμηση της OpenAI να ξεπερνά τα 20 δισ. δολάρια, ποιος μπορεί να τους κατηγορήσει;