2ο ΜΑΘΗΜΑ ΣΤΟ “PROMPT ENGINEERING” ΓΙΑ “ARTIFICIAL
INTELLIGENCE” MODELS
Στην άμεση μηχανική, ιδιαίτερα στο πλαίσιο της εργασίας με
μοντέλα γλώσσας όπως αυτά του OpenAI, η "θερμοκρασία (temperature)" είναι μια παράμετρος
που ελέγχει την τυχαιότητα των όσων παράγονται από το μοντέλο.
1.
Ρύθμιση θερμοκρασίας: Η παράμετρος θερμοκρασίας
κυμαίνεται συνήθως από 0 έως 1, αν και τεχνικά μπορεί να αυξηθεί πάνω από 1. Οι
χαμηλότερες τιμές έχουν ως αποτέλεσμα πιο ντετερμινιστικά και εστιασμένα
αποτελέσματα, ενώ οι υψηλότερες τιμές κάνουν την εξαγόμενα πιο τυχαία και
διαφορετικά.
α) Επίδραση
στα αποτελέσματα:
·
Χαμηλή τιμή
θερμοκρασίας (Low Temperature) (π.χ. 0,2): Σε αυτές τις τιμές, οι
αποκρίσεις του μοντέλου θα είναι πιο ντετερμινιστικές και επαναλαμβανόμενες. Τείνει
να επιλέγει τις λέξεις με την υψηλότερη πιθανότητα, οδηγώντας σε συντηρητική
και προβλέψιμη δημιουργία κειμένου. Αυτό είναι χρήσιμο όταν χρειαζόμαστε
ακριβείς και αξιόπιστες εξόδους.
·
Μέση τιμή
θερμοκρασίας (Medium Temperature) (π.χ. 0,7): Στις τιμές αυτές το μοντέλο
ισορροπεί μεταξύ δημιουργικότητας και αξιοπιστίας. Εισάγει κάποιο επίπεδο
τυχαιότητας, επιτρέποντας ένα μείγμα προβλεψιμότητας και ποικιλομορφίας.
·
Υψηλή
θερμοκρασία (High Temperature) (π.χ. 1,0 ή υψηλότερη): Οι απαντήσεις του
μοντέλου γίνονται πιο τυχαίες και δημιουργικές. Θα πάρει περισσότερους
κινδύνους στην επιλογή λέξεων, κάτι που μπορεί να οδηγήσει σε απροσδόκητα και
ποικίλα αποτελέσματα. Αυτό μπορεί να είναι χρήσιμο για δημιουργική γραφή ή
καταιγισμό ιδεών (brain storming),
αλλά μπορεί επίσης να οδηγήσει σε λιγότερο συνεκτικές ή εκτός θέματος
απαντήσεις.
β) Τεχνική πτυχή (Technical Aspect): Μαθηματικά, η θερμοκρασία χρησιμοποιείται για την κλίμακα των logits (τις ακατέργαστες προβλέψεις του μοντέλου πριν μετατραπούν σε πιθανότητες) πριν από την εφαρμογή της συνάρτησης softmax. Οι χαμηλότερες θερμοκρασίες κάνουν την κατανομή πιθανοτήτων πιο έντονη (πιο κορυφαία), ενώ οι υψηλότερες θερμοκρασίες την κάνουν πιο επίπεδη (πιο απλωμένη). Η συνάρτηση softmax είναι μια μαθηματική συνάρτηση που μετατρέπει ένα διάνυσμα πραγματικών αριθμών σε κατανομή πιθανότητας.
·
Τι είναι
το Logit: Η συνάρτηση logit είναι μια κρίσιμη έννοια στη στατιστική και τη
μηχανική μάθησ. Χρησιμεύει ως συνάρτηση σύνδεσης που αντιστοιχίζει πιθανότητες
που κυμαίνονται μεταξύ 0 και 1 σε πραγματικούς αριθμούς σε ολόκληρη την
αριθμητική κλίμακα, η οποία μπορεί στη συνέχεια να χρησιμοποιηθεί για να
εκφράσει γραμμικές σχέσεις.
·
Η
συνάρτηση logit ορίζεται μαθηματικά ως ο λογάριθμος των πιθανοτήτων p να συμβεί
ένα συγκεκριμένο γεγονός:
Logit(p) = log(p / (1 -
p))
Εδώ, το p αντιπροσωπεύει την πιθανότητα του γεγονότος και το log
υποδηλώνει τον φυσικό λογάριθμο.
Οι πιθανότητες είναι ο λόγος της
πιθανότητας του γεγονότος προς την πιθανότητα να μην συμβεί το γεγονός.
Όταν p είναι η πιθανότητα επιτυχίας, 1 - p είναι η πιθανότητα αποτυχίας και οι
πιθανότητες είναι ένας τρόπος σύγκρισης της πιθανότητας αυτών των δύο
αποτελεσμάτων.
·
Ερμηνεία
των τιμών Logit: Οι τιμές Logit
μπορούν να ερμηνευθούν με όρους πιθανοτήτων. Οι θετικές τιμές logit υποδεικνύουν
πιθανότητες μεγαλύτερες από 0,5 και επομένως πιθανότητες που ευνοούν να συμβεί το
γεγονός, ενώ οι αρνητικές τιμές δείχνουν πιθανότητες μικρότερες από 0,5, με
πιθανότητες λιγότερες από τις μισές για να συμβεί το γεγονότος.
γ) Περιπτώσεις χρήσης:
·
Δημιουργική
Γραφή (Creative Writing): Υψηλότερες θερμοκρασίες για την ενίσχυση της
δημιουργικότητας και της ποικιλίας.
·
Ανάκτηση
πραγματικών πληροφοριών (Factual Information Retrieval): Χαμηλότερες
θερμοκρασίες για εξασφάλιση ακρίβειας και συνέπειας.
·
Πειραματισμός
και Πρωτοτυποποίηση (Experimentation and Prototyping): Ρύθμιση θερμοκρασίας
για την εύρεση της βέλτιστης ισορροπίας για μια συγκεκριμένη εργασία.
δ) Ρύθμιση της Θερμοκρασίας
Προσαρμόζοντας τη θερμοκρασία, οι άμεσοι μηχανικοί μπορούν
να προσαρμόσουν τη συμπεριφορά των μοντέλων γλώσσας ώστε να ανταποκρίνονται
καλύτερα στις συγκεκριμένες ανάγκες τους, είτε πρόκειται για τη δημιουργία
συνεπών αποκρίσεων είτε για την προώθηση της δημιουργικότητας και της
εξερεύνησης στη παραγωγή κειμένου.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου