Σελίδες

Παρασκευή 31 Μαΐου 2024

 ΜΑΘΗΜΑ ΕΚΤΟ (6) : PROMPT ENGINEERING

ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ (MODEL CHOISE)
Το "model choice" (επιλογή μοντέλου) στην τεχνητή νοημοσύνη (AI) αναφέρεται στη διαδικασία επιλογής του κατάλληλου μοντέλου μηχανικής μάθησης (ML) ή βαθιάς μάθησης (DL) για την επίλυση ενός συγκεκριμένου προβλήματος ή την εκτέλεση μιας συγκεκριμένης εργασίας.
Αυτή η διαδικασία περιλαμβάνει την αξιολόγηση και σύγκριση διαφόρων μοντέλων για να επιλεγεί εκείνο που προσφέρει την καλύτερη απόδοση σύμφωνα με συγκεκριμένα κριτήρια.
Διαφορετικές εκδόσεις μοντέλων μπορεί να έχουν διαφορετικά χαρακτηριστικά και δυνατότητες (π.χ., GPT-3.5 vs. GPT-4).
Οι κύριοι παράγοντες που εξετάζονται κατά την επιλογή ενός μοντέλου περιλαμβάνουν:
1. Ακρίβεια (Accuracy): Πόσο καλά το μοντέλο προβλέπει ή ταξινομεί τα δεδομένα.
2. Υπολογιστικό Κόστος (Computational Cost): Οι απαιτήσεις σε υπολογιστικούς πόρους, όπως ο χρόνος εκπαίδευσης και η μνήμη.
3. Επεκτασιμότητα (Scalability): Πώς το μοντέλο προσαρμόζεται όταν αυξάνεται ο όγκος των δεδομένων.
4. Ερμηνευτικότητα (Intrepretability): Πόσο εύκολα μπορεί να εξηγηθεί η λειτουργία του μοντέλου.
5. Ικανότητα Γενίκευσης (Generalizability): Η ικανότητα του μοντέλου να αποδίδει καλά σε νέα, μη γνωστά δεδομένα.
6. Ανθεκτικότητα (Robustness): Η ικανότητα του μοντέλου να αντιμετωπίζει θορυβώδη ή ελλιπή δεδομένα.
Η διαδικασία επιλογής του μοντέλου περιλαμβάνει τα εξής βήματα:
1. Κατανόηση του προβλήματος (Understanding the problem): Καθορισμός της φύσης του προβλήματος (π.χ. ταξινόμηση, πρόβλεψη, ομαδοποίηση).
2. Επιλογή υποψήφιων μοντέλων (Selecting candidate models): Επιλογή μιας λίστας υποψήφιων μοντέλων που μπορεί να είναι κατάλληλα για το πρόβλημα.
3. Εκπαίδευση και αξιολόγηση (Training and evaluation): Εκπαίδευση των υποψήφιων μοντέλων σε δεδομένα εκπαίδευσης και αξιολόγηση της απόδοσής τους χρησιμοποιώντας δεδομένα δοκιμής.
4. Σύγκριση μοντέλων (Model comparison): Σύγκριση των αποτελεσμάτων των μοντέλων σύμφωνα με τα προαναφερθέντα κριτήρια.
5. Επιλογή του καλύτερου μοντέλου (Selecting the best model): Επιλογή του μοντέλου που παρουσιάζει την καλύτερη συνολική απόδοση.
6. Βελτιστοποίηση (Optimization): Περαιτέρω βελτιστοποίηση του επιλεγμένου μοντέλου, εάν είναι απαραίτητο.
Η επιλογή του κατάλληλου μοντέλου είναι κρίσιμη για την επιτυχία ενός έργου AI, καθώς ένα κακώς επιλεγμένο μοντέλο μπορεί να οδηγήσει σε χαμηλή απόδοση και λανθασμένα αποτελέσματα.

Σάββατο 25 Μαΐου 2024

 Η ΚΡΑΤΙΚΗ ΑΝΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑ ΕΛΕΓΧΟΥ ΣΤΟ "SHIP TO SHIP TRANSFER" ΣΤΟΝ ΛΑΚΩΝΙΚΟ ΚΟΛΠΟ

Δύο εβδομάδες πριν έγινε διεθνές θέμα το ότι γίνεται μεταφορά από πλοία σε πλοία ευκαιριακής σημαίας (Ship to Ship Transfer) του Ρωσικού πετρελαίου έξω από τον Λακωνικό κόλπο στα διεθνή ύδατα, όπου με τον τρόπο αυτό αποχαρακτηρίζεται η προέλευση του πετρελαίου και ξεπερνιούνται οι κυρώσεις.
Τότε εμείς (λόγω της διεθνούς αντίδρασης) εγκαθιδρύσαμε NAVTEX για γυμνάσια στην περιοχή αυτή, προκειμένου να περιορίσουμε την ναυτιλιακή κίνηση , ελπίζοντας ότι θα σταματήσουμε έτσι την λαθραία διακίνηση.
Όμως μόλις τελείωσε η ισχύς της NAVTEX οι μεταφορές αυτές ξανάρχισαν.
Είχα επισημάνει τότε για την αναποτελεσματικότητα του μέτρου αυτού και ότι χάνουμε σημαντική ευκαιρία για να υποστηρίξουμε τα εθνικά μας συμφέροντα:
ΣΥΓΚΕΚΡΙΜΕΝΑ:
Η αντίδρασή μας για μία ακόμη φορά είναι κατώτερη των περιστάσεων.
Προσπαθούμε με τεχνάσματα να δώσουμε προσωρινή λύση για τα «μάτια του κόσμου», εγκαθιδρύοντας προσχηματικά NAVTEX (ήταν από την 1η έως τις 9 Μαΐου) στην συγκεκριμένη περιοχή του Λακωνικού κόλπου στα διεθνή ύδατα, ώστε να μην επιτρέπεται η ναυτιλιακή κίνηση στην περιοχή για λόγους ασφαλείας από τα γυμνάσια που θα κάναμε.
Το ερώτημα είναι :
Θα απαγορεύουμε έτσι συνεχώς την ναυτιλιακή κίνηση με εν ισχύ NAVTEX διαρκείας;
Αυτό είναι ενάντια στην ίδια την πολιτική μας έναντι της πάγιας ναυτιλιακής πολιτικής μας και της Τουρκίας.
Και φυσικά θα αποδυναμωθεί εφόσον δεν θα υπάρχει η δυνατότητα ελέγχου όλης της περιοχής από κρατικά μέσα.
Ή μήπως θα στήσουμε στο διηνεκές εκεί ένα πλοίο του Π.Ν για να δικαιολογούμε την διαρκή ισχύ της NAVTEX;
Η ακτοφυλακή/Λιμενικό επίσης δεν έχει αρμοδιότητα να δράσει καθ οιονδήποτε τρόπο στην συγκεκριμένη περιοχή.
1) ΕΠΕΚΤΑΣΗ ΧΩΡΙΚΩΝ ΥΔΑΤΩΝ: Η μόνη μας άμεση και αποτελεσματική δυνατότητα θα ήταν να κάνουμε την χωρική μας θάλασσα 12 νμλ σε όλη την Πελοπόννησο και την Κρήτη. Και θα είχαμε εξαιρετική επιχειρηματολογία και υποστηρικτές στην ΕΕ και στις ΗΠΑ-Αυστραλία και Καναδά.
2) ΚΛΕΙΣΙΜΟ ΚΌΛΠΩΝ ΜΕ ΓΡΑΜΜΕΣ ΒΑΣΕΩΣ: Η αμέσως καλύτερη λύση θα ήταν να κλείσουμε με γραμμή βάσεως τους Κόλπους της Ελλάδος (όσους έχουν άνοιγμα κάτω από 24 νμλ) αλλά και ιστορικούς κόλπους κι εκείθεν να μετρήσουμε την χωρική θάλασσα των 6 νμλ.
3) ΣΥΝΟΡΕΥΟΥΣΑ ΖΩΝΗ: Μία τρίτη λύση θα ήταν η εγκαθίδρυση συνορεύουσας ζώνης μέχρι ακόμη και 24 νμλ από τις ακτές μας, όπου θα είχαμε έτσι δικαιοδοσία για παράνομες πράξεις που γίνονται σε αυτήν την ζώνη. Αυτό θα μας έδινε την δυνατότητα να ελέγξουμε και την παράνομη διακίνηση ανθρώπων και ναρκωτικών το λαθρεμπόριο, τον κίνδυνο ρύπανσης κλπ.
Δυστυχώς δεν εκμεταλλευόμαστε έγκαιρα τις διεθνείς συγκυρίες για να ενισχύσουμε τα δικαιώματά μας.

 ΓΙΑΤΙ ΕΙΝΑΙ ΛΑΘΟΣ Η ΣΥΜΠΕΡΙΛΗΨΗ ΜΠΕΛΕΡΗ ΣΤΟ ΕΥΡΩΨΗΦΟΔΕΛΤΙΟ

Άκουσα την κα Μπακογιάννη να λέει ότι, "εφόσον εκλεγεί στο Ευρωκοινοβούλιο, ο Φρέντι Μπελέρη θα αποτελέσει τη φωνή της εθνικής μειονότητας", και ότι «είναι άλλο πράγμα να τη μεταφέρουμε εμείς και άλλο πράγμα να έχουν έναν γνήσιο εκπρόσωπο της εθνικής μειονότητας να μιλάει για το θέμα».
Ας δούμε τα επικίνδυνα ζητήματα που ανοίγει η θέση αυτή:
1. Κατ' αρχάς, με δεδομένο ότι τον έχει εντάξει η ΝΔ στο ευρωψηφοδέλτιο με κρατικό χαρακτήρα, κάνει μια ακροβατική διάκριση μεταξύ του εμείς και αυτοί.
Εάν μετέχει στο Ελληνικό ευρωψηφοδέλτιο, μετέχει ως Έλλην πολίτης και όχι ως πολίτης της Αλβανίας κι εκ καταγωγής Έλλην.
2. Ας σκεφθούμε τι θα συμβεί εάν όλες οι μειονότητες που βρίσκονται στα Βαλκάνια και σε πολλές Ευρωπαϊκές χώρες, είχαν εκπροσώπους τους στα ευρωψηφοδέλτια της χώρας εθνικότητας καταγωγής τους, για να θέτουν τα ζητήματα εναντίον της χώρας όπου είναι πολίτες. Θα το θέλαμε εμείς να συμβεί με μειονότητες που υπάρχουν στην χώρα μας;
Ανοίγει το κουτί της Πανδώρας για τα ζητήματα μειονοτήτων.
3. Και όλα αυτά επειδή δεν θέλουμε να έχουμε σκληρή στάση έναντι του Ράμα για τα δικαιώματα της εθνικής μας μειονότητας στην Αλβανία, ο οποίος Ράμα έχει ενταχθεί στην αυλή του Ερντογάν, ενισχύει τον Αλβανικό εθνικισμό, μας εκβίασε και το πέτυχε με την ομιλία του εδώ και τώρα ξιφουλκεί εκ νέου κατά της Ελλάδος.
4. Δηλαδή τι λέμε: Εμείς δεν μπορούμε να υποστηρίξουμε τα δικαιώματα της Ελληνικής μειονότητας στην Αλβανία και βάζουμε τον Μπελέρη να τα υποστηρίξει στο ευρωκοινοβούλιο;
Εξωτερική πολιτική υπεκφυγής και μετάθεσης ευθυνών, αμφιλεγόμενη και προβληματική, όπου με επικοινωνιακά κόλπα προσπαθούμε να καλύψουμε τις αδυναμίες μας και να μην αναλάβουμε άμεσα τις ευθύνες μας έναντι της Ελληνικής μειονότητας στην Αλβανία (εάν δε γίνεται για μικροκομματικά οφέλη είναι ακόμη χειρότερα γιατί βάζει μπροστά το κόμμα και όχι την χώρα).

 ΜΑΘΗΜΑ 5ο : ΓΙΑ ΤΟ "PROMPT ENGINEERING" ΣΤΟ "ΑΙ".

"FREQUENCY PENALTY" - "PRESENCE PENALTY" & "PROMPT LENGTH"
1. Ποινή συχνής εμφάνισης λέξεων (Frequency Penalty)
α. Στο πλαίσιο του prompt engineering, ο όρος "Frequency Penalty" αναφέρεται σε μια τεχνική που χρησιμοποιείται για να ρυθμίσει τη συχνότητα με την οποία εμφανίζονται ορισμένες λέξεις ή φράσεις στην απάντηση που δημιουργείται από ένα γλωσσικό μοντέλο ΑΙ.
β. Συγκεκριμένα:
• Είναι μια παράμετρος η οποία μειώνει την πιθανότητα να επαναληφθούν λέξεις ή φράσεις που έχουν ήδη χρησιμοποιηθεί στο κείμενο. Με άλλα λόγια, επιβάλλει μια "ποινή" (penalty) σε περίπτωση που χρησιμοποιηθούν λέξεις ή φράσεις που έχουν ήδη εμφανιστεί κάνοντάς τες λιγότερο πιθανές για μελλοντική χρήση στο ίδιο κείμενο.
• Η κύρια λειτουργία αυτής της παραμέτρου είναι ότι βοηθά στην αποφυγή επαναλήψεων και προωθεί τη δημιουργία πιο ποικίλων και ενδιαφερουσών απαντήσεων.
γ. Παραδείγματα χρήσης της frequency penalty:
• Όταν ζητείται από το μοντέλο να δημιουργήσει μια μεγάλη ιστορία ή ένα δοκίμιο και θέλουμε να εξασφαλίσουμε ότι δεν θα επαναλαμβάνει συνεχώς τις ίδιες λέξεις ή φράσεις.
• Σε εφαρμογές όπου η ποικιλία στη γλώσσα είναι σημαντική, όπως η δημιουργία ποιημάτων ή η σύνθεση λογοτεχνικών κειμένων.
δ. Η ρύθμιση της frequency penalty μπορεί να είναι μια λεπτή διαδικασία, καθώς μια πολύ υψηλή τιμή μπορεί να κάνει το κείμενο να φαίνεται αφύσικο και αποσπασματικό, ενώ μια πολύ χαμηλή τιμή μπορεί να οδηγήσει σε υπερβολικές επαναλήψεις.
2. Presence Penalty
α. Παρόμοια με την ποινή συχνότητας, αλλά επικεντρώνεται στη μείωση της επανάληψης ολόκληρων θεμάτων ή εννοιολογικών πεδίων, ενθαρρύνοντας τα μοντέλα ΑΙ να εισάγουν νέες έννοιες.
β. Διεξοδικότερα, στο πλαίσιο του prompt engineering, η έννοια του "Presence Penalty" αναφέρεται στην τεχνική που χρησιμοποιείται για να ρυθμίσει την πιθανότητα να εμφανιστούν συγκεκριμένες λέξεις ή φράσεις στην απάντηση που δημιουργείται από ένα γλωσσικό μοντέλο, όπως το "AI".
γ. Συγκεκριμένα:
• Διαφορές του “Frequency Penalty” με το “Presence Penalty”: To “Frequency Penalty” είναι μια παράμετρος που μειώνει την πιθανότητα να εμφανιστούν ξανά λέξεις που έχουν ήδη χρησιμοποιηθεί (με βάση το πόσο συχνά έχουν ήδη εμφανιστεί οι λέξεις), αλλά το "Presence Penalty", εστιάζει περισσότερο στην ύπαρξη (presence) των λέξεων παρά στη συχνότητά τους (στο αν δηλαδή η λέξη έχει εμφανιστεί καθόλου).
• Βοηθά να ενθαρρυνθεί η χρήση νέων λέξεων και φράσεων, προκειμένου να διασφαλιστεί η ποικιλία και η πρωτοτυπία στο παραγόμενο κείμενο.
δ. Παραδείγματα χρήσης του presence penalty:
• Όταν ζητείται από το μοντέλο να δημιουργήσει περιεχόμενο όπου η πρωτοτυπία είναι κρίσιμη, όπως άρθρα, ιστορίες ή δημιουργικά κείμενα, και θέλουμε να αποφύγουμε επαναλήψεις ακόμα και αν δεν είναι υπερβολικές.
• Σε εφαρμογές όπου θέλουμε να ενθαρρύνουμε τη χρήση ευρύτερου λεξιλογίου, όπως στη διδασκαλία γλωσσών ή στη συγγραφή περιεχομένου που απαιτεί ποικιλία λέξεων.
ε. Ρυθμίζοντας σωστά την “presence penalty”, μπορούμε να πετύχουμε πιο ισορροπημένα και ενδιαφέροντα κείμενα που αποφεύγουν επαναλήψεις , χωρίς τα κείμενα να φαίνονται αφύσικα.
3. Μήκος Προτροπής (Prompt Length)
α. Το Prompt Length στο πλαίσιο του prompt engineering αναφέρεται στο μήκος του κειμένου ή της εντολής που δίνουμε σε ένα γλωσσικό μοντέλο ΑΙ, προκειμένου να δημιουργήσει μια απάντηση.
β. Συγκεκριμένα, περιλαμβάνει τον αριθμό των χαρακτήρων, λέξεων ή λεκτικών μονάδων (tokens) που αποτελούν το αρχικό ερώτημα ή το προτροπή (prompt). Ενώ τεχνικά αποτελεί μέρος της εισόδου και όχι παράμετρο, το μήκος και η ποιότητα της προτροπής (prompt) μπορεί να επηρεάσει σημαντικά την ποιότητα και το μέγεθος της απάντησης του μοντέλου.
γ. Σημασία του Prompt Length
(1) Ποιότητα της Απόκρισης:
• Μία πιο λεπτομερής και εκτενής προτροπή (prompt) μπορεί να δώσει στο μοντέλο ΑΙ περισσότερες πληροφορίες και συμφραζόμενα, οδηγώντας σε πιο σχετικές, ολοκληρωμένες και ακριβείς απαντήσεις.
• Μία πολύ σύντομη προτροπή (prompt) μπορεί να μην παρέχει αρκετά στοιχεία, με αποτέλεσμα μια λιγότερο ακριβή, ατελή ή λιγότερο χρήσιμη απάντηση.
(2) Συμπεριφορά του Μοντέλου:
• Τα γλωσσικά μοντέλα συνήθως αποδίδουν καλύτερα όταν η προτροπή (prompt) είναι καλά δομημένη και περιέχει αρκετές πληροφορίες για να κατανοήσουν το πλαίσιο και την πρόθεση του χρήστη.
• Ορισμένες προτροπές (prompts) μπορεί να είναι πάρα πολύ μακροσκελείς, δημιουργώντας υπερβολικά μεγάλη εισαγωγή που μπορεί να περιορίσει το διαθέσιμο χώρο για την απάντηση λόγω των ορίων του μοντέλου.
4. Εφαρμογές και Στρατηγικές χρήσης του μήκους της προτροπής (Prompt Length)
α. Δημιουργία Περιεχομένου:
• Για τη σύνθεση ιστοριών ή άρθρων, τα εκτενέστερα και πιο επεξηγηματικά prompts μπορούν να παρέχουν σαφή καθοδήγηση σχετικά με τον τόνο, το στυλ, και το περιεχόμενο.
β. Αποσαφήνιση Ερωτήσεων:
• Σε εκπαιδευτικά πλαίσια, οι σαφείς και λεπτομερείς ερωτήσεις βοηθούν το μοντέλο να δώσει ακριβείς και πιο στοχευμένες απαντήσεις.
γ. Βελτιστοποίηση Προτροπών (prompts):
• Η δοκιμή διαφόρων μηκών προτροπών μπορεί να βοηθήσει στην εύρεση του βέλτιστου σημείου όπου το μοντέλο παρέχει την καλύτερη απόδοση. Μερικές φορές, η προσθήκη λίγων επιπλέον λέξεων μπορεί να βελτιώσει δραματικά την ποιότητα της απόκρισης.
4. Παραδείγματα μήκους προτροπής (Prompt Length)
Η κατανόηση και η σωστή χρήση του μήκους της προτροπής (prompt length) είναι το κλειδί για την αποτελεσματική χρήση των γλωσσικών μοντέλων και την επίτευξη βέλτιστων αποτελεσμάτων του ΑΙ.
• Σύντομο Prompt: "Πες μου για τη Γαλλική Επανάσταση."
• Εκτενέστερο Prompt: "Πες μου για τα κύρια αίτια της Γαλλικής Επανάστασης, εστιάζοντας στις κοινωνικές και οικονομικές συνθήκες που οδήγησαν στην εξέγερση, καθώς και στα κύρια γεγονότα που καθόρισαν την πορεία της επανάστασης.

Πέμπτη 23 Μαΐου 2024

 ΜΑΘΗΜΑ 4 ΣΤΟ "PROMPT ENGINEERING" ΓΙΑ "ΑΙ"

ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Top-k Sampling) & ΛΕΚΤΙΚΕΣ ΜΟΝΑΔΕΣ (Tokens)

Η Δειγματοληψία Top-k (Top-k Sampling ) είναι μια τεχνική που χρησιμοποιείται στην επεξεργασία φυσικής γλώσσας (NLP) και σε εργασίες παραγωγής κειμένου, για να δημιουργηθεί κείμενο με ελεγχόμενο τρόπο.
Όταν ένα μοντέλο παράγει κείμενο, προβλέπει την επόμενη λέξη με βάση τα συμφραζόμενα των προηγούμενων λέξεων.
Κάθε πιθανή επόμενη λέξη συσχετίζεται με μια πιθανότητα, η οποία δείχνει πόσο πιθανό είναι να ακολουθήσει το δεδομένο συμφραζόμενο.
Δηλαδή περιορίζει τις επιλογές του μοντέλου στον αριθμό των k (ακέραιος αριθμός π.χ. 5) πιο πιθανών επόμενων (εάν κ=5) πέντε λέξεων με την μεγαλύτερη πιθανότητα από το σύνολο των πολλών πιθανολογούμενων λέξεων που έχουν μικρότερες πιθανότητες.
Το μοντέλο θα επιλέξει για εξέταση μόνο αυτές τις k λέξεις για χρήση ως επόμενη λέξη στο κείμενο ώστε να υπάρξει πιο αυστηρός έλεγχο στην ποιότητας παραγωγής κειμένου.
Ας δούμε πως λειτουργεί το Top-k Sampling:
1. Παραγωγή Προβλέψεων (Prediction Generation): Το γλωσσικό μοντέλο δημιουργεί μια κατανομή πιθανότητας για το λεξιλόγιο σχετικά με την επόμενη λέξη που ια χρησιμοποιήσει στη σειρά.
2. Φιλτράρισμα (Filtering): Αντί να εξετάζονται όλες οι δυνατές λέξεις στο λεξιλόγιο, το Top-k Sampling περιορίζει την επιλογή στις k λέξεις με τις υψηλότερες πιθανότητες. Για παράδειγμα, αν k = 5, μόνο οι πέντε λέξεις με τις υψηλότερες πιθανότητες θα ληφθούν υπόψη.
3. Δειγματοληψία (Sampling): Η επόμενη λέξη επιλέγεται τυχαία από αυτό το υποσύνολο των k λέξεων, σύμφωνα πάντα με τις σχετικές πιθανότητές τους.
Περιορίζοντας τις επιλογές στις κορυφαίες k πιθανές λέξεις, το Top-k Sampling εξισορροπεί την ανάγκη για ποικιλία και συνοχή στην παραγωγή κειμένου. Αποφεύγει μερικές κοινές παγίδες:
• Αποφυγή Λέξεων με Χαμηλή Πιθανότητα (Avoiding Low-Probability Words): Εξαιρώντας λέξεις με πολύ χαμηλές πιθανότητες, το παραγόμενο κείμενο είναι λιγότερο πιθανό να περιλαμβάνει ασυναρτησίες ή άσχετες λέξεις.
• Εισαγωγή Ποικιλίας (Introducing Diversity): Με την τυχαία δειγματοληψία μέσα στις κορυφαίες k λέξεις, το παραγόμενο κείμενο δεν είναι ντετερμινιστικό, δηλαδή μπορεί να παράγει διάφορες εκδοχές για την ίδια είσοδο, ενισχύοντας τη δημιουργικότητα και μειώνοντας την επανάληψη.
Για παράδειγμα, αν το μοντέλο προβλέπει την επόμενη λέξη με πιθανότητες όπως:
• "the": 0.40
• "cat": 0.25
• "sat": 0.15
• "on": 0.10
• "mat": 0.05
• άλλες (συνολικά): 0.05
Με το Top-k Sampling όπου k = 3, το μοντέλο θα λάβει υπόψη μόνο τις 3 λέξεις "the", "cat", και "sat" που έχουν τις μεγαλύτερες πιθανότητες, ως τις πιθανές επόμενες λέξεις.
Μία από αυτές τις λέξεις θα επιλεγεί με βάση τις σχετικές πιθανότητές τους.
Το Top-k Sampling συχνά χρησιμοποιείται σε συνδυασμό με άλλες τεχνικές όπως η κλιμάκωση θερμοκρασίας (temperature scaling) που αναφέραμε στο πρώτο μάθημα, η οποία προσαρμόζει την κατανομή πιθανότητας ώστε να την κάνει πιο ή λιγότερο τυχαία, ρυθμίζοντας περαιτέρω την ισορροπία μεταξύ συνοχής (coherence) και ποικιλία (diversity) στην παραγωγή κειμένου.
ΜΕΓΙΣΤΟΣ ΑΡΙΘΜΟΣ ΛΕΚΤΙΚΩΝ ΜΟΝΑΔΩΝ (Max Tokens)
Το "Max Tokens" στο πλαίσιο της τεχνητής νοημοσύνης (AI), ιδιαίτερα στην επεξεργασία φυσικής γλώσσας (NLP) και σε μοντέλα όπως το GPT (Generative Pre-trained Transformer), αναφέρεται στον μέγιστο αριθμό των tokens που το μοντέλο θα επεξεργαστεί ή θα παραγάγει σε μια αλληλεπίδραση ή ένα ερώτημα.
Max Tokens:
1. Ορισμός μίας “Λεκτικής Μονάδας (Token)”:
• Μία Λεκτική Μονάδα (token) μπορεί να είναι τόσο μικρή όσο ένας χαρακτήρας ή τόσο μεγάλο όσο μία λέξη (ή και περισσότερο). Στα αγγλικά, για παράδειγμα, κοινές λέξεις όπως "the" ή "is" είναι “tokens”, αλλά το ίδιο ισχύει και για τα σημεία στίξης και τμήματα σύνθετων λέξεων.
2. Ορισμός ενός Ορίου (Setting a Limit):
• Η παράμετρος "Max Tokens" θέτει ένα ανώτατο όριο στον αριθμό των λεκτικών μονάδων ( tokens) που το μοντέλο θα εξετάσει όταν παράγει μια απάντηση ή επεξεργάζεται μια εισαγωγή.
Αυτό βοηθά στη διαχείριση των υπολογιστικών πόρων και διασφαλίζει ότι η απάντηση παράγεται σε εύλογο χρονικό διάστημα.
3. Επίδραση στην Επικοινωνία (Impact on Interaction):
• Το μοντέλο, όταν παράγει κείμενο, θα σταματήσει μόλις φτάσει στον καθορισμένο αριθμό των tokens. Αν ζητήσουμε να παραχθεί μια μακρά παράγραφος ή ένα έγγραφο, μπορεί να φτάσουμε αυτό το όριο, με αποτέλεσμα η έξοδος να είναι περικομμένη.
• Όταν το μοντέλο επεξεργάζεται μια εισαγωγή, αν αυτή υπερβαίνει το όριο του μέγιστου αριθμού Λεκτικών Μονάδων που θέλουμε (max tokens), το μοντέλο είτε θα περικόψει την είσοδο είτε θα την απορρίψει, ανάλογα με την υλοποίηση.
4. Πρακτικό Παράδειγμα:
• Επεξεργασία Εισαγωγής/Εισόδου (Input Processing): Αν θέσουμε το όριο των “max tokens” σε 512 και δώσουμε στην είσοδο μία εισαγωγή που υπερβαίνει αυτό το όριο, το μοντέλο θα εξετάσει μόνο τα πρώτα 512 tokens της εισόδου μας.
• Παραγωγή Κειμένου (Text Generation): Αν ζητήσουμε από το μοντέλο να παραγάγει κείμενο με όριο “max tokens” το 100, τότε το μοντέλο θα συμπεριλάβει έως και 100 tokens στην απάντησή του.
5. Σημασία του Max Tokens:
• Διαχείριση Πόρων (Resource Management): Ελέγχει το υπολογιστικό φορτίο ως προς τους πόρους του μοντέλου, καθιστώντας δυνατή την αποδοτική λειτουργία των μοντέλων.
• Ποιότητα Έξοδου (Output Quality): Βοηθά στην προσαρμογή της εξόδου ώστε να ταιριάζει σε συγκεκριμένες απαιτήσεις, όπως η παραγωγή μιας περίληψης ή μιας σύντομης απάντησης.
• Αποδοτικότητα Αλληλεπίδρασης (Interaction Efficiency): Διασφαλίζει ότι οι απαντήσεις παρέχονται έγκαιρα, βελτιώνοντας την εμπειρία του χρήστη.
6. Συνεπώς, ο μέγιστος αριθμός Λεκτικών μονάδων ("Max Tokens") είναι μια κρίσιμη παράμετρος στα μοντέλα τεχνητής νοημοσύνης, που καθορίζει το μήκος των εισόδων και εξόδων κειμένου, εξισορροπώντας μεταξύ της χρήσης πόρων και της ποιότητας της αλληλεπίδρασης.
Όλες οι αντιδράσεις:
Σταύρος Σταθόπουλος και Kwstas Argyrakhs

Τετάρτη 22 Μαΐου 2024

 ΠΟΙΟΣ ΕΧΕΙ ΣΤΗΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΊΑ ΤΗΝ ΕΥΘΥΝΗ ΚΗΡΥΞΗΣ ΠΟΛΕΜΟΥ


Μετά την αυταρχική αλλαγή του Τουρκικού Συντάγματος, όπου πλέον την απόφαση επιστράτευσης και κήρυξης πολέμου την παίρνει άμεσα ο ίδιος ο Πρόεδρος (Ερντογάν) και απλά μετά πάει για έγκριση από την Βουλή (μένει να το μεταφράσουμε ακριβώς για ότι ακριβώς προβλέπεται), ακούστηκαν πολλές ανακρίβειες για το Ελληνικό σύστημα επιστράτευσης και κήρυξης πολέμου (και μάλιστα από ανθρώπους που έχουν υπηρετήσει σε θέσεις ευθύνης ως δημόσιοι λειτουργοί ).

Συγκεκριμένα είπαν δημόσια ότι την απόφαση για επιστράτευση και κήρυξη πολέμου την παίρνει το ΚΥΣΕΑ.

Δεν είναι ακριβώς έτσι, ούτε τόσο απλό, αφού υπάρχουν ασφαλιστικές δικλείδες και στάδια εισηγήσεων και εγκρίσεων από διαφορετικά όργανα του κράτους.
Ας δούμε το δικό μας σύστημα διεξοδικά:

Α. ΚΥΣΕΑ
1. Αποφασίζει την κήρυξη και άρση μέτρων και σταδίων συναγερμού για τη μερική ή γενική κινητοποίηση της Χώρας και την εφαρμογή και άρση των κανόνων εμπλοκής των Ενόπλων Δυνάμεων και αναθέτει αρμοδιότητες, σχετικά με τα παραπάνω, για την άμεση αντιμετώπιση έκτακτων καταστάσεων ή επεισοδίων.
2. Εξουσιοδοτεί τον Πρωθυπουργό να εισηγηθεί στον Πρόεδρο της Δημοκρατίας, ύστερα από πρόταση του Υπουργού Εθνικής Άμυνας, την κήρυξη και άρση γενικής ή μερικής επιστράτευσης και την κήρυξη πολέμου.

Β. ΥΠΟΥΡΓΙΚΟ ΣΥΜΒΟΥΛΙΟ
1. Αποφασίζει για κάθε θέμα αρμοδιότητας συλλογικών κυβερνητικών οργάνων ή για κάθε θέμα αρμοδιότητας ενός ή περισσότερων υπουργών που παραπέμπει σε αυτό ο Πρωθυπουργός.
σχετικές αποφάσεις του Υπουργικού Συμβουλίου υποκαθιστούν τις αποφάσεις των αρμόδιων οργάνων.

2. Το Υπουργικό Συμβούλιο, ύστερα από πρόταση του Πρωθυπουργού, μπορεί να αποφασίζει για οποιοδήποτε θέμα της αρμοδιότητας των άλλων συλλογικών κυβερνητικών οργάνων και να καταργήσει οποιαδήποτε απόφασή τους.

3. Το Υπουργικό Συμβούλιο, με απόφασή του, που εκδίδεται ύστερα από πρόταση του Πρωθυπουργού και δημοσιεύεται στην Εφημερίδα της Κυβερνήσεως, μπορεί:

α) Να καταργεί τα ήδη προβλεπόμενα ή με οποιοδήποτε τρόπο συνιστώμενα συλλογικά κυβερνητικά όργανα ή να μεταβάλλει τη σύνθεση και τις αρμοδιότητές τους.
β) Να συνιστά νέα συλλογικά όργανα από μέλη του ή και με τη συμμετοχή υφυπουργών, βουλευτών, δημόσιων λειτουργών και λειτουργών του δημόσιου τομέα ορίζοντας τις αρμοδιότητές τους και τον τρόπο οργάνωσης και λειτουργίας τους

Γ. ΣΥΝΤΑΓΜΑ – ΠΡΟΕΔΡΟΣ ΤΗΣ ΔΗΜΟΚΡΑΤΙΑΣ

Αρθρο 36: (Διεθνής παραστάτης, διεθνείς συνθήκες)
1. O Πρόεδρος της Δημοκρατίας, με τήρηση οπωσδήποτε των ορισμών του άρθρου 35 παράγραφος 1, εκπροσωπεί διεθνώς το Kράτος, κηρύσσει πόλεμο, συνομολογεί συνθήκες ειρήνης, συμμαχίας, οικονομικής συνεργασίας και συμμετοχής σε διεθνείς οργανισμούς ή ενώσεις και τις ανακοινώνει στη Bουλή, με τις αναγκαίες διασαφήσεις, όταν το συμφέρον και η ασφάλεια του Kράτους το επιτρέπουν.

'Αρθρο 35: (Ισχύς των πράξεων, προσυπογραφή)
1. Kαμία πράξη του Προέδρου της Δημοκρατίας δεν ισχύει ούτε εκτελείται χωρίς την προσυπογραφή του αρμόδιου Yπουργού, ο οποίος με μόνη την υπογραφή του γίνεται υπεύθυνος, και χωρίς τη δημοσίευσή της στην Eφημερίδα της Kυβερνήσεως.

ΚΑΤΑΛΗΓΟΝΤΑΣ

Ο πρωθυπουργός μετά από πρόταση του Υπουργού Άμυνας φέρνει το θέμα για ολική ή μερική επιστράτευση (και άρση της), και για κήρυξη πολέμου, το ΚΥΣΕΑ εγκρίνει και εξουσιοδοτεί τον πρωθυπουργό να εισηγηθεί στον Πρόεδρο της Δημοκρατίας, ο οποίος με ΠΔ κηρύσσει ή αίρει την επιστράτευση και κηρύσσει τον πόλεμο.
Το Κοινοβούλιο δεν εμπλέκεται στην διαδικασία αυτήν.

Επίσης το Υπουργικό Συμβούλιο θα μπορούσε να ακυρώσει τις αποφάσεις του ΚΥΣΕΑ (σε περίπτωση όπου δημιουργούνται ειδικές συνθήκες στις αποφάσεις του ΚΥΣΕΑ και θα ήταν μεθοδευμένο από τον πρωθυπουργό).

 ΜΑΘΗΜΑ Νο 3: ΓΙΑ PROMPT ENGINEERING ΣΤΟ ΑΙ

(Συνεχίζοντας την παράθεση των ταχέων μαθημάτων_:
Το "Top-p (Nucleus Sampling)" είναι μια από τις τεχνικές που χρησιμοποιούνται στην επεξεργασία φυσικής γλώσσας, ιδιαίτερα στη δημιουργία κειμένου από γλωσσικά μοντέλα, για τον έλεγχο της ποικιλομορφίας και της ποιότητας του παραγόμενου προϊόντος.
Ας δούμε πως λειτουργεί:
1. Ορισμός: Η δειγματοληψία Top-p (Top-p Sampling), γνωστή και ως “δειγματοληψία πυρήνων”(Nucleus Sampling), αναφέρεται στην δειγματοληπτική επιλογή λέξεων, όχι μόνο με βάση τις μεμονωμένες πιθανότητες τους, αλλά με βάση τη αθροιστική κατανομή πιθανοτήτων. Ο στόχος είναι να δώσουμε στο ΑΙ την εντολή να επιλέξει από το μικρότερο δυνατό σύνολο λέξεων των οποίων η αθροιστική πιθανότητα να υπερβαίνει ένα καθορισμένο όριο 𝑝.
2. Μηχανισμός:
α) Κατανομή πιθανοτήτων: Κατά τη δημιουργία της επόμενης λέξης, το μοντέλο εκχωρεί πιθανότητες σε όλες τις πιθανές λέξεις του λεξιλογίου.
β) Αθροιστική πιθανότητα: Στη συνέχεια, οι λέξεις ταξινομούνται με βάση τις πιθανότητές τους με φθίνουσα σειρά. Ξεκινώντας από την κορυφή, οι λέξεις προστίθενται σε μια λίστα υποψηφίων έως ότου η αθροιστική τους πιθανότητα υπερβεί το καθορισμένο όριο 𝑝
γ) Δειγματοληψία: Η επόμενη λέξη λαμβάνεται δειγματοληπτικά από αυτήν τη μειωμένη λίστα υποψηφίων.
3. Παράμετρος 𝑝:
α) Χαμηλότερες τιμές (π.χ. 𝑝 = 0.1): Αυτό σημαίνει ότι λαμβάνονται υπόψη μόνο οι πιο πιθανές λέξεις των οποίων η αθροιστική πιθανότητα είναι 0,1. Το αποτέλεσμα θα είναι πιο ντετερμινιστικό και εστιασμένο.
β) Ανώτερες αξίες (π.χ. 𝑝 = 0,9): Λαμβάνεται υπόψη ένα μεγαλύτερο σύνολο λέξεων, επιτρέποντας πιο διαφορετικά και δημιουργικά αποτελέσματα. Η έξοδος είναι λιγότερο ντετερμινιστική και μπορεί να εξερευνήσει πιο ποικίλες δυνατότητες.
4. Σύγκριση με τη θερμοκρασία (Temperature) :
α) Θερμοκρασία (Temperature): Τροποποιεί άμεσα την κατανομή πιθανότητας κλιμακώνοντας τα logit πριν από την εφαρμογή της συνάρτησης softmax. Οι χαμηλότερες θερμοκρασίες κάνουν την κατανομή πιο ευκρινή και οι υψηλότερες θερμοκρασίες την κάνουν πιο επίπεδη.
β) Δειγματοληψία Top-p (Top-p Sampling): Λειτουργεί με περικοπή της κατανομής πιθανοτήτων με βάση τη αθροιστική πιθανότητα, εστιάζοντας στις πιο πιθανές λέξεις ενώ επιτρέπει ελεγχόμενη ποικιλομορφία.
5. Πλεονεκτήματα της δειγματοληψίας Top-p (Top-p Sampling):
α) Ελεγχόμενη ποικιλομορφία (Controlled Diversity): Ισορροπεί αποτελεσματικά μεταξύ της δημιουργίας προβλέψιμου και διαφορετικού κειμένου χωρίς την ανάγκη προσαρμογής του σχήματος της κατανομής πιθανοτήτων.
β) Ευελιξία (Flexibility): Η δειγματοληψία Top-p μπορεί να προσαρμοστεί σε διαφορετικά επίπεδα απαιτούμενης δημιουργικότητας και συνοχής με απλή προσαρμογή 𝑝,
6. Περιπτώσεις χρήσης:
α) Αφήγηση και Δημιουργική Γραφή (Storytelling and Creative Writing): Ανώτερη τιμή 𝑝 για τη διασφάλιση δημιουργικών και λιγότερο επαναλαμβανόμενων αποτελεσμάτων.
β) Δημιουργία απαντήσεων και σύνοψη (Answer Generation and Summarization): χαμηλότερη τιμή 𝑝 για να διασφαλίσουμε πιο ακριβείς και αξιόπιστες πληροφορίες.
γ) Βέλτιστη Χρήση (optimal use): Χρησιμοποιώντας τη δειγματοληψία Top-p, οι μηχανικοί εντολών μπορούν να δημιουργήσουν κείμενο που είναι συνεκτικό και ποικίλο, καθιστώντας το ένα ισχυρό εργαλείο για τη βελτίωση της απόδοσης των μοντέλων γλώσσας σε διάφορες εφαρμογές.

 ΟΙ ΕΣΦΑΛΜΕΝΕΣ ΕΠΙΛΟΓΕΣ ΤΟΥ Κου ΔΕΝΔΙΑ ΩΣ ΥΠΟΥΡΓΟΥ ΕΘΝΙΚΗΣ ΑΜΥΝΑΣ

Όταν ο κος Δένδιας ήταν Υπουργός Εξωτερικών, ήμουν ένας από τους υποστηρικτές του για τις πρωτοβουλίες που είχε αναλάβει, και τον δυναμισμό που έδειχνε.
Όταν μετακινήθηκε στο Υπουργείο Άμυνας, αναρωτήθηκα (όπως πολλοί εξ υμών) γιατί έγινε αυτή η αλλαγή και πήγε Υπουργός Εξωτερικών ο κος Γεραπετρίτης ο οποίος όπως αποδεικνύεται αφίσταται κατά πολύ του τρόπου με τον οποίο ο κος Δένδιας ενασκούσε τα καθήκοντά του.
Κι ενώ ήλπιζα ότι ο κος Δένδιας θα έφερνε τα δυναμικά στοιχεία πολιτικής στο Υπουργείο Εθνικής Άμυνας, διαπιστώνεται ότι έχει κάνει μέχρι τώρα πολλά και σημαντικά λάθη.
1. Δεν προχώρησε το πρόγραμμα εκσυγχρονισμού των 4 ΜΕΚΟ, με αποτέλεσμα να υπάρχει τεράστιο πλέον πρόβλημα στην επιχειρησιακή ικανότητα των πλοίων αυτών. Ούτε ακόμη και σήμερα δεν έχει προχωρήσει το θέμα.
2. Αρχικά μιλούσε για πρόκτηση/ναυπήγηση πλοίων τύπου Arleigh Burke και μέσα σε διάστημα μήνα, ανακοίνωσε ότι θα υπάρξει νέο πρόγραμμα συμπαραγωγής με τις ΗΠΑ των μεγάλων μονάδων τύπου Constellation. Όμως τελικά δεν έγινε, αφού ήταν φανερό από την πρώτη στιγμή ότι δεν υπήρχε περίπτωση υλοποίησης ενός τέτοιου προγράμματος, τουλάχιστον για την επόμενη 10ετία (είχα εξηγήσει από την πρώτη στιγμή που το ανακοίνωσε ότι ήταν επιπόλαια κίνηση από την πλευρά του και ότι δεν υπήρχε πιθανότητα ανάληψης του πριν περάσουν τουλάχιστον 10 χρόνια).
3. Ταυτόχρονα πάγωσε την δυνατότητα παραγγελίας και 4ης Belhara, αφήνοντας το πρόγραμμα ανολοκλήρωτο επιχειρησιακά. Μερικές ημέρες πριν επανακάμπτει εξετάζοντας την παραγγελία και της 4ης. Ελπίζω να πάρει τελικά την απόφαση και να μην αλλάξει και πάλι επιλογή.
4. Ανακοίνωσε ότι θα πάρουμε 4 μεταχειρισμένα LCS (Littoral Combat Ship) από τις ΗΠΑ, την στιγμή που αποσύρονται ως ακατάλληλα επιχειρησιακά, παρά το γεγονός ότι είναι πλοία 15ετίας (γνωρίζουμε πολύ καλά τα προβλήματά τους). Ο δε εκσυγχρονισμός τους για να τους αλλάξουμε επιχειρησιακά ρόλο (ψάχνουμε να βρούμε τι θα τα κάνουμε δηλαδή) θα ήταν εξαιρετικά δαπανηρός.
5. Πήραμε τα 2 περιπολικά τύπου Island της ακτοφυλακής των ΗΠΑ (αναμένονται άλλα 2), ηλικίας πάνω από 30 ετών και προσπαθούμε να τα κάνουμε επιχειρησιακά περιπολικά του Π.Ν. για αποστολές επιτήρησης. Όμως το καλύτερο θα ήταν να τα δώσουμε στην ακτοφυλακή (που ήταν και ο αρχικός τους σχεδιασμός, ο οποίος εξυπηρετείτο και από τα συστήματα και τα όπλα που φέρουν).
6. Κατατέθηκε στην Βουλή το νέο νομοσχέδιο για το ¨Ελληνικό Κέντρο Αμυντικής Καινοτομίας (ΕΛΚΑΚ)¨, το οποίο είναι πρόχειρο, προσπαθεί να αντιγράψει αντίστοιχες ρυθμίσεις άλλων χωρών με άλλες δυνατότητες τόσο επενδυτικές και βιομηχανικές όσο και τεχνολογικές, με πληθώρα επικαλύψεων με άλλους κρατικούς φορείς και με μικτό διοικητικό σχήμα.
Ήδη ο Σύνδεσμος Ελλήνων Κατασκευαστών Αμυντικού Υλικού (ΣΕΚΠΥ) αντέδρασε για κάποιες προβληματικές προβλέψεις. Έχω γράψει διεξοδικά για τα προβλήματα του νομοσχεδίου, και δυστυχώς δεν υπάρχει κοινοβουλευτική αντιπολίτευση ικανή για να ασχοληθεί με επάρκεια με το ζήτημα.
7. Προβάλλεται επικοινωνιακά και βιαστικά, ότι θα υπάρξουν αλλαγές στο ζήτημα της Θητείας και θα ακολουθηθεί το Φινλαδικό μοντέλο. Μεγάλη επιπολαιότητα αυτές οι διακηρύξεις πριν ακόμη υπάρχει ολοκληρωμένο και συγκεκριμένο σχέδιο γι αυτό.
8. Ήταν ήδη Υπουργός Άμυνας για δύο και πλέον μήνες όταν αναλήφθηκε η ελλιπέστατη και κακοσχεδιασμένη αποστολή στην Λιβύη όπου θρηνήσαμε 5 άτομα (3 στελέχη των Ε.Δ.).
9. Τώρα ανακοινώνεται επιπόλαια πάλι η εγκατάσταση σε εξέδρες (πλωτές ή ημι-πλωτές) στην θάλασσα (χωρική μας θάλασσα) 7 Ραντάρ επιτήρησης θαλάσσιου χώρου κοντά στα νησιά του Ανατολικού Αιγαίου, ύψους 50 μέτρων.
- Αφενός είναι ανεξήγητο γιατί δεν γίνονται τα Ρ/Ε αυτά επί των νήσων για μεγαλύτερη οικονομία και μεγαλύτερη επιχειρησιακή αποτελεσματικότητα (μεγαλύτερο εύρος επιτήρησης-ισχυρότερες κατασκευές-μεγαλύτερη οικονομία κατασκευής και υποστήριξης - λιγότερα λειτουργικά και διοικητικά προβλήματα, μεγαλύτερη ασφάλεια - καλύτερη και αμεσότερη επιχειρησιακή διαλειτουργικότητα κλπ).
- Αφετέρου είναι δεδομένο ότι θα είναι πιο ευάλωτα από πλευράς ασφαλείας και ήταν αναμενόμενο ότι θα αντιδρούσαν οι Τούρκοι. Εάν δε τώρα δεν υλοποιηθεί το σχέδιο αυτό για τους αντικειμενικούς λόγους μερικούς από τους οποίους προανέφερα, θα φανεί ότι η Ελλάδα υπαναχώρησε υπό τον φόβο της Τουρκίας
ΚΑΤΑΛΗΓΟΝΤΑΣ
Τι φταίει και γίνονται τόσες επιπόλαιες και κακοσχεδιασμένες ενέργειες στο Υπουργείο Άμυνας; Δεν μας είχε συνηθίσει σε κάτι τέτοιο ο κος Δένδιας.
Πολλά λάθη και επιπολαιότητες συσσωρεύονται και η περίοδος χάριτος λόγω της πρότερης αποτελεσματικότητας του εξαντλείται.

Τρίτη 21 Μαΐου 2024

 

2ο  ΜΑΘΗΜΑ ΣΤΟ “PROMPT ENGINEERING” ΓΙΑ “ARTIFICIAL INTELLIGENCE” MODELS

Στην άμεση μηχανική, ιδιαίτερα στο πλαίσιο της εργασίας με μοντέλα γλώσσας όπως αυτά του OpenAI, η "θερμοκρασία (temperature)" είναι μια παράμετρος που ελέγχει την τυχαιότητα των όσων παράγονται από το μοντέλο.

1.       Ρύθμιση θερμοκρασίας: Η παράμετρος θερμοκρασίας κυμαίνεται συνήθως από 0 έως 1, αν και τεχνικά μπορεί να αυξηθεί πάνω από 1. Οι χαμηλότερες τιμές έχουν ως αποτέλεσμα πιο ντετερμινιστικά και εστιασμένα αποτελέσματα, ενώ οι υψηλότερες τιμές κάνουν την εξαγόμενα πιο τυχαία και διαφορετικά.

α)      Επίδραση στα αποτελέσματα:

·         Χαμηλή τιμή θερμοκρασίας (Low Temperature) (π.χ. 0,2): Σε αυτές τις τιμές, οι αποκρίσεις του μοντέλου θα είναι πιο ντετερμινιστικές και επαναλαμβανόμενες. Τείνει να επιλέγει τις λέξεις με την υψηλότερη πιθανότητα, οδηγώντας σε συντηρητική και προβλέψιμη δημιουργία κειμένου. Αυτό είναι χρήσιμο όταν χρειαζόμαστε ακριβείς και αξιόπιστες εξόδους.

·         Μέση τιμή θερμοκρασίας (Medium Temperature) (π.χ. 0,7): Στις τιμές αυτές το μοντέλο ισορροπεί μεταξύ δημιουργικότητας και αξιοπιστίας. Εισάγει κάποιο επίπεδο τυχαιότητας, επιτρέποντας ένα μείγμα προβλεψιμότητας και ποικιλομορφίας.

·         Υψηλή θερμοκρασία (High Temperature) (π.χ. 1,0 ή υψηλότερη): Οι απαντήσεις του μοντέλου γίνονται πιο τυχαίες και δημιουργικές. Θα πάρει περισσότερους κινδύνους στην επιλογή λέξεων, κάτι που μπορεί να οδηγήσει σε απροσδόκητα και ποικίλα αποτελέσματα. Αυτό μπορεί να είναι χρήσιμο για δημιουργική γραφή ή καταιγισμό ιδεών (brain storming), αλλά μπορεί επίσης να οδηγήσει σε λιγότερο συνεκτικές ή εκτός θέματος απαντήσεις.

β)   Τεχνική πτυχή (Technical Aspect): Μαθηματικά, η θερμοκρασία χρησιμοποιείται για την κλίμακα των logits (τις ακατέργαστες προβλέψεις του μοντέλου πριν μετατραπούν σε πιθανότητες) πριν από την εφαρμογή της συνάρτησης softmax. Οι χαμηλότερες θερμοκρασίες κάνουν την κατανομή πιθανοτήτων πιο έντονη (πιο κορυφαία), ενώ οι υψηλότερες θερμοκρασίες την κάνουν πιο επίπεδη (πιο απλωμένη)Η συνάρτηση softmax είναι μια μαθηματική συνάρτηση που μετατρέπει ένα διάνυσμα πραγματικών αριθμών σε κατανομή πιθανότητας.  

·         Τι είναι το Logit: Η συνάρτηση logit είναι μια κρίσιμη έννοια στη στατιστική και τη μηχανική μάθησ. Χρησιμεύει ως συνάρτηση σύνδεσης που αντιστοιχίζει πιθανότητες που κυμαίνονται μεταξύ 0 και 1 σε πραγματικούς αριθμούς σε ολόκληρη την αριθμητική κλίμακα, η οποία μπορεί στη συνέχεια να χρησιμοποιηθεί για να εκφράσει γραμμικές σχέσεις.

·         Η συνάρτηση logit ορίζεται μαθηματικά ως ο λογάριθμος των πιθανοτήτων p να συμβεί ένα συγκεκριμένο γεγονός: 

Logit(p) = log(p / (1 - p))

Εδώ, το p αντιπροσωπεύει την πιθανότητα του γεγονότος και το log υποδηλώνει τον φυσικό λογάριθμο.

Οι πιθανότητες είναι ο λόγος της πιθανότητας του γεγονότος προς την πιθανότητα να μην συμβεί το γεγονός. Όταν p είναι η πιθανότητα επιτυχίας, 1 - p είναι η πιθανότητα αποτυχίας και οι πιθανότητες είναι ένας τρόπος σύγκρισης της πιθανότητας αυτών των δύο αποτελεσμάτων.

·         Ερμηνεία των τιμών Logit:  Οι τιμές Logit μπορούν να ερμηνευθούν με όρους πιθανοτήτων. Οι θετικές τιμές logit υποδεικνύουν πιθανότητες μεγαλύτερες από 0,5 και επομένως πιθανότητες που ευνοούν να συμβεί το γεγονός, ενώ οι αρνητικές τιμές δείχνουν πιθανότητες μικρότερες από 0,5, με πιθανότητες λιγότερες από τις μισές για να συμβεί το γεγονότος.

γ)   Περιπτώσεις χρήσης:

·         Δημιουργική Γραφή (Creative Writing): Υψηλότερες θερμοκρασίες για την ενίσχυση της δημιουργικότητας και της ποικιλίας.

·         Ανάκτηση πραγματικών πληροφοριών (Factual Information Retrieval): Χαμηλότερες θερμοκρασίες για εξασφάλιση ακρίβειας και συνέπειας.

·         Πειραματισμός και Πρωτοτυποποίηση (Experimentation and Prototyping): Ρύθμιση θερμοκρασίας για την εύρεση της βέλτιστης ισορροπίας για μια συγκεκριμένη εργασία.

δ)  Ρύθμιση της Θερμοκρασίας

Προσαρμόζοντας τη θερμοκρασία, οι άμεσοι μηχανικοί μπορούν να προσαρμόσουν τη συμπεριφορά των μοντέλων γλώσσας ώστε να ανταποκρίνονται καλύτερα στις συγκεκριμένες ανάγκες τους, είτε πρόκειται για τη δημιουργία συνεπών αποκρίσεων είτε για την προώθηση της δημιουργικότητας και της εξερεύνησης στη παραγωγή κειμένου.

Δευτέρα 20 Μαΐου 2024

 PROMPT ENGINEERING & ΑΙ

ΤΑΧΕΑ ΜΑΘΗΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΙΚΗΣ ΧΡΗΣΗΣ ΤΟΥ “ARTIFICIAL INTELLIGENCE”

Είχα την τύχη να ασχοληθώ με το ΑΙ (Artificial Intelligence) από το 2006 που υπηρετούσα στο ΝΑΤΟ και είχε ξεκινήσει η εφαρμογή για υποστήριξη του “Decision Making Wall” που είχε εγκατασταθεί στην Στουτγάρδη στην “US Command” και δοκιμαζόταν από το ΝΑΤΟ.

Είχε δημιουργηθεί μία επιτροπή (στην οποία μετείχα) όπου εξέταζε αφενός την εισαγωγή πραγματικών δεδομένων στο μοντέλο και την ικανότητα του να παράγει συνθετική σκέψη και να προτείνει πιθανολογικά επιλογές, με βάση το πλαίσιο αναφοράς και την αξιολόγηση των πληροφοριών που δεχόταν.

Σήμερα τα πράγματα έχουν προχωρήσει πολύ και μάλιστα το ΑΙ απελευθερώθηκε από την στρατιωτική κυρίως χρήση κι έχει ευρεία και συνεχώς αυξανόμενη εφαρμογή στον ιδιωτικό τομέα (για όσους δεν το φοβούνται και δεν κυνηγούν τις μάγισσες του Σάλεμ όταν ακούν γι αυτό).

PROMPT ENGINEERING

Εάν όμως θέλουμε να κάνουμε την βέλτιστη αξιοποίηση των μοντέλων ΑΙ που διατίθενται σήμερα ελεύθερα (είτε με συνδρομή για συγκεκριμένους σκοπούς και χρήση) θα πρέπει να καταλάβουμε ότι όσο καλύτερα είναι τα εισαγόμενα και οι ερωτήσεις μας σε κάθε μοντέλο ΑΙ, τόσο πιο ωφέλιμες θα είναι οι απαντήσεις του.

Και η ικανότητα αυτή ονομάζεται “Prompt Engineering”, μηχανική υπόδειξης/προτροπής του ΑΙ από τον χρήστη, ώστε το μοντέλο να κινηθεί εντός του τεθέντος πλαισίου και να δώσει απαντήσεις με συνέπεια, συνάφεια, σχετικότητα και αξιοπιστία.

Eπειδή η γνώση δεν φυλακίζεται και οφείλουμε να δημιουργούμε γνωσιακές ανταλλαγές κλίμακας, ότι έχω μάθει για αυτό θα το δημοσιεύω σε διαδοχικές αναρτήσεις-οδηγίες, προκειμένου να βοηθήσω όσους ενδιαφέρονται να γίνουν αποτελεσματικοί χρήστες του ΑΙ χωρίς δαιμονοποιήσεις και φοβίες.

A. ΠΕΔΙΟ ΓΝΩΣΗΣ ΠΡΩΤΟ
PRIMING

Η προετοιμασία (priming) στο πλαίσιο της εργασίας με γλωσσικά μοντέλα, όπως αυτά που αναπτύχθηκαν από το OpenAI, αναφέρεται στην τεχνική παροχής ενός αρχικού πλαισίου ή ενός συνόλου οδηγιών για την καθοδήγηση της διαδικασίας δημιουργίας απαντητικού κειμένου από το μοντέλο. Ακολουθεί μια λεπτομερής εξήγηση του priming:

1. Ορισμός: Η προετοιμασία (priming) περιλαμβάνει την τροφοδοσία του μοντέλου με συγκεκριμένο κείμενο παρακίνησης/προτροπής (the prompt) στην αρχή της αλληλεπίδρασης. Αυτό το αρχικό κείμενο θέτει τη συλλογιστική βάση για το μοντέλο, βοηθώντας το ΑΙ να κατανοήσει το επιθυμητό πλαίσιο, το στυλ, τον τόνο ή το θέμα για το επόμενο αποτέλεσμα (εξαγόμενο).

2. Σκοπός:
α) Ρύθμιση Πλαισίου (Context Setting): Η προετοιμασία (priming) παρέχει το πλαίσιο που χρησιμοποιεί το μοντέλο για να δημιουργήσει σχετικές, συναφείς και συνεκτικές αποκρίσεις.
β) Καθοδήγηση (Guidance): Καθοδηγεί το μοντέλο προς την παραγωγή προϊόντος που ευθυγραμμίζεται με τις προσδοκίες των χρηστών ή τις συγκεκριμένες απαιτήσεις.
γ) Συνέπεια (Consistency): Διασφαλίζει ότι το κείμενο που δημιουργείται παραμένει συνεπές με το επιθυμητό θέμα ή στυλ.

3. Πως δουλεύει
α) Αρχικό κείμενο (Initial Text): Εισάγουμε μια προκαταρτική ερώτηση, η οποία μπορεί να είναι μια ερώτηση αλλά και μια δήλωση, μια μερική πρόταση ή ένα λεπτομερές σύνολο οδηγιών.
β) Μοντέλο απόκρισης (Model Response): Το μοντέλο επεξεργάζεται αυτήν την εισαγόμενη πρόταση/δήλωση/ερώτηση προτροπής και δημιουργεί κείμενο που συμμορφώνεται λογικά στο πλαίσιο που του θέσαμε ή στα συμφραζόμενα από την παρεχόμενη προτροπή.

4. Παραδείγματα:
α) Ερώτηση-Απάντηση (Question-Answering): Εισάγουμε μια ερώτηση για να λάβουμε μια άμεση απάντηση (π.χ., "Ποια είναι τα οφέλη των ανανεώσιμων πηγών ενέργειας;").

β) Αφήγηση(Storytelling): Παρέχουμε την αρχή μιας ιστορίας (μαζί με τα κυρίαρχα σημεία που θέλουμε να τονίσει και το πλαίσιο αναφοράς της ιστορίας) και αφήνουμε το μοντέλο να συνεχίσει την αφήγηση (π.χ. "Μια φορά κι έναν καιρό σε ένα μακρινό βασίλειο υπήρχε ένα ιππότης...").

γ) Δημιουργία κώδικα (Code Generation): Παρέχουμε οδηγίες ή απόσπασμα κώδικα για να ολοκληρώσει, συνθέσει είτε δημιουργήσει το επόμενου τμήμα του κώδικα. Η δημιουργία κώδικα είναι η χρήση ενός αλγορίθμου τεχνητής νοημοσύνης για τη παραγωγή κώδικα προγραμματισμού από μια φυσική γλώσσα ή άλλες μορφές εισόδου. Αυτό μπορεί να περιλαμβάνει τη δημιουργία ολοκληρωμένων προγραμμάτων, την ολοκλήρωση μερικώς γραμμένων κωδίκων ή την αυτόματη διόρθωση σφαλμάτων.

(1) Πώς Λειτουργεί ο Κώδικας;
Εντολή/Υπόδειξη (Prompt): Παρέχουμε μια εντολή/υπόδειξη, η οποία μπορεί να είναι οδηγίες σε φυσική γλώσσα, μέρος ενός κώδικα ή συγκεκριμένες οδηγίες για το τι πρέπει να κάνει ο κώδικας.
Επεξεργασία από το Μοντέλο: Το μοντέλο γλώσσας επεξεργάζεται μόνο του την εντολή/υποδειξη και, βάσει της εκπαίδευσής του, παράγει τον κατάλληλο κώδικα που αντιστοιχεί στην εντολή αυτή.
Παραγωγή Κώδικα: Το μοντέλο επιστρέφει τον παραγόμενο κώδικα, ο οποίος μπορεί να είναι ένα νέο τμήμα κώδικα, η ολοκλήρωση ενός ήδη υπάρχοντος κώδικα ή ακόμη και προτάσεις για βελτιώσεις και διορθώσεις.

(2) Παραδείγματα Χρήσης: «Ολοκλήρωσε τον Κώδικα»:
• Είσοδος/Εντολή/Υπόδειξη: "def calculate_factorial(n):"
• Έξοδος: Το μοντέλο συμπληρώνει τον κώδικα για να υπολογίζει το παραγοντικό ενός αριθμού.

δ) Τεχνικές Χρήσης:
• Σαφείς οδηγίες (Explicit Instructions): Καθοδηγούμε απευθείας στο μοντέλο τι θέλουμε να κάνει (π.χ. "Γράψτε ένα ποίημα τεσσάρων στροφών για τον ωκεανό με 2 παρομοιώσεις, 3 συνεκδοχές και 2 μεταφορές.").
• Παραδείγματα και Μοτίβα (Examples and Patterns): Παρέχουμε παραδειγμάτων για τη δημιουργία ενός μοτίβου που πρέπει να ακολουθεί το μοντέλο (π.χ. ανταλλάσσουμε πολλά ζευγάρια συγκεκριμένων ερωτήσεων/Απαντήσεων-Q&A για να το προετοιμάσουμε πριν κάνουμε την ερώτηση που θέλουμε να απαντήσει).

ε) Οφέλη:
Βελτιωμένη συνάφεια (Improved Relevance) : Διασφαλίζει ότι η έξοδος είναι σχετική με τις ανάγκες του χρήστη.
Ενισχυμένος έλεγχος (Enhanced Control): Παρέχει στους χρήστες περισσότερο έλεγχο ως προς τον τύπο και την ποιότητα του περιεχομένου που δημιουργείται.
Αυξημένη ακρίβεια (Increased Accuracy): Βοηθά στην παραγωγή πιο ακριβών και κατάλληλων απαντήσεων. με βάση το πλαίσιο που του θέσαμε και τα συμφραζόμενα.

στ) Περιπτώσεις χρήσης:
Δημιουργική Γραφή (Creative Writing): Του παρέχουμε συγκεκριμένα θέματα ή είδη για τη δημιουργία ιστοριών, ποιημάτων ή σεναρίων.
Εκπαιδευτικά εργαλεία(Educational Tools): Παρέχουμε το πλαίσιο για επεξηγήσεις, περιλήψεις ή συνεδρίες διδασκαλίας.
Υποστήριξη πελατών (Customer Support): Κάνουμε χρήση προκαθορισμένων μηνυμάτων για να βοηθήσουμε στη δημιουργία απαντήσεων σε κοινά ερωτήματα πελατών.