--°C Athens

Ρομπότ γίνεται άσος στο air χόκεϊ και μαθαίνει να νικά τους ανθρώπους

Ρομπότ γίνεται άσος στο air χόκεϊ και μαθαίνει να νικά τους ανθρώπους

Σε μια εποχή όπου η τεχνητή νοημοσύνη περνά από τη θεωρία στην πράξη με εντυπωσιακή ταχύτητα, μια ομάδα φοιτητών από το Πανεπιστήμιο της Βρετανικής Κολομβίας (UBC) κατάφερε κάτι που μοιάζει βγαλμένο από επιστημονική φαντασία: ένα ρομπότ που έμαθε να παίζει air χόκεϊ αποκλειστικά μέσα από προσομοίωση και στη συνέχεια αντιμετώπισε παίκτες στον πραγματικό κόσμο, χωρίς ποτέ να έχει «αγγίξει» πραγματικό τραπέζι κατά την εκπαίδευσή του.

Το project βασίστηκε σε μια απλή αλλά ριζοσπαστική ιδέα: αντί να εκπαιδεύσουν το AI μέσα από αργές και συχνά δαπανηρές δοκιμές στον φυσικό κόσμο, οι ερευνητές δημιούργησαν ένα εξαιρετικά ακριβές ψηφιακό αντίγραφο ενός τραπεζιού air χόκεϊ. Εκεί, η τεχνητή νοημοσύνη έπαιξε εκατομμύρια προσομοιωμένα παιχνίδια, μαθαίνοντας από τα λάθη της σε ένα πλήρως ελεγχόμενο περιβάλλον.

Η προσέγγιση αυτή έρχεται σε αντίθεση με την παραδοσιακή εκπαίδευση ρομποτικών συστημάτων, όπου η μάθηση βασίζεται σε επαναλαμβανόμενες δοκιμές στον πραγματικό κόσμο. Αν και αποτελεσματική, αυτή η μέθοδος είναι αργή και μπορεί να προκαλέσει φθορές στον εξοπλισμό. Αντίθετα, η προσομοίωση προσφέρει ασφάλεια, ταχύτητα και απεριόριστες επαναλήψεις.

Το πιο εντυπωσιακό στοιχείο, ωστόσο, είναι ότι η ομάδα δεν δημιούργησε ένα «τέλειο» ψηφιακό περιβάλλον. Αντιθέτως, ενσωμάτωσε σκόπιμα ατέλειες: ανώμαλες επιφάνειες, καθυστερήσεις αισθητήρων, μη προβλέψιμες αναπηδήσεις και μικρές μηχανικές αποκλίσεις. Αυτή η τεχνική, γνωστή ως «τυχαιοποίηση πεδίου», βοήθησε την AI να προετοιμαστεί για την αβεβαιότητα του πραγματικού κόσμου.

Παράλληλα, όπως αναφέρει το interestingengineering.com, χρησιμοποιήθηκε μια μέθοδος ενισχυτικής μάθησης τύπου «soft actor- critic», όπου το σύστημα μαθαίνει μέσα από ανταμοιβές και ποινές, όπως ακριβώς ένας παίκτης που βελτιώνεται μέσα από συνεχή εξάσκηση. Με εκατομμύρια προσομοιωμένα παιχνίδια, η τεχνητή νοημοσύνη έμαθε να προβλέπει την πορεία του δίσκου και να αντιδρά σε πολύπλοκες και γρήγορες συνθήκες.

Όταν το σύστημα μεταφέρθηκε στο πραγματικό τραπέζι, εξοπλισμένο με κάμερα υψηλής ταχύτητας και ειδικά σημαδεμένο puck, η απόδοσή του εξέπληξε ακόμη και τους δημιουργούς του. Παρά την απουσία φυσικής εμπειρίας, το ρομπότ ανταποκρίθηκε σε πραγματικό χρόνο, αποδεικνύοντας ότι η απόσταση ανάμεσα στην προσομοίωση και την πραγματικότητα μπορεί να είναι μικρότερη από όσο πιστεύαμε.

Η επιτυχία αυτή δεν περιορίζεται στο air χόκεϊ. Οι ερευνητές εκτιμούν ότι παρόμοιες τεχνικές θα μπορούσαν να εφαρμοστούν στην εκπαίδευση αυτόνομων οχημάτων, drones και άλλων ρομποτικών συστημάτων, μειώνοντας τον χρόνο ανάπτυξης και αυξάνοντας την ασφάλεια.

Διαβάστε Σχετικά