Ακουστικά ΑΙ: Νέα ακουστικά ΑΙ επιτρέπουν στους χρήστες να ακούν ένα άτομο στο πλήθος

Μια ομάδα από το Πανεπιστήμιο της Ουάσιγκτον παρέχει ένα αξιοσημείωτο άλμα στην προσωπική τεχνολογία ήχου μέσω ακουστικών με τεχνητή νοημοσύνη που φιλτράρουν μόνο τον ανεπιθύμητο θόρυβο. Αυτά τα ακουστικά, μέρος ενός συστήματος που ονομάζεται “Target Speech Hearing” (TSH), επιτρέπουν στους χρήστες να απομονώνουν τη φωνή ενός μεμονωμένου ηχείου σε ένα θορυβώδες περιβάλλον απλώς κοιτάζοντάς το.

akoustika1

Αν και δεν είναι ακόμη διαθέσιμη στο εμπόριο, αυτή η καινοτόμος τεχνολογία παρουσιάστηκε πρόσφατα στο συνέδριο ACM CHI για τους ανθρώπινους παράγοντες στα υπολογιστικά συστήματα στη Χονολουλού. Το σύστημα TSH επιτρέπει σε έναν χρήστη να εστιάσει σε ένα άτομο που μιλάει για τρία έως πέντε δευτερόλεπτα, «εγγράφοντάς το» ουσιαστικά στο σύστημα. Μόλις εγγραφεί, το σύστημα ακυρώνει όλους τους άλλους ήχους περιβάλλοντος και αναπαράγει μόνο τη φωνή του στοχευμένου ηχείου, ακόμη και όταν ο ακροατής κινείται και δεν βλέπει πλέον το ηχείο.

Για την ενεργοποίηση του συστήματος, ο χρήστης φορά τυπικά ακουστικά εξοπλισμένα με μικρόφωνα. Όταν ο χρήστης κατευθύνει το κεφάλι του προς ένα ηχείο και πατήσει ένα κουμπί στα ακουστικά, τα ηχητικά κύματα από τη φωνή του ηχείου φτάνουν στα μικρόφωνα ταυτόχρονα, με περιθώριο σφάλματος 16 μοιρών. Αυτά τα ηχητικά σήματα αποστέλλονται στη συνέχεια σε έναν ενσωματωμένο υπολογιστή στα ακουστικά, όπου το λογισμικό μηχανικής εκμάθησης αναγνωρίζει και μαθαίνει τα φωνητικά μοτίβα του επιθυμητού ηχείου. Ο ανώτερος συγγραφέας Shyam Gollakota, καθηγητής στη Σχολή Επιστήμης & Μηχανικής Υπολογιστών Paul G. Allen στο Πανεπιστήμιο της Ουάσιγκτον, εξήγησε ότι ενώ πολλοί θεωρούν την τεχνητή νοημοσύνη ως chatbots που βασίζονται στον ιστό, αυτό το έργο καταδεικνύει τη δυνατότητα του AI να αλλάξει την ακουστική αντίληψη με βάση τις προτιμήσεις των χρηστών .

Η ομάδα πραγματοποίησε δοκιμές με 21 άτομα που αξιολόγησαν την καθαρότητα της φωνής του εγγεγραμμένου ομιλητή σε σύγκριση με τον μη φιλτραρισμένο ήχο. Κατά μέσο όρο, τα άτομα βαθμολόγησαν τη διαύγεια της φωνής του εγγεγραμμένου ομιλητή σχεδόν διπλάσια, σύμφωνα με την ερευνητική ομάδα. Το τρέχον σύστημα μπορεί να εγγράψει μόνο ένα ηχείο κάθε φορά και απαιτεί ένα σχετικά ήσυχο περιβάλλον για να διασφαλιστεί η ακρίβεια κατά την εγγραφή ενός νέου ηχείου. Εάν ο χρήστης δεν είναι ικανοποιημένος με την ποιότητα του ήχου, μπορεί να εγγράψει ξανά το ηχείο για να βελτιώσει την ευκρίνεια. Η τεχνολογία αναμένεται να εξελιχθεί, με σχέδια προσαρμογής της ώστε να χρησιμοποιείται σε ακουστικά και βοηθήματα ακοής, επεκτείνοντας την προσβασιμότητα και τη λειτουργικότητά της.

akkoustika

Αυτό το σύστημα AI βασίζεται σε προηγούμενη έρευνα της ίδιας ομάδας, η οποία ανέπτυξε τη «σημασιολογική ακοή». Αυτό το προηγούμενο έργο επέτρεψε στους χρήστες να επιλέξουν συγκεκριμένες κατηγορίες ήχου στις οποίες θα εστιάζονταν ενώ ακυρώνουν τους ήχους μέσα στο περιβάλλον τους. Το νέο σύστημα TSH προωθεί την ιδέα του περαιτέρω, επιτρέποντας την εστίαση σε πραγματικό χρόνο σε ένα συγκεκριμένο ηχείο σε μια δυναμική και θορυβώδη ρύθμιση. «Τείνουμε να θεωρούμε την τεχνητή νοημοσύνη τώρα ως chatbot που βασίζονται στον ιστό που απαντούν σε ερωτήσεις», δήλωσε ο ανώτερος συγγραφέας Shyam Gollakota σε μια δήλωση τύπου. “Αλλά σε αυτό το έργο, αναπτύσσουμε την τεχνητή νοημοσύνη για να τροποποιήσουμε την ακουστική αντίληψη οποιουδήποτε φοράει ακουστικά, δεδομένων των προτιμήσεών του. Με τις συσκευές μας μπορείτε πλέον να ακούτε καθαρά ένα ηχείο ακόμα κι αν βρίσκεστε σε θορυβώδες περιβάλλον με πολλούς άλλους ανθρώπους να μιλάνε.”