Συλλέξτε μια λίστα αναπαραγωγής, βρείτε ένα κομμάτι κολλημένο στο μυαλό σας, γράψτε ένα θεατρικό έργο: τι μπορεί να κάνει η τεχνητή νοημοσύνη με τη μουσική
μικροαντικείμενα / / March 30, 2022
Αναγνώριση συνθέσεων
Ένα δροσερό κομμάτι μπορεί να ακουστεί παντού: σε ένα εμπορικό κέντρο, σε μια καφετέρια, ακόμη και από το παράθυρο ενός κοντινού αυτοκινήτου, ενώ στέκεστε σε μποτιλιάρισμα. Για να μην χάσετε το άγνωστο τραγούδι που σας αρέσει, αρκεί να ενεργοποιήσετε την εφαρμογή αναγνώρισης. Το όνομα της σύνθεσης και το όνομα του καλλιτέχνη σε αυτά δίνονται από την τεχνητή νοημοσύνη σε δευτερόλεπτα. Είναι αλήθεια ότι πίσω από ένα τόσο γρήγορο αποτέλεσμα υπάρχει μια ενδελεχής προετοιμασία: για να μάθετε γρήγορα τη μελωδία, το πρόγραμμα πρέπει πρώτα να τη θυμάται. Για να γίνει αυτό, τα νευρωνικά δίκτυα εισάγονται σε μια τεράστια βιβλιοθήκη κομματιών και στη συνέχεια οι αλγόριθμοι μετατρέπουν τον ήχο σε φασματόγραμμα και τον αποσυνθέτουν σε χρόνο, συχνότητα και ένταση.
Ανατόλι Σταρόστιν
Επικεφαλής της Υπηρεσίας Ανάπτυξης Τεχνολογίας στην Yandex Media Services.
Ένα φασματόγραμμα είναι ένα γράφημα. Ο χρόνος βρίσκεται κατά μήκος του οριζόντιου άξονα, η συχνότητα του ήχου βρίσκεται κατά μήκος του κατακόρυφου άξονα και η έντασή του σε μια σταθερή στιγμή εκφράζεται με χρώμα. Ένα χαμηλό σήμα αντιπροσωπεύεται από μια κόκκινη γραμμή στο κάτω μέρος και ένα υψηλό σήμα στην κορυφή. Το αποτέλεσμα είναι μια εικόνα που αποτελείται από χρωματιστές οριζόντιες ρίγες. Η ανάλυση τέτοιων κυκλωμάτων βοηθά στην αναγνώριση της μουσικής. Κατά την εργασία με φασματογράμματα, χρησιμοποιούνται οι ίδιες προσεγγίσεις νευρωνικών δικτύων όπως και στην ανάλυση εικόνας.
Ας υποθέσουμε ότι ένα άτομο ακούει ένα τραγούδι στο ραδιόφωνο και θέλει να μάθει το όνομα και τον καλλιτέχνη. Το πρόγραμμα αναγνώρισης δημιουργεί ένα φασματόγραμμα του ηχητικού περάσματος και το στέλνει στη βιβλιοθήκη ιχνών του. Στη συνέχεια συγκρίνει την «εικόνα» της επιθυμητής μελωδίας με τα φασματογράμματα άλλων συνθέσεων και επιλέγει την πιο ακριβή αντιστοίχιση. Ταυτόχρονα, η τεχνητή νοημοσύνη αναγνωρίζει τη μελωδία ακόμη και μέσω σοβαρών παρεμβολών, όπως θόρυβος από το δρόμο ή επισκευές σε γειτονικό διαμέρισμα.
Παρεμπιπτόντως, το νευρωνικό δίκτυο είναι σε θέση όχι μόνο να αναγνωρίσει τον καλλιτέχνη και το όνομα του κομματιού που έχει κολλήσει στο κεφάλι, αλλά και να καθορίσει χονδρικά το είδος του. Για να γίνει αυτό, η τεχνητή νοημοσύνη διδάσκεται να βρίσκει μοτίβα σε διαφορετικά μουσικά στυλ. Τέτοια ειδικά χαρακτηριστικά είναι συνήθως απρόσιτα για την ανθρώπινη όραση και ακοή. Αλλά χάρη στη μηχανική μάθηση, καθίσταται δυνατός ο υπολογισμός των μουσικών ειδών από εικόνες φασματογράμματος.
Προτείνετε τραγούδια
Φαίνεται ότι το να βρεις μόνος σου το «ίδιο» κομμάτι που ταιριάζει στη διάθεσή σου σε δισεκατομμύρια τραγούδια είναι σχεδόν τόσο απίθανο όσο το να ερωτευτείς με την πρώτη ματιά. Αλλά χάρη στους αλγόριθμους συστάσεων, οι τέλειες αντιστοιχίσεις δεν συμβαίνουν τόσο συχνά. Αρχικά, η τεχνητή νοημοσύνη αναζητά άτομα με παρόμοια γούστα και, στη συνέχεια, συνδέονται στατιστικοί τύποι: ο αριθμός των "μου αρέσει", "δεν μου αρέσει", τα παιχνίδια και οι παραλείψεις μιας συγκεκριμένης σύνθεσης.
Ανατόλι Σταρόστιν
Η σύσταση τραγουδιού λειτουργεί σύμφωνα με ένα απλό σχέδιο: αν στον Vasya άρεσε το κομμάτι X και μετά το βαθμολόγησε και ο Petya, τότε όταν ο Vasya αρέσει στο Y, ο Petya θα πρέπει επίσης να προτείνει το κομμάτι Y. Όταν ο αλγόριθμος χρειάζεται να βρει το επόμενο τραγούδι, ο τύπος εφαρμόζεται σε ένα σύνολο πιθανών τραγουδιών. Το πιο κατάλληλο επιπλέει στην κορυφή.
Το "κρύο" περιεχόμενο, που δεν εμφανίζεται στις λίστες αναπαραγωγής του μαζικού ακροατή, εξαπλώνεται πιο αργά. Αλλά χάρη στα νευρωνικά δίκτυα, οι άγνωστοι καλλιτέχνες και η εξειδικευμένη μουσική εξακολουθούν να έχουν μια μικρή ευκαιρία να τρεμοπαίζουν στη ροή των συστάσεων. Εάν απλοποιήσουμε όλες τις τεχνικές αποχρώσεις, τότε μπορούμε να πούμε ότι σε τέτοιες περιπτώσεις, η τεχνητή νοημοσύνη ανακαλύπτει πόσο συχνά ένας συγκεκριμένος χρήστης ακούει τραγούδια με παρόμοια φασματογράμματα και τον προσκαλεί περιοδικά να εξοικειωθεί με νέα κομμάτια.
Μαίρη Γκου
Τραγουδιστής.
Μερικές φορές αναζητώ έμπνευση στις συστάσεις. Εμπιστεύομαι την επιλογή της σύνθεσης στη μουσική υπηρεσία, ακούω τις μελωδίες, βρίσκω ενδιαφέροντες ήχους ή κείμενα. Έτσι μπορείς πραγματικά αυθόρμητα να ερωτευτείς ένα κομμάτι ενός άγνωστου καλλιτέχνη. Και μια άλλη γραμμή που άκουσα κατά λάθος μπορεί να με παρακινήσει να δημιουργήσω τα δικά μου ποιήματα.
Τα νευρωνικά δίκτυα βοηθούν επίσης στη δημιουργία μουσικών επιλογών για φυσική κατάσταση, περπάτημα ή ύπνο. Οι συντάκτες περιεχομένου επιλέγουν ίχνη αναφοράς για αλγόριθμους και με βάση τα φασματογράμματά τους, η τεχνητή νοημοσύνη επεκτείνει τις θεματικές προτάσεις.
παράγουν μουσική
Παλαιότερα, μόνο οι συνθέτες μπορούσαν να δημιουργήσουν μελωδίες. Τώρα είναι δυνατό χωρίς τη συμμετοχή μουσικών. Το 2020, η Ολλανδία φιλοξένησε τον πρώτο διαγωνισμό τραγουδιού της Eurovision για νευρωνικά δίκτυα - τον Διαγωνισμό Τραγουδιού AI. Ο Αυστραλός κέρδισε συνεργασία τεχνητή νοημοσύνη με κοάλα, αλκυόνες και διαβόλους της Τασμανίας. Το τραγούδι ήταν αφιερωμένο στις δασικές πυρκαγιές που μαίνονται στην ήπειρο. Ήχοι ζώων καταγράφηκαν σε σύντομα δείγματα - θραύσματα διάρκειας 1-2 δευτερολέπτων. Ο αλγόριθμος τα συνδύασε με τις επιτυχίες όλων των προηγούμενων νικητών της πραγματικής Eurovision, μετά την οποία συγκέντρωσαν τα δείγματα στη δική τους μελωδία.
Αυτό δεν είναι το μόνο παράδειγμα μιας επιτυχημένης δημιουργικής ένωσης προγραμματιστών και νευρωνικών δικτύων. Το 2019, στο κλείσιμο του Χειμερινού Διεθνούς Φεστιβάλ Τεχνών στο Σότσι, η Κρατική Ορχήστρα ερμήνευσε ένα 8λεπτο κομμάτι. Γράφτηκε από τον συνθέτη Kuzma Bodrov από ξεχωριστά κομμάτια μελωδιών που δημιουργούνται από νευρωνικά δίκτυα. Σήμερα, η δημιουργία μουσικής είναι ο πιο πολλά υποσχόμενος τομέας για την ανάπτυξη της τεχνητής νοημοσύνης.
Ανατόλι Σταρόστιν
Η τεχνητή νοημοσύνη μπορεί να δημιουργήσει μουσική με τρεις τρόπους. Το πρώτο συνδέεται με την κατασκευή έτοιμων «τούβλων» ήχου – δειγμάτων. Σε αυτήν την περίπτωση, ο αλγόριθμος απλώς τα ταξινομεί με τη σωστή σειρά σε πολλά κομμάτια ήχου και ο ηλεκτρονικός διασκευαστής αναμιγνύει το τελικό κομμάτι. Ο δεύτερος τρόπος είναι να δημιουργήσετε μουσική σημειογραφία. Είναι σαν να γράφεις οδηγίες για τον μουσικό να παίξει το τελειωμένο έργο σε αυτό. Και ο τρίτος τρόπος είναι η εγγραφή του «ακατέργαστου» ηχητικού σήματος. Σε αυτή την περίπτωση, το ίδιο το νευρωνικό δίκτυο δημιουργεί ηχητικά κύματα που είναι παρόμοια, για παράδειγμα, με τον Μότσαρτ ή τους Beatles.
Παρεμπιπτόντως, τα νευρωνικά δίκτυα μπορούν επίσης να γράφουν ποίηση για τραγούδια. Μέχρι στιγμής, τέτοια κομμάτια ακούγονται μάλλον περίεργα, οπότε οι τραγουδοποιοί δεν πρέπει να ανησυχούν για την ανεργία. Επιπλέον, το «μυαλό του υπολογιστή» στερείται συναισθημάτων. Δεν μπορεί να διεισδύσει στο συναισθηματικό πλαίσιο και να μεταφέρει τις εμπειρίες που ανάγκασαν τους δημιουργούς των έργων να δημιουργήσουν.
Μαίρη Γκου
Η ποίηση και η μουσική αφορούν πρωτίστως την ψυχή, τον εσωτερικό κόσμο, τις εμπειρίες, τα συναισθήματα και τα συναισθήματα των ανθρώπων. Για παράδειγμα, το νέο κομμάτι “Don’t Burn Out” είναι η προσωπική μου ιστορία, αλλά επίσης αφορά όλους όσους κυνηγούν ένα όνειρο και προσπαθούν να κατανοήσουν τον εαυτό τους. Δεν νομίζω ότι η τεχνητή νοημοσύνη θα αντικαταστήσει ποτέ έναν ζωντανό άνθρωπο στη μουσική βιομηχανία. Αλλά εδώ μπορείτε να πάρετε μια ενδιαφέρουσα σειρά "ανθρώπινο - νευρωνικό δίκτυο". Γνωρίζουμε ήδη δεκάδες παραδείγματα όταν η τεχνητή νοημοσύνη βοήθησε τους συνθέτες να δημιουργήσουν μοναδικές μελωδίες. Στην πραγματικότητα, πρόκειται για μια νέα κατεύθυνση στον μουσικό κόσμο, που είμαι σίγουρος ότι θα έχει τον δικό του ακροατή και κοινό στο μέλλον.
Η τεχνητή νοημοσύνη κάνει τη δημιουργικότητα προσιτή σε όλους και η μουσική τη βοηθά να αναπτυχθεί. Για να καταλάβετε πώς αυτοί οι δύο πόλοι συγκλίνουν και επηρεάζουν ο ένας τον άλλον, μπορείτε "Αριθμοί μαθημάτων" από την Yandex - "Digital Art: Music and IT". Μαζί με τους ήρωες των κόμικς, οι συμμετέχοντες θα μάθουν πώς τα νευρωνικά δίκτυα αναγνωρίζουν και δημιουργούν κομμάτια και ποιες τεχνολογίες βοηθούν στο έργο των μουσικών υπηρεσιών που γνωρίζουμε. Στο μάθημα, οι μαθητές θα προσπαθήσουν να μαντέψουν τη μελωδία από το φασματόγραμμα και να συντάξουν μια λίστα αναπαραγωγής με συστάσεις.
Θέλω να "Αριθμοί μαθήματος"
Κάλυμμα: Willyam Bradberry / Shutterstock / Eric Isselee / Shutterstock / Ljupco Smokovski / Shutterstock / FOTOSPLASH / Shutterstock / Όλγα Σελέπινα / Lifehacker