Maxim Polyakov: από τι αποτελούνται οι μηχανές αναζήτησης και πώς η Google έγινε η κύρια (και εξακολουθεί να είναι)
μικροαντικείμενα / / April 14, 2023
Η μόνη απειλή για τον παγκόσμιο ηγέτη είναι η εμφάνιση των νευρωνικών δικτύων.
Όσο μεγαλύτερη είναι η ποσότητα των πληροφοριών στον Ιστό, τόσο περισσότερο χρειαζόμαστε τις μηχανές αναζήτησης. Την πρώτη θέση ανάμεσά τους έχει εδώ και καιρό σταθερά καταλάβει η Google. Γιατί η εμφάνισή του έχει φέρει επανάσταση και τι να περιμένουμε από την ανάπτυξη εργαλείων ιστού στο μέλλον, δήλωσε ο καθηγητής και διευθυντής πολυμέσων MGIMO Maxim Polyakov. Ο Lifehacker έκανε μια περίληψη της διάλεξής του σε ένα διεπιστημονικό συνέδριο Στιγμιότυπο οθόνης_2023, που πραγματοποιήθηκε στη Μόσχα στις 25 και 26 Μαρτίου.
Μαξίμ Πολιάκοφ
Δημοσιογράφος, media manager, καθηγητής στο Τμήμα Διεθνούς Δημοσιογραφίας στο MGIMO.
Πότε και γιατί οι χρήστες χρειάζονταν μηχανές αναζήτησης
Ο όγκος των πληροφοριών για τον πλανήτη Γη αυξάνεται συνεχώς. Για αιώνες, τα δεδομένα έχουν συσσωρευτεί σε αναλογικές συσκευές - πρώτα σε χειρόγραφα και βιβλία, αργότερα - σε δίσκους βινυλίου, σε ταινίες και βιντεοκασέτες.
Το 1993 υπήρχαν αποθήκευση ψηφιακών δεδομένων
. Και από τότε, το μερίδιο της ψηφιακής πληροφορίας αυξάνεται. Το 2002, ήρθε ένα σημείο καμπής: ο όγκος των δεδομένων σε ψηφιακά έγινε ίσος με τις αναλογικές πηγές. Η ψηφιακή εποχή έχει ξεκινήσει. Έκτοτε, το απόθεμα ψηφιακών δεδομένων αυξήθηκε εκθετικά και μαζί με αυτό, αυξήθηκε και ο συνολικός όγκος πληροφοριών στον πλανήτη.Προκύπτει ένα πρόβλημα: δεν είναι σαφές πώς να βρείτε γρήγορα αυτό που χρειάζεστε σε αυτόν τον τεράστιο όγκο πληροφοριών. Αυτό κάνουν οι μηχανές αναζήτησης.
Το 1998, όταν η Google εισήλθε για πρώτη φορά στην αγορά, υπήρχαν αρκετές υπηρεσίες αναζήτησης στο Διαδίκτυο. Για παράδειγμα, οι πύλες AltaVista και Lycos ήταν διαθέσιμες στη Ρωσία και συνολικά υπήρχαν περισσότεροι από δώδεκα τέτοιοι πόροι: Netscape, Ask Jeeves, AOL, MSN και άλλοι. Google έγινε ένας από αυτούς και νίκησε ανταγωνιστές.
Συμπεράσματα για το πώς είναι καλύτερη από άλλες μηχανές αναζήτησης, το 1999, έβγαλε ο Ισπανός επιστήμονας Ramon Salvera. Στα τέλη της δεκαετίας του '90, συνάντησε μια ενδιαφέρουσα διατριβή από το Πανεπιστήμιο του Στάνφορντ. Ονομάστηκε "Research papers about Google and the Web Base" και δημοσιεύτηκε το 1997. Οι συγγραφείς του ήταν μεταπτυχιακοί φοιτητές Sergey Brin και Larry Page.
Ο Σαλβέρα διάβασε τη διατριβή και δοκίμασε τη συμβολοσειρά αναζήτησης. Και αμέσως έγραψε ένα άρθρο για την εφημερίδα της πόλης «Ημερολόγιο της Ναβάρας», την οποία ονόμασε «Η επανάσταση της Google».
Ο Ραμόν και εγώ συζητήσαμε ποιο είναι το μυστικό της Google και μοιράζομαι μαζί σας τα συμπεράσματα - τα δικά μου και τα δικά του.
Μαξίμ Πολιάκοφ
Πώς λειτουργούσαν οι μηχανές αναζήτησης πριν από το Google
Εισαγάγετε στη γραμμή αναζήτησης αίτηση - για παράδειγμα, "κατάστημα υλικού". Ο αλγόριθμος βρίσκει έγγραφα που περιέχουν αυτήν τη φράση. Στη συνέχεια, η μηχανή αναζήτησης μετρά πόσες φορές επαναλαμβάνονται οι λέξεις-κλειδιά στη σελίδα. Αυτά τα έγγραφα, όπου υπάρχουν περισσότερες τέτοιες αναφορές, εμπίπτουν στις πρώτες γραμμές του τεύχους.
Σημαντικό: η μηχανή αναζήτησης δεν γνωρίζει τι είδους σελίδες είναι αυτές - ίσως ιστότοποι καταστημάτων ή ίσως απλώς πόροι που γράφουν για την κατασκευή. Επομένως, ο αλγόριθμος δεν μπορεί να προσδιορίσει πόσο χρήσιμα έγγραφα στα αποτελέσματα αναζήτησης θα είναι χρήσιμα για τον χρήστη. Ως αποτέλεσμα, ένα άτομο λαμβάνει μια μακρά λίστα ιστότοπων και πρέπει να ανοίξει κάθε σελίδα και να αναζητήσει τις κατάλληλες μεταξύ τους για μεγάλο χρονικό διάστημα.
Πώς η Google άλλαξε ριζικά τους κανόνες αναζήτησης
Το κύριο πράγμα που εμφανίστηκε στο Google είναι το PageRank, ένας νέος αλγόριθμος αναζήτησης. Ο Brin και ο Page αποφάσισαν ότι δεν θα άξιζε τον κόπο να ψάξουν στο Διαδίκτυο για μεμονωμένα έγγραφα κατόπιν αιτήματος και στη συνέχεια να τα εκδώσουν σε μια λίστα. Πρέπει να τα εξερευνήσετε όλα ταυτόχρονα. Ταυτόχρονα, είναι σημαντικό να επιλέξετε από τη γενική λίστα αυτά που θα είναι τα πιο σημαντικά για τον χρήστη.
Το πιο δύσκολο είναι να βρεθεί το σωστό κριτήριο που θα έδειχνε την αυθεντία του εγγράφου. Για να γίνει αυτό, οι συγγραφείς ανέπτυξαν έναν ειδικό τύπο και ονόμασαν την προκύπτουσα τιμή PR - PageRank.
Η επαναστατική ανακάλυψη των δημιουργών της Google - η επιλογή των κριτηρίων για την αξιολόγηση της σημασίας του εγγράφου. Έγιναν σύνδεσμοι.
Το κύριο πράγμα που ελήφθη υπόψη στον νέο αλγόριθμο είναι πόσες φορές άλλοι πόροι αναφέρονται στο έγγραφο. Αυτός που αναφέρεται συχνότερα γίνεται πρώτος στην κατάταξη και αναγνωρίζεται ως ο πιο έγκυρος. Για παράδειγμα, αν επτά στους δέκα τοποθεσίες Ανατρέξτε σε ένα, τότε ο ηγέτης είναι αυτός.
Ως αποτέλεσμα, επιλέγονται αρκετοί κόμβοι που έχουν τους περισσότερους συνδέσμους. Περαιτέρω, ο τύπος λαμβάνει υπόψη εάν το "νούμερο ένα" που βρήκαμε αναφέρει οποιαδήποτε έγγραφα. Αν υπάρχουν τέτοιες σελίδες, αμέσως ανεβαίνουν στην κατάταξη. Οι σύνδεσμοι εγγράφων από την κορυφή της λίστας ζυγίζουν πάντα περισσότερο από τους συνδέσμους από τις παρακάτω πηγές.
Τελικά χρήστης βλέπει ιστότοπους στα αποτελέσματα αναζήτησης που είναι πραγματικά χρήσιμοι για αυτόν. Δεν χρειάζεται να αφιερώνει χρόνο στην ανάλυση σελίδων όπου αναφέρονται λέξεις-κλειδιά - η Google το έχει ήδη κάνει αυτό για αυτόν.
Ο χρήστης δεν χρειάζεται 20 λεπτά ή μία ώρα για να επιλέξει τον ιστότοπο που επιθυμεί από τη λίστα. Αυτό έχει γίνει ένα από τα δολοφονικά πλεονεκτήματα της Google. Αυτή η μηχανή αναζήτησης, χωρίς καμία διαφήμιση, εξαπλώθηκε αμέσως σε όλο τον κόσμο, όλοι τη έστειλαν ο ένας στον άλλον και είπαν: "Λοιπόν, δοκιμάστε το, δείτε πώς λειτουργεί".
Μαξίμ Πολιάκοφ
Πώς η Google έφτασε στην κορυφή και γιατί κατέχει το προβάδισμα
Οι ιδρυτές της Google δεν δημιούργησαν μόνο τον αλγόριθμο αναζήτησης. Ανέπτυξαν την αρχιτεκτονική της εταιρείας και κατέληξαν στις βασικές αρχές της δουλειάς της.
Οι Brin και Page κατέγραψαν την Google το 1998 και άρχισαν να χτίζουν το μέλλον τους. εταιρεία στο γκαράζ της Σούζαν, της φίλης του Μπριν. Στον πίνακα, τα παιδιά έγραψαν: «Εστιάστε στον χρήστη». Λίγο αργότερα διατύπωσαν την αποστολή της εταιρείας.
Στόχος μας είναι να συστηματοποιήσουμε όλες τις διαθέσιμες πληροφορίες στον κόσμο και να τις καταστήσουμε προσβάσιμες και βολικές για χρήση.
Σεργκέι Μπριν και Λάρι Πέιτζ
Για την Google, προτεραιότητα από την αρχή ήταν αυτός που ορίζει το ερώτημα αναζήτησης και όχι οι οργανισμοί που δημιούργησαν τους ιστότοπους και περιμένουν νέους πελάτες. Ως εκ τούτου, η εταιρεία αποφάσισε αμέσως: διαφήμιση θα πρέπει να διαχωρίζονται σαφώς από τα αποτελέσματα αναζήτησης και ένα άτομο δεν πρέπει να συγχέει τα οργανικά αποτελέσματα αναζήτησης με τις πληρωμένες διαφημίσεις. Αυτός ο κανόνας προσέλκυσε χρήστες και βοήθησε στην αύξηση του κοινού.
Είναι πολύ σημαντικό. Οι άνθρωποι έρχονται μόνο για αναζήτηση υψηλής ποιότητας. Όχι για να βρείτε μια σχετική αγγελία για ένα κατάστημα σιδηρικών, αλλά για να βρείτε ένα πραγματικό κατάστημα που χρειάζεται τώρα.
Μαξίμ Πολιάκοφ
Η εταιρεία έλαβε γρήγορα το πρώτο επενδύσεις. Η Google μπήκε στην πρώτη δεκάδα των πιο δημοφιλών πόρων Διαδικτύου στις αρχές του 2001 και ανέβηκε εύκολα στην πέμπτη γραμμή. Το 2004, το έργο έπαψε να είναι «γκαράζ» και βγήκε στο κοινό. Το 2006, η εταιρεία αγόρασε το YouTube και την εταιρεία που ανέπτυξε το λειτουργικό σύστημα Android. Αυτές οι εξαγορές επιτάχυναν την ανάπτυξη.
Τον Μάρτιο του 2006, η Google ανέβηκε στην πρώτη θέση μεταξύ όλων των πόρων του Διαδικτύου. Τον Νοέμβριο του 2009, έχασε για λίγο το πρωτάθλημα από τη Yahoo!, αλλά τον Ιανουάριο του 2010 ανέκτησε τη θέση του και εξακολουθεί να βρίσκεται στην πρώτη θέση.
Σήμερα, το Google για χρήστες είναι πολλές πλατφόρμες:
- Αλγόριθμος αναζήτησης.
- Υπηρεσία για διαφήμιση με βάση τα συμφραζόμενα.
- Πρόγραμμα περιήγησης.
- Λειτουργικό σύστημα για smartphone.
- Δεκάδες υπηρεσίες για απλούς χρήστες και επιχειρήσεις: αλληλογραφία, χάρτες, έγγραφα, υπολογιστικά φύλλα και πολλά άλλα.
Ένας σημαντικός λόγος για την επιτυχία της εταιρείας είναι εταιρική κουλτούρα.
Ο Μπριν και ο Πέιτζ, όταν επέλεξαν έναν νέο υπάλληλο, πρότειναν να πραγματοποιήσουν ένα πείραμα σκέψης: φανταστείτε ότι πρέπει να περάσετε έξι ώρες με αυτό το άτομο στο αεροδρόμιο, επειδή η πτήση καθυστέρησε. Πόσο άνετος θα είναι;
Με αυτόν τον τρόπο δημιούργησαν ένα περιβάλλον στο οποίο οι άνθρωποι ταιριάζουν μεταξύ τους. Ήταν απαραίτητο για την ανάπτυξη της εταιρείας και την εμφάνιση καινοτομιών.
Όλα αυτά οδήγησαν στο γεγονός ότι σήμερα μεταξύ όλων των αιτημάτων των χρηστών στις μηχανές αναζήτησης, η Google αντιστοιχεί στο 92,21%. Αυτό είναι ένα παγκόσμιο μονοπώλιο.
Τι είναι καλό για το "Yandex" - τον κύριο ανταγωνιστή της Google στη Ρωσία
Υπάρχουν μόνο δύο χώρες στις οποίες η Google έχει σοβαρούς ανταγωνιστές και η εταιρεία δεν μπορεί να κάνει τίποτα γι' αυτούς. Αυτή είναι η Κίνα - το 68,66% των αναζητήσεων υπάρχουν στην τοπική πύλη Baidu. Και η Ρωσία - έχουμε πάνω από το 45% των αιτημάτων που έλαβε η "Yandex".
Αυτή η μηχανή αναζήτησης δημιουργήθηκε από τους Ilya Segalovich και Arkady Volozh το 1997 - δηλαδή σχεδόν ταυτόχρονα με την Google. Σήμερα το Yandex είναι ο Νο. 1 ιστότοπος στη Ρωσία.
Όπως και η Google, είναι ένα σύστημα πλατφόρμας. Η πλατφόρμα συνδυάζει πολλές διαφορετικές υπηρεσίες που καλύπτουν τις διαφορετικές ανάγκες του πελάτη. Στην πρώτη θέση εδώ είναι επίσης μια μηχανή αναζήτησης αλγόριθμος. Είναι πολύ καλό, αλλά δεν είναι τόσο γνωστά για τον τρόπο λειτουργίας του όσο για τον αλγόριθμο της Google.
Πρόσφατα, λένε: "Δεν ξέρουμε πώς λειτουργεί καθόλου ο αλγόριθμός μας - αυτό είναι το Matrix Net, το νευρωνικό μας δίκτυο, λειτουργεί με αυτό και βελτιώνεται συνεχώς". Είναι γνωστό ότι λειτουργεί καλά, αλλά δεν ξέρουμε από τι αποτελείται.
Μαξίμ Πολιάκοφ
Εκτός από τη μηχανή αναζήτησης, η Yandex διαθέτει μια διαφημιστική πλατφόρμα και πρόγραμμα περιήγησης. Επιπλέον πρόσθετες υπηρεσίες: αλληλογραφία, χάρτες, δίσκος, αγορά και άλλα. Το μεγαλύτερο κέρδος σήμερα φέρνει το Yandex Taxi και οι υπηρεσίες παράδοσης.
Τι αλλάζει το ChatGPT στη σχέση μας με τις μηχανές αναζήτησης
Το 2023, δηλαδή, αυτή τη στιγμή, γίνεται άλλη μια επανάσταση. Η Google εξακολουθεί να είναι ο ηγέτης και για κάποιο χρονικό διάστημα θα παραμείνει στην πρώτη θέση, αλλά δεν ξέρουμε τι θα συμβεί στη συνέχεια.
Κάποια πράγματα έχουν αλλάξει το 2023. Εμφανίστηκε ένα νευρωνικό δίκτυο. Το ChatGPT έθεσε σε κίνηση μια τέτοια ακλόνητη βιομηχανία όπως η αναζήτηση και η διαφήμιση με βάση τα συμφραζόμενα.
Μαξίμ Πολιάκοφ
Τον Φεβρουάριο, Διευθύνων Σύμβουλος Microsoft Ο Satya Nadella, κατά τη διάρκεια ομιλίας του στο γραφείο της εταιρείας του, ανακοίνωσε ότι μια νέα εποχή ξεκίνησε. Σύμφωνα με τον ίδιο, ολόκληρη η ιστορία των τεχνολογιών Ιστού χωρίζεται σε τρία στάδια:
- Προσωπικός υπολογιστής + διακομιστής.
- Τεχνολογίες κινητής τηλεφωνίας + συστήματα αποθήκευσης cloud.
- Τεχνητή νοημοσύνη.
Βρισκόμαστε στην αρχή μιας νέας, τρίτης εποχής. Ακόμη και η ημερομηνία έναρξης είναι γνωστή - ο Satya Nadella το είπε στις 8 Φεβρουαρίου 2023.
ChatGPT απέκτησε ένα εκατομμύριο χρήστες σε 5 ημέρες. Αυτή είναι η ταχύτερη άνοδος στην ιστορία του Διαδικτύου. Ο προηγούμενος ηγέτης, το Instagram*, χρειάστηκε 75 ημέρες για να πετύχει το ίδιο αποτέλεσμα.
Το νευρωνικό δίκτυο είναι πλέον ενσωματωμένο στη μηχανή αναζήτησης Bing. Η ερώτηση στη γραμμή αναζήτησης ακούγεται ως εξής: "Ρωτήστε με οτιδήποτε" ή "Ρωτήστε με κάτι". Το ChatGPT απαντά σε σύνθετες ερωτήσεις και το κάνει λεπτομερώς. Επιπλέον, είναι σε θέση να αντιμετωπίσει εργασίες που είχαν χρησιμοποιηθεί προηγουμένως Δοκιμή Turing. Πριν από αυτό, πάντα βοηθούσε να ξεχωρίσει ένα άτομο από έναν αλγόριθμο μηχανής, αλλά τώρα όλα έχουν αλλάξει.
Ο Σεργκέι Μπριν επέστρεψε στην Google μετά από πέντε χρόνια διακοπών. Έπρεπε να επιστρέψει στη δουλειά επειδή η εμφάνιση νευρωνικών δικτύων στην εταιρεία κήρυξε κόκκινο συναγερμό. Η Google προσπαθεί να ενεργοποιηθεί βάρδος — δικό του chatbot. Πιστεύεται ότι οι παράμετροί του είναι πέντε φορές μεγαλύτερες από τις δυνατότητες του GPT. Αλλά αυτό το νευρωνικό δίκτυο δεν έχει ακόμη λειτουργήσει πλήρως.
Ο κόσμος έχει γυρίσει προς την αντίθετη κατεύθυνση, και ως παγκόσμιο μονοπώλιο, η Google πιθανότατα θα πάψει να υπάρχει. Ας δούμε όμως. Είναι πιθανά διάφορα σενάρια.
Μαξίμ Πολιάκοφ
*Δραστηριότητες της Meta Platforms Inc. και τα κοινωνικά του δίκτυα Facebook και Instagram απαγορεύονται στην επικράτεια της Ρωσικής Ομοσπονδίας.
Διαβάστε επίσης🧐
- 8 μηχανές αναζήτησης που είναι καλύτερες από την Google
- Πού μπορείτε να ενσωματώσετε το ChatGPT και γιατί: 5 επιλογές
- Τεχνολογική ιδιομορφία: είναι αλήθεια ότι η τεχνολογία θα ξεφύγει σύντομα από τον έλεγχό μας;