Μηχανές αναζήτησης – Η ιστορία της εξέλιξής τους

Vannevar Bush

Για να κατανοήσουμε όσο το δυνατόν καλύτερα τον τρόπο που λειτουργούν σήμερα  οι μηχανές αναζήτησης ,  θα πρέπει να πάμε αρκετά χρόνια πίσω στην ιστορία εντοπίζοντας σημαντικές ημερομηνίες – ορόσημο, να γνωρίσουμε σημαντικούς ανθρώπους όπου χάρη του οράματος τους , της ευφυΐας και της δουλειάς τους απολαμβάνουμε σήμερα αυτή την ποιότητα υπηρεσιών.

Δεν είναι εύκολο να το συνειδητοποιήσουμε αλλά μόλις πριν περίπου 20 χρόνια η μορφή του ιντερνέτ δεν είχε καμία σχέση με όπως το ξέρουμε στις μέρες μας.

Μια λίστα από links (συνδέσμους) τα οποία  συγκεντρώνονταν και συντηρούνταν χειροκίνητα από ανθρώπους.

Το να βρεις τις πληροφορίες που χρειαζόσουν ήταν μια πραγματικά δύσκολη διαδικασία η οποία συνήθως περιελάμβανε αμέτρητα κλικ σε link, ελπίζοντας ότι στο τέλος θα καταλήξουμε στο σωστό σημείο.

Ας γνωρίσουμε λοιπόν κάποιους ανθρώπους που άνοιξαν το δρόμο και δημιούργησαν μια νέα  προοπτική για εκατομμύρια χρήστες ανά τον κόσμο.

Μια προοπτική που έκανε  την πληροφορία και την γνώση προσβάσιμη από όλους , δημιούργησε νέες επιχειρήσεις και θέσεις εργασίας και πολλά ακόμα.

Πολλοί αποδίδουν την ιδέα του ίντερνετ στον μηχανικό Vannevar Bush ο οποίος το 1945 έγραψε ένα άρθρο με τίτλο « As We May Think », μέσα από το άρθρο αυτό ο Bush ώθησε τους κορυφαίους επιστήμονες της εποχής να δημιουργήσουν ένα – σχεδόν – απεριόριστο, γρήγορο, αξιόπιστο, επεκτάσιμο, συνειρμικό σύστημα ανάκτησης και αποθήκευσης μνήμης.

Vannevar Bush

O Bush είχε τη διορατικότητα να αντιληφθεί ότι η τεχνολογία αναπτυσσόταν ραγδαία και ότι μέσω της τεχνολογίας οι άνθρωποι θα έπρεπε να βρουν ένα τρόπο να καταγράφουν, να αποθηκεύουν και εν συνεχεία να έχουν εύκολη πρόσβαση στην ανάκτηση των πληροφοριών που συσσωρεύονταν και αποθηκεύονταν σε ένα τέτοιο σύστημα.Gerard Salton

Λίγο αργότερα το 1960,  ο Gerard Salton ο οποίος θεωρείται ο «πατέρας» της σύγχρονης τεχνολογίας αναζήτησης, συνέλαβε την ιδέα της «μηχανής αναζήτησης» και ανέπτυξε το πρωτοποριακό σύστημα για την εποχή με την ονομασία «SMART».Το SMART Information Retrieval System, όπως ήταν το πλήρες όνομα του συστήματος.

Τα αρχικά SMART προκύπτουν από την φράση :  System for the Mechanical Analysis and Retrieval of Text, ορισμένες πηγές αποδίδουν τη φράση ως : Salton’s Magic Automatic Retriever of Text.

Όποια και από τις δύο να θεωρήσουμε σωστή η ουσία δεν αλλάζει.

Ο Salton συνέγραψε ένα βιβλίο με τίτλο «A Theory of Indexing» στο οποίο αναφέρει ιδέες για τη χρήση στατιστικής στάθμισης , αλγόριθμων συνάφειας ενώ παράλληλα  παρουσιάζει και τα  αρχικά του τεστ , στα οποία βασίζεται η αναζήτηση – σε μεγάλο βαθμό – μέχρι και σήμερα.

Την ίδια περίπου περίοδο, ο Ted Nelson Αμερικανός πρωτοπόρος στην τεχνολογία της πληροφορίας, φιλόσοφος και κοινωνιολόγος, δημιουργεί ένα νέο project με την ονομασία «Xanadu».

Ted Nelson

Το Xanadu είχε ως στόχο να αποτελέσει ένα δίκτυο υπολογιστών , το οποίο θα αποθηκεύει και θα εμφανίζει έγγραφα, δίνοντας ταυτόχρονα και τη  δυνατότητα επεξεργασίας τους.

Ο Ted επινόησε τον όρο Hypertext (κείμενο που εμφανίζεται σε οθόνη υπολογιστή ή άλλες ηλεκτρονικές συσκευές με αναφορές (υπερσυνδέσεις) σε άλλο κείμενο στο οποίο ο αναγνώστης μπορεί να έχει άμεση πρόσβαση) και η δουλειά του αποτέλεσε σίγουρα ένα μεγάλο μέρος της έμπνευσης για τη δημιουργία του World Wide Web (από εδώ προκύπτει το γνωστό σε όλους μας www).

Στα τέλη της δεκαετίας του 1960, γεννήθηκε μια υπηρεσία με το όνομα «ARPANET» (Advanced Research Projects Agency Network) Η οποία ήταν κομμάτι του Αμερικανικού Υπουργείου Αμύνης.

ARPANET

Το ARPANET ήταν ένα δίκτυο υπολογιστών το οποίο επέτρεπε την μεταβίβαση πληροφοριών μεταξύ μακρινών αποστάσεων.

Για να το επιτύχουν αυτό , χρησιμοποιούσαν μισθωμένες τηλεφωνικές γραμμές για να μεταβιβάσουν στρατιωτικές πληροφορίες, όπως καλά αντιλαμβάνεστε ήταν ουσιαστικά η αρχή του ίντερνετ.

Παρακάτω μπορείτε να παρακολουθήσετε ένα μίνι ντοκιμαντέρ του 1972,  για το ARPANET.

Περνάνε σχεδόν 20 χρόνια από τη εμφάνιση  του ARPANET έως ότου έχουμε την πρώτη μηχανή αναζήτησης.

Τη δημιούργησε o Alan Emptage και ονομάστηκε «Archie» (από το Archives που σημαίνει αρχεία).

Η «Archie» είχε τη δυνατότητα να ανακτά αρχεία από μια βάση δεδομένων με το να ταιριάζει την ερώτηση του χρήστη χρησιμοποιώντας regular expressions

Η Archie δεν χρησιμοποιούσε λέξεις κλειδιά για να βρει σχετικά αρχεία όπως κάνουν οι σύγχρονες μηχανές αναζήτησης.

Μηχανές αναζήτησης

Για να χρησιμοποιήσεις την Archie αποτελεσματικά, θα έπρεπε να ξέρεις το όνομα του αρχείου που ψάχνεις,  καθώς η Archie δεν καταχωρούσε τα περιεχόμενα των αρχείων σε ευρετήριο αλλά  μόνο τους τίτλους.

Μέχρι το 1992 η Archie περιλάμβανε περίπου 2.6 εκατομμύρια αρχεία, καιη υπηρεσία του επεξεργαζόταν περίπου 50.000 ερωτήσεις κάθε μέρα, προερχόμενες από χιλιάδες χρήστες από όλο τον κόσμο.

Καθώς η δημοτικότητα του Archie μεγάλωνε, δύο παρόμοιες μηχανές αναζήτησης, οι Veronica και Jughead δημιουργήθηκαν, με στόχο την καταχώρηση σε ευρετήρια απλά αρχεία κειμένου.

Το 1991 ο Tim Berners – Lee δημιούργησε το World Wide Web βασισμένο στην ιδέα του Hypertext με σκοπό να διευκολύνει το διαμοιρασμό πληροφοριών και την ενημέρωση ερευνητών, τότε ήταν που δημιουργήθηκε και το πρώτο site στην ιστορία του World Wide Web το οποίο μπορείτε να επισκεφθείτε ακόμα και σήμερα από εδώ

Tim Berners - Lee

Φυσικά η απεικόνιση του δεν ήταν αυτή που είναι σήμερα στους σύγχρονους browser που χρησιμοποιούμε ( chrome, firefox, safari) αν θέλετε μπορείτε να  έχετε την πραγματική αίσθηση  του site με τον παλιό line-mode browser και πατήστε στο κουμπί Launch Line Mode Browser.

Το 1993 το πρώτο robot (bot ή spider) δημιουργήθηκε, ονομαζόταν World Wide Web Wanderer και ο σκοπός του ήταν να μετρήσει την ανάπτυξη του παγκόσμιου ιστού.

Στην πρώτη του αναβάθμιση κατέγραφε σε μια βάση δεδομένων , η οποία ονομαζόταν «WANDEX» , τα ενεργά URLs που έβρισκε.

Το Wanderer στην πορεία κατέληξε να δημιουργήσει μεγαλύτερα προβλήματα από αυτά που προσπαθούσε να επιλύσει με την εργασία που του είχε ανατεθεί.Επισκεπτόταν εκατοντάδες σελίδες μέσα στην ημέρα , όλη την ημέρα, με αποτέλεσμα να προκαλούνται προβλήματα στους σερβερ που φιλοξενούσαν τις σελίδες αυτές με αποτέλεσμα να “κρασάρουν”.

Μη ξεχνάμε ότι οι υποδομές όλου του ιστού ήταν σε πολύ πρώιμα στάδια, εύκολα μπορούσες να έρθεις αντιμέτωπος με τα όποια «όρια» υπήρχαν.

Σε απάντηση του «κακού» Wanderer, το οποίο «έριχνε» σερβερ και σελίδες, δημιουργήθηκε το «ALIWEB» Το οποίο σήμαινε :Αrchie – Like Indexing of the Web,  για να μην έχει την τύχη του Wanderer το ALIWEB επέτρεπε στους ιδιοκτήτες σελίδων να του τις υποβάλουν μαζί με την περιγραφή του ιστότοπου τους , για να τα ευρετηριάσει το ALIWEB, έτσι δεν χρειάζονταν πλέον κάποιο ρομπότ να ψάχνει μόνο του για δεδομένα και να επιβαρύνει το δίκτυο.

Το βασικό πρόβλημα ήταν ότι αρκετοί ιδιοκτήτες δε γνώριζαν ότι έπρεπε να υποβάλουν το site τους ή πώς πρέπει να το κάνουν.

Το δεύτερο μέρος του άρθρου μπορείτε να το διαβάσετε εδώ.

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *