Μηχανή αναζήτησης: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Χωρίς σύνοψη επεξεργασίας
Γραμμή 1:
Μια '''μηχανή αναζήτησης''' είναι μια εφαρμογή που επιτρέπει την αναζήτηση κειμένων και αρχείων στο [[Διαδίκτυο]]. Αποτελείται από ένα [[πρόγραμμα υπολογιστή]] που βρίσκεται σε έναν ή περισσότερους υπολογιστές στους οποίους δημιουργεί μια [[βάση δεδομένων]] με τις πληροφορίες που συλλέγει από το διαδίκτυο, και το [[διαδραστικό περιβάλλον]] που εμφανίζεται στον τελικό χρήστη ο οποίος χρησιμοποιεί την εφαρμογή από άλλον υπολογιστή συνδεμένοσυνδεδεμένο στο διαδίκτυο. Οι μηχανές αναζήτησης αποτελούνται από 3 είδη λογισμικού, το spider software, το index software και το query software.
 
== Ιστορικό ==
Στα τέλη της δεκαετίας του ΄80 ο κόσμος μόλις είχε αρχίσει να συνειδητοποιεί την επίδραση των προσωπικών υπολογιστών και να ακούει για ένα νέο δίκτυο υπολογιστών χωρίς όμως να μπορεί να φανταστεί το μέγεθος που θα έχει αυτό σήμερα και τις επιπτώσεις του στον ίδιο τον άνθρωπο.
 
Στις 10 Σεμπτεμβρίου του 1990 έγινε γνωστή η έννοια των μηχανών αναζήτησης στο διαδίκτυο. Οι φοιτητές Peter Deutsch, Alan Emtage και Bill Heelan του πανεπιστημίου Mc GillMcGill ανήγγειλαν στο [[Usenet]] τη λειτουργία του [[Archie]]. Το Archie ήταν ένα σύστημα καταγραφής των περισσοτέρων διακομιστών [[FTP]] που λειτουργούσαν, καθώς και των αρχείων που αυτοί περιλαμβάνανπεριλάμβαναν.
 
H Veronica, μια μηχανή αναζήτησης που δημιουργήθηκε το 1992 στο πανεπιστήμιο της Νεβάδα, όπως και το Jughead (1993), χρησίμευε για την αναζήτηση των περιεχομένων τίτλων σε διακομιστές που πρόσφεραν αρχεία υπό το πρωτόκολλο [[Gopher]].
Στη συνέχεια το 1991 δημιουργήθηκε από τους Mark McCahill, Farhad Anklesaria, Paul Lindner, Dan Torrey και Bob Alberti το πρωτόκολλο Gopher το οποίο χρησίμευε για την κατηγοριοποίηση και την παρουσίαση των εγγράφων ενός διακομιστή. Το πρωτόκολλο αυτό χρησιμοποιείται επίσης από τη Veronica μια μηχανή αναζήτησης που δημιουργήθηκε το 1992 στο πανεπιστήμιο της Νεβάδα και από τη μηχανή jughead.
 
Το 1995 έκανε την εμφάνιση του το [[Excite]] το οποίο είναι δημιούργημα έξι φοιτητών του πανεπιστημίου του Στάνφορντ. Επόμενοι σταθμοί εξέλιξης αποτελούν οι μηχανές [[Lykos]] και [[Altavista]] (1996). Η altavistaAltavista έμεινε γνωστή για τις αμείωτες επιδόσεις της στην καταλογογράφηση. Επίσης το 1998 οι φοιτητές Larry Page και Sergey Brin του πανεπιστημίου Στάνφορντ εφάρμοσαν ένα προηγμένο σύστημα αξιολόγησης των δικτυακών τόπων. Η μηχανή αναζήτησης που ανέπτυξαν είχε το όνομα [[Google]] και άλλαξε τη δικτυακή ζωή των χρηστών του ίντερνετ.
 
== Λειτουργία ==
Γραμμή 14:
Όλες οι μηχανές αναζήτησης παρόλο τη διαφορετικότητα τους έχουν κάποιες κοινές λειτουργίες.
 
# Οι μηχανές αναζήτησης δεν ερευνούν στηνσε πραγματικότηταπραγματικό χρόνο τον [[Παγκόσμιος Ιστός|παγκόσμιο ιστό]] αλλά μία [[βάση δεδομένων]] που περιέχει κάποια αντίγραφα ιστοσελίδων. Οι ιστοσελίδες αυτές επιλέγονται ανάμεσα σε δισεκατομμύρια σελίδες στο ίντερνετ. Για την έρευνα αυτή χρησιμοποιούνται κάποια προγράμματα που ονομάζονται «ρομπότ» ή «αράχνες» (spider, crawler ή webcrawler). Τα προγράμματα αυτά «σερφάρουν» στο Διαδίκτυο σε διάφορες ιστοσελίδες με σκοπό τη συλλογή πληροφοριών με βάση κάποια κριτήρια. Η λειτουργία αυτή πρέπει να γίνεται συνεχώς διότι οι ιστοσελίδες αλλάζουν και η βάση της μηχανής θα πρέπει να ανανεώνονται με νέες πληροφορίες. Μια μηχανή αναζήτησης μπορεί να διαθέτει περισσότερα από ένα «ρομπότ».
# Αφού τα «ρομπότ» βρουν τις ιστοσελίδες τις περνούν σε ένα άλλο πρόγραμμα για τοποθέτηση δεικτών. Με το πρόγραμμα αυτό αναγνωρίζεται το κείμενο, οι σύνδεσμοι, και το υπόλοιπο περιεχόμενο της ιστοσελίδας και αποθηκεύεται στα αρχεία της βάσης δεδομένων. Αφού γίνει αυτή η αποθήκευση θα μπορεί να πραγματοποιηθεί αναζήτηση πάνω στη βάση της μηχανής αναζήτησης.
# Μία ακόμα λειτουργία των μηχανών αναζήτησης είναι ότι επιτρέπουν στους χρήστες να «ψάχνουν» στη βάση δεδομένων τους μέσα από περιβάλλον που παρέχει πολλαπλές δυνατότητες αναζήτησης. Η λειτουργία αυτή έχει σχέση με αυτό που αντιμετωπίζουν οι χρήστες μέσα από το περιβάλλον της μηχανής αναζήτησης.
Γραμμή 24:
 
 
== Εμπορική Εφαρμογήεφαρμογή ==
Οι μηχανές αναζήτησης χρησιμοποιούνται πολύ από το αγοραστικό κοινό παγκοσμίως με αποτέλεσμα να αποτελούν ένα σημαντικό μέρος στην [[κατανάλωση]] και την [[διαφήμιση]]. Στις [[Ηνωμένες Πολιτείες]] και στην [[Βρετανία]] το συνολικό κόστος διαφήμισης στο [[διαδίκτυο]] ξεπέρασε το συνολικό κόστος διαφήμισης στο [[ραδιόφωνο]] το 2006.
 
Γραμμή 34:
Το μερίδιο αγοράς της Google κορυφώθηκε στο 86.3% τον Απρίλιο 2010.<ref>{{cite web|url=http://marketshare.hitslink.com/report.aspx?qprid=5&qpcustom=Google%20-%20Global&qptimeframe=M&qpsp=120&qpnp=25 |title=Net Market share - Google |publisher=Marketshare.hitslink.com |date= |accessdate=2012-05-14}}</ref> Οι [[Yahoo!]], [[Bing]] και άλλες είναι περισσότερο δημοφιλείς στις ΗΠΑ παρά στην Ευρώπη.
 
== ΑντικειμενικότηταΑποτελεσματικότητα μηχανών αναζήτησης ==
 
Οι μηχανές αναζήτησης δεν καλύπτουν το σύνολο του web. Ακόμα και αν η έρευνα γίνεται διαδοχικά με τις μεγαλύτερες και πιο δημοφιλείς μηχανές αναζήτησης δεν θα ανακτηθούν όλες οι σελίδες που υπάρχουν στο web. Πολλές ιστοσελίδες ευρετηριάζονται από πολλές μηχανές αναζήτησης ενώ άλλες από μία ή και καμία μηχανή. Επιπλέον κάποιες μηχανές δεν μπορούν να βρουν ιστοσελίδες που είναι σε άλλη γλώσσα εκτός από την αγγλική. {{πηγή|Σύμφωνα με κάποιες μελέτες η μεγαλύτερη μηχανή αναζήτησης καλύπτει το 25 % του συνόλου του web ενώ συνολικά όλες οι μηχανές το 90% περίπου.|Ποιες μελέτες; Η μεγαλύτερη μηχανή είναι η google.}}
 
Επιπρόσθετα οι μηχανές αναζήτησης δεν ευρετηριάζουν όλα τα τεκμήρια που διατίθενται στο web. Για παράδειγμα δεν μπορούν να ευρετηριάσουν αρχεία που είναι προστατευμένα με κωδικούς και επίσης πολλά αρχεία μπορεί να αποκλειστούν λόγω της χρήσης ειδικού λογισμικού από το server που τα φιλοξενεί. Ακόμα, οικάποιες από τις μηχανές συνήθως δεν περιλαμβάνουν τα πιο πρόσφατα αναρτημένα στο ιντερνέτ τεκμήρια.
 
Σύμφωνα με τα κριτήρια της αντικειμενικότητας μιας ιστοσελίδας (να μην διατίθεται η πληροφορία δημόσια, να παρουσιάζεται η πληροφορία χωρίς να υπάρχουν διαφημίσεις, αν υπάρχουν διαφημίσεις στη σελίδα να είναι ξεκάθαρα διαχωρισμένες από το πληροφοριακό περιεχόμενο) παρατηρούμε ότι οι ιστοσελίδες που μας παρέχουν οι μηχανές αναζήτησης δεν πληρούν αυτά τα κριτήρια. Συνεπώς μας παρέχουν πληροφορίες που δεν είναι και τόσο αντικειμενικές.
 
== Υποσημειώσεις ==