Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Χωρίς σύνοψη επεξεργασίας
Divineale (συζήτηση | συνεισφορές)
μΧωρίς σύνοψη επεξεργασίας
Γραμμή 9:
 
Το πρότυπο Unicode είχε τον ρητό στόχο να ξεπεράσει τους περιορισμούς των παλαιότερων ("παραδοσιακών") προτύπων για [[κωδικοποίηση χαρακτήρων]] όπως για παράδειγμα το [[ISO 8859]] πρότυπο, το οποίο χρησιμοποιήθηκε ευρέως σε πολλές χώρες στον κόσμο, αλλά παρουσίαζε προβλήματα ασυμβατότητας μεταξύ των διαφορετικών υλοποιήσεών του.
Γενικά, πολλά παλαιότερα πρότυπα για [[κωδικοποίηση χαρακτήρων]] μοιράζονται ένα κοινό πρόβλημα: το ότι επιτρέπουν υποστήριξη μονο δύο αλφαβήτων σε ενα συγκεκριμένο υπολογιστή, συνήθως του Λατινικού και ενός τοπικού, δηλαδή δεν υποστηρίζουν πολλά αλφάβητα στον ίδιο υπολογιστή. Για παράδειγμα, οσον αφορά το πρότυπο ISO 8859, εναςένας υπολογιστής στην Ελλάδα ειναι (συνήθως) ρυθμισμένος να υποστηρίζει μονο το Λατινικό και το Ελληνικό αλφάβητο για κείμενο κωδικοποιημένο κατακατά ISO 8859. Έτσι, η ανάγνωση κειμένου (κωδικοποιημένου κατακατά ISO 8859) που περιέχει κάποιο αλλοάλλο αλφάβητο (οπωςόπως για παράδειγμα Ρώσικο, Εβραϊκό κλπ) θα ειναιείναι προβληματική σε Ελληνικό υπολογιστή, αφού οι (Ρωσικοί, Εβραϊκοί κλπ) χαρακτήρες δεν θα εμφανίζονται σωστά. Αυτό συμβαίνει για το πρότυπο ISO 8859 χρησιμοποιεί μόνο 8 bit για να κωδικοποιήσει κάθε χαρακτήρα (δηλαδή, συνολικά μπορούμε να αναπαραστήσουμε μονο 256 διαφορετικούς χαρακτήρες). Οι πρώτες 128 θέσεις δεσμέυονταιδεσμεύονται για το Λατινικό αλφάβητο και μερικά σύμβολα, ενώ οι υπόλοιπες 128 για το τοπικό μη-Λατινογενές αλφάβητο (όποιο και αν είναι αυτό Ελληνικό, Ρώσικο, Εβραϊκό κλπ). ΕτσιΈτσι πρακτικά, οι χαρακτήρες των μη-λατινογενών αλφάβητων "μοιράζονται" τις ίδιες θέσεις με τους χαρακτήρες κάποιου άλλου μη-λατινογενούς αλφαβήτου, και άρα δεν μπορούν να υποστηρίζονται ταυτόχρονα απο το σύστημα (δεν ειναιείναι δυνατόν μια θεσηθέση να αντιστοιχεί σε πανωπάνω αποαπό έναν χαρακτήρες).
 
Το Unicode κωδικοποιεί οποιονδήποτε χαρακτήρα προμηθεύοντας ένα μοναδικό κωδικό σημείο ("θέση") σε καθέναν τους, χρησιμοποιώντας εως και 16 bit ανα χαρακτήρα το οποίο εξασφαλίζει οτι όλοι οι χαρακτήρες μπορούν να υποστηρίζονται από όλα τα υπολογιστικά συστήματα. Το unicode δεν κωδικοποιεί συγκεκριμένες μορφές που αυτοί μπορούν να πάρουν σε διάφορες γραμματοσειρές. Με άλλα λόγια το πρότυπο Unicode αφήνει το ανάλογο λογισμικό ([[Web browser|πλοηγός Διαδικτύου]], [[επεξεργαστής κειμένου]]) να "αποφασίσει" αυτό την οπτική αναπαράσταση (στυλ, μέγεθος, γραμματοσειρά) των χαρακτήρων.
 
Επίσης στο πρότυπο περιλαμβάνει και σχετικά θέματα όπως ιδιότητες χαρακτήρων, φόρμες κανονικοποίησης κειμένου,κατεύθυνση εμφάνισης(για γλώσσες που διαβάζονται και από τα δεξιά προς τα αριστερά όπως η [[Αραβική γλώσσα]] και τα [[Εβραϊκή γλώσσα|Εβραϊκά]].
 
== Αλφάβητα που περιλαμβάνονται ==!
 
Το Unicode περιλαμβάνει σχεδόν όλα τα συστήματα γραφής που είναι σε χρήση σήμερα.
Γραμμή 65:
</table>
 
Το Unicode έχει προσθέσει και άλλα αλφάβητα όπως ιστορικά αλφάβητα και εξαφανισμένα αλφάβητα για ακαδημαϊκούς λόγους:
αλφάβητα για ακαδημαϊκούς λόγους:
 
<table border=0 width="90%">
Γραμμή 81 ⟶ 80 :
</table>
 
Επίσης περιλαμβάνει και άλλα σύμβολα που χρησιμοποιούνται στα [[μαθηματικά]] και την [[μουσική]].
στα [[μαθηματικά]] και την [[μουσική]].
 
=== Διάφορα ===
 
Το [[1997]] [[Michael Everson]] πρότεινε να κωδικοποιηθούν και οι χαρακτήρες της φανταστικής [[Κλίνγκον γλώσσα]]ς στο Επίπεδο 1 του [[ISO 10646|ISO/IEC 10646-2]]. Αλλά η πρόταση αυτή απορρίφθηκε όπως και η πρόταση για συμπερίληψη γλωσσών του [[Τόλκιν]].
της φανταστικής [[Κλίνγκον γλώσσα]]ς στο Επίπεδο 1 του
[[ISO 10646|ISO/IEC 10646-2]]. Αλλά η πρόταση αυτή απορρίφθηκε όπως και η πρόταση
για συμπερίληψη γλωσσών του [[Τόλκιν]].
 
== Κωδικοποιήσεις ==
Γραμμή 95 ⟶ 90 :
=== Πρότυπα ===
 
Η κοινοπραξία Unicode με έδρα την [[california|Καλιφόρνια]], αναπτύσσει το πρότυπο Unicode. Οποιαδήποτε οργάνωση ή ιδιώτης μπορεί να γίνει μέλος της εφόσον πληρώσει συνδρομή.
Στα μέλη συμπεριλαμβάνονται σχεδόν όλες τις μεγάλες εταιρείες λογισμικού και υλικού που ενδιαφέρονται σχετικά όπως οι [[Apple]], [[Microsoft]], [[International Business Machines|IBM]], [[Xerox]], [[Hewlett-Packard|HP]], [[Adobe Systems]] και πολλές άλλες.
αναπτύσσει το πρότυπο Unicode. Οποιαδήποτε οργάνωση
ή ιδιώτης μπορεί να γίνει μέλος της εφόσον πληρώσει συνδρομή.
Στα μέλη συμπεριλαμβάνονται σχεδόν όλες τις μεγάλες εταιρείες
λογισμικού και υλικού που ενδιαφέρονται σχετικά όπως οι [[Apple]], [[Microsoft]], [[International Business Machines|IBM]], [[Xerox]], [[Hewlett-Packard|HP]], [[Adobe Systems]] και πολλές άλλες.
 
Η κοινοπραξία δημοσίευσε πρώτη φορά ''Το πρότυπο Unicode'' (ISBN 0-321-18578-1) το [[1991]],και συνεχίζει να αναπτύσσει πρότυπα βασισμένα στην αρχική αυτή εργασία. Η κοινοπραξία Unicode αναπτύχθηκε σε συνδυασμό με τον [[ISO|Διεθνή Οργανισμό Τυποποίησης ISO]], και το πρότυπό της μοιράζεται το σύνολο χαρακτήρων της με το πρότυπο[[ISO/IEC 10646]].
Το Unicode και το ISO/IEC 10646 είναι ισοδύναμα ως κωδικοποιήσεις χαρακτήρων αλλά το Unicode περιέχει πολύ περισσότερες πληροφορίες για προγραμματιστές που το υλοποιούν, καλύπτοντας σε βάθος θέματα όπως κωδικοποίηση βασισμένη σε μπιτ, [[Unicode collation αλγόριθμοι]], και γραφική απόδοση. Το Unicode απαριθμεί αρκετές ιδιότητες χαρακτήρων, περιλαμβάνοντας και αυτές που χρειάζονται για [[BiDi]] υποστήριξη. Τα δυο πρότυπα χρησιμοποιούν μερικώς διαφορετική ορολογία.
βασισμένα στην αρχική αυτή εργασία. Η κοινοπραξία Unicode αναπτύχθηκε
σε συνδυασμό με τον [[ISO|Διεθνή Οργανισμό Τυποποίησης ISO]],και
το πρότυπό της μοιράζεται το σύνολο χαρακτήρων της με το πρότυπο[[ISO/IEC 10646]].
Το Unicode και το ISO/IEC 10646 είναι ισοδύναμα ως κωδικοποιήσεις
χαρακτήρων αλλά το Unicode περιέχει πολύ περισσότερες πληροφορίες
για προγραμματιστές που το υλοποιούν, καλύπτοντας σε βάθος
θέματα όπως κωδικοποίηση βασισμένη σε μπιτ, [[Unicode collation αλγόριθμοι]], και γραφική απόδοση. Το Unicode απαριθμεί
αρκετές ιδιότητες χαρακτήρων, περιλαμβάνοντας και αυτές που χρειάζονται για [[BiDi]] υποστήριξη. Τα δυο πρότυπα χρησιμοποιούν
μερικώς διαφορετική ορολογία.
 
<!-- Template:Uplusfirst links to this paragraph -->
<div id="Upluslink">
Όταν γράφουμε για κωδικά σημεία του Unicode είναι σύνηθες να χρησιμοποιούμε τη μορφή U+xxxx or U+xxxxxx όπου xxxx ή xxxxxx είναι το κωδικό σημείο στο [[δεκαεξαδικό σύστημα]].
χρησιμοποιούμε τη μορφή U+xxxx or U+xxxxxx όπου xxxx ή xxxxxx
είναι το κωδικό σημείο στο [[δεκαεξαδικό σύστημα]]
</div>
 
==== Unicode ιστορίκοιστορικό αναθεωρήσεων ====
 
* [[1991]] Unicode 1.0
Γραμμή 133 ⟶ 115 :
=== Αποθήκευση μεταφορά και επεξεργασία ===
 
Μέχρι τώρα το Unicode παρουσιάστηκε απλά ως μια απεικόνιση κάθε χαρακτήρα που χρησιμοποιείται σε κάποιο αλφάβητο στη Γη σε έναν μοναδικό αριθμό, το κωδικό σημείο. Όμως η αποθήκευση αυτών των αριθμών κατά την επεξεργασία κειμένου είναι ένα εντελώς διαφορετικό θέμα.
Προβλήματα ανακύπτουν από το γεγονός ότι το [[λογισμικό]] που γράφεται στον δυτικό κόσμο χειρίζεται μόνο κωδικοποιήσεις 8-bit με την unicode υποστήριξη να προστίθεται πολύ αργότερα.
χαρακτήρα που χρησιμοποιείται σε κάποιο αλφάβητο στη Γη σε έναν
μοναδικό αριθμό, το κωδικό σημείο. Όμως η αποθήκευση αυτών των
αριθμών κατά την επεξεργασία κειμένου είναι ένα εντελώς διαφορετικό θέμα.
Προβλήματα ανακύπτουν από το γεγονός ότι το [[λογισμικό]] που
γράφεται στον δυτικό κόσμο χειρίζεται μόνο κωδικοποιήσεις 8-bit
με την unicode υποστήριξη να προστίθεται πολύ αργότερα.
 
Η εσωτερική λογική παραδοσιακών 8-μπιτ εφαρμογών επιτρέπει μόνο 8 μπιτς για κάθε χαρακτήρα κάνοντας αδύνατη τη χρησιμοποίηση περισσότερων των 256 κωδικών σημείων χωρίς ειδική επεξεργασία.
Έτσι οι [[προγραμματιστής|μηχανικοί λογισμικού]] έχουν προτείνει διάφορους μηχανισμούς για την υλοποίηση του Unicode. Ποια υλοποίηση χρησιμοποιεί ο κάθε προγραμματιστής από θέματα χωρητικότητας, συμβατότητας [[πηγαίος κώδικας|πηγαίου κώδικα]] και διαλειτουργικότητας με άλλα συστήματα.
για κάθε χαρακτήρα κάνοντας αδύνατη τη χρησιμοποίηση περισσότερων
των 256 κωδικών σημείων χωρίς ειδική επεξεργασία.
Έτσι οι [[προγραμματιστής|μηχανικοί λογισμικού]] έχουν προτείνει
διάφορους μηχανισμούς για την υλοποίηση του Unicode. Ποια υλοποίηση
χρησιμοποιεί ο κάθε προγραμματιστής από θέματα χωρητικότητας, συμβατότητας
[[πηγαίος κώδικας|πηγαίου κώδικα]] και διαλειτουργικότητας
με άλλα συστήματα.
 
Το Unicode ορίζει δύο τρόπους απεικόνισης:
Γραμμή 163 ⟶ 134 :
(Ο αριθμός υποδηλώνει τον αριθμό των μπιτς σε κάθε μονάδα (για UTF κωδικοποιήσεις) ή byter ανά μονάδα (για UCS κωδικοποιήσεις).)
 
<!--In UTF-32 or UCS-4, one unit suffices for any character; in the other cases, each character may use a variable number of units. UTF-8 provides the ''[[de facto]]'' standard encoding for interchange of Unicode text with UTF-16. UTF-32 occurs mainly in internal processing.
 
The UCS-2 and UTF-16 encodings specify the Unicode [[Byte Order Mark|byte order mark]] (BOM) for use at the beginnings of text files. Some software developers have adopted it for other encodings, including UTF-8, which does not need an indication of byte order. In this case it attempts to mark the file as containing Unicode text. The BOM, code point <code>U+FEFF</code>, has the important property of unambiguity, regardless of the Unicode encoding used. The units <code>FE</code> and <code>FF</code> never appear in [[UTF-8]]; <code>U+FFFE</code> (the result of byte-swapping <code>U+FEFF</code>) does not equate to a legal character, and <code>U+FEFF</code> conveys the Zero-Width No-Break Space (a character with no appearance and no effect other than preventing the formation of [[ligature (typography)|ligatures]]). The same character converted to UTF-8 becomes the byte sequence <code>EF BB BF</code>.
 
{{See also|Mapping of Unicode characters}}-->
 
=== Έτοιμοι και σύνθετοι χαρακτήρες ===
Το Unicode περιλαμβάνει ένα μηχανισμό τροποποίησης του σχήματος των χαρακτήρων κι έτσι επεκτείνει το ρεπερτόριο των υποστηριζόμενων [[Γλύφος|γλυφών]]. Αυτό καλύπτει τη χρήση συνδυαζόμενων διακριτικών χαρακτήρων. Αυτοί εισάγονται μετά τον κύριο χαρακτήρα (μπορεί κανείς να σωρρεύσει περισσότερους συνδυαζόμενους διακριτικούς χαρακτήρες στον ίδιο χαρακτήρα). Ωστόσο, για λόγους συμβατότητας, το Unicode περιλαμβάνει επίσης μια μεγάλη ποσότητα από προσυντεθιμένους χαρακτήρες. Έτσι, σε πολλές περιπτώσεις, οι χρήστες έχουν στη διάθεσή τους πολλούς τρόπους κωδικοποίησης του ίδιου χαρακτήρα. Για να το αντιμετωπίσει αυτό, το Unicode παρέχει τον μηχανισμό των μετασχηματισμών κανονικής ισοδυναμίας.
Παρόμοια κατάσταση ισχύει και με το Hangul. Το Unicode παρέχει τον μηχανισμό σύνθεσης συλλαβών Hangul με το Hangul Jamo. Ωστόσο, παρέχει επίσης προσυντεθιμένες συλλαβές Hangul (11,171 συλλαβές)
 
Τα ιδεογράμματα CJK (Κίνα, Ιαπωνία, Κορέα) έχουν επί του παρόντος κώδικες μόνο για την προσυντεθιμένη μορφή τους. Ακόμα όμως, τα περισσότερα από αυτά τα ιδεογραφήματα τελικώς αποτελούνται από απλούστερα στοιχεία, έτσι, κατ' αρχήν το Unicode μπορεί να τα αποσυνθέσει όπως συμβαίνει με τα Hangul. Αυτό θα μείωνε σε μεγάλο βαθμό τον αριθμό των απαιτούμενων κωδικών σημείων, ενώ ταυτόχρονα επιτρέπει την εμφάνιση στην πραγματικότητα κάθε νοητού ιδεογραφήματος (καταργώντας έτσι τα προβλήματα της Han unification) Μια παρόμοια ιδέα καλύπτει ορισμένες μεθόδους εισαγωγής όπως η μέθοδος Cangjie και Wubi. Ωστόσο, οι προσπάθειες να γίνει αυτό για κωδικοποίηση χαρακτήρων σκόνταψαν πάνω στο γεγονός ότι τα ιδεογραφήματα δεν αποσυντίθενται τόσο απλά ή τόσο κανονικά όσο δείχνουν.
 
Οι συνδυαζόμενοι χαρακτήρες, όπως η περίπλοκη μορφοποίηση του script που απαιτείται για να αποδώσει κανείς σωστά ένα Αραβικό κείμενο και πολλά άλλα scripts, συχνά εξαρτώνται από περίπλοκες τεχνολογίες γραμματοσειρών, όπως η Open Type (από την Adobe και τη Microsoft), την Graphite (από την SIL International) και την Apple Advanced Typography AAT (από την Apple Computer), μέσω της οποίας ο σχεδιαστής γραμματοσειράς περιλαμβάνει οδηγίες σε ένα λογισμικό δημιουργίας γραμματοσειρών για το πως θα παράγει διαφορετικές σειρές χαρακτήρων. Μια άλλη μέθοδος που χρησιμοποιείται σε γραμματοσειρές με σταθερό πλάτος είναι να τοποθετείται το σύμβολο του συνδυαζόμενου χαρακτήρα πριν τα δεξιά του (sidebearing). Αυτή η μέθοδος, ωστόσο, λειτουργεί μόνο για ορισμένα διακριτικά και η σώρρευση δεν θα γίνει σωστά.
 
Μέχρι και το 2004, τα περισότερα λογισμικά ακόμα δεν μπορούσαν να χειριστούν αξιόπιστα πολλά χαρακτηριστικά που δεν υποστηρίζονταν από παλαιότερες τυποποιήσεις γραμματοσειρών, έτσι το να συνδυαζείσυνδυάζει κανείς χαρακτήρες, γενικώς δεν λειτουργούσε σωστά. Υποθετικά, το {{unicode|ḗ}} (προσυντεθιμένο e με περισπωμένη και οξεία) και το {{unicode|ḗ}} (e που ακολουθείται από συνδυαζόμενη περισπωμένη επάνω και συνδυαζόμενη οξεία επάνω) είναι πανομοιότυπα στην εμφάνιση, δίνοντας και τα δύο ένα e με περισπωμένη και οξεία, αλλά η εμφάνιση μπορεί να διαφοροποιείται σε μεγάλο βαθμό κατά την εφαρμογή εφαρμογών λογισμικού.
 
Επίσης, οι κάτω τελείες, οι οποίες χρειάζονται στα Ινδικά [[Romanization]], συχνά θα τοποθετούνται λανθασμένα ή ακόμα χειρότερα.
Γραμμή 188 ⟶ 159 :
=== Λειτουργικά συστήματα ===
 
Παρά τα τεχνικά προβλήματα τους περιορισμούς και την κριτική στη πορεία, το Unicode έχει επικρατήσει ως το κυρίαρχο σχήμα κωδικοποίησης χαρακτήρων.
Τα [[Windows NT]] και οι απόγονοί του [[Windows 2000]] και [[Windows XP]] κάνουν εκτεταμένη χρήση του σχήματος κωδικοποίησης [[UTF-16]] για εσωτερική αναπαράσταση κειμένου. UNIX λειτουργικά συστήματα όπως [[Linux|GNU/Linux]], [[Plan 9|Plan 9 από Bell Labs]], [[Berkeley Software Distribution|BSD]] και [[Mac OS X]] έχουν υιοθετήσει το σχήμα [[UTF-8]], ως τη βάση για την αναπαράσταση [[πολυγλωσσικό κείμενο]].
κριτική στη πορεία, το Unicode έχει επικρατήσει ως
το κυρίαρχο σχήμα κωδικοποίησης χαρακτήρων.
Τα [[Windows NT]] και οι απόγονοί του [[Windows 2000]] και [[Windows XP]] κάνουν εκτεταμένη χρήση του σχήματος
κωδικοποίησης [[UTF-16]] για εσωτερική αναπαράσταση κειμένου. UNIX λειτουργικά συστήματα όπως [[Linux|GNU/Linux]], [[Plan 9|Plan 9 από Bell Labs]], [[Berkeley Software Distribution|BSD]] και [[Mac OS X]] έχουν υιοθετήσει το σχήμα [[UTF-8]], ως τη βάση για την αναπαράσταση [[πολυγλωσσικό κείμενο]].
 
=== Ηλεκτρονική αλληλογραφία ===
 
Το πρότυπο [[MIME]] ορίζει δύο διαφορετικούς μηχανισμούς για κωδικοποίηση όχι-ASCII χαρακτήρων στα [[Ηλεκτρονική αλληλογραφία|μηνύματα ηλεκτρονικής αλληλογραφίας,e-mails]], ανάλογα με το αν οι χαρακτήρες είναι στις επικεφαλίδες του ηλ.μηνύματος όπως πχ η επικεφαλίδα "Θέμα:" ή βρίσκονται στο κυρίος κείμενο του ηλεκτρονικού μηνύματος. Και στις δυο περιπτώσεις, προσδιορίζεται το αρχικό σύνολο χαρακτήρων καθώς και η κωδικοποίηση μεταφοράς. Για ηλεκτρονική αλληλογραφία με Unicode χαρακτήρες προτείνονται το σχήμα κωδικοποίησης UTF-8 και η κωδικοποίηση μεταφοράς [[Base64]]. Οι λεπτομέρειες των δύο μηχανισμών καθορίζονται στο πρότυπο MIME και γενικά είναι κρυμμένοι από τον απλό χρήστη λογισμικού
Το πρότυπο [[MIME]] ορίζει δύο διαφορετικούς μηχανισμούς
για κωδικοποίηση όχι-ASCII χαρακτήρων στα [[Ηλεκτρονική αλληλογραφία|μηνύματα ηλεκτρονικής αλληλογραφίας,e-mails]],
ανάλογα με το αν οι χαρακτήρες είναι στις επικεφαλίδες του
ηλ.μηνύματος όπως πχ η επικεφαλίδα
"Θέμα:" ή βρίσκονται στο κυρίος κείμενο του ηλεκτρονικού μηνύματος.
Και στις δυο περιπτώσεις, προσδιορίζεται το αρχικό σύνολο χαρακτήρων
καθώς και η κωδικοποίηση μεταφοράς. Για ηλεκτρονική αλληλογραφία
με Unicode χαρακτήρες προτείνονται το σχήμα κωδικοποίησης UTF-8
και η κωδικοποίηση μεταφοράς [[Base64]].
Οι λεπτομέρειες των δύο μηχανισμών καθορίζονται στο πρότυπο MIME
και γενικά είναι κρυμμένοι από τον απλό χρήστη λογισμικού
ηλ. αλληλογραφίας.
 
Η υιοθέτηση του Unicode στην [[Ηλεκτρονική αλληλογραφία]] είναι πολύ αργή. Τα περισσότερα κείμενα στην ανατολική Ασία κωδικοποιούνται άκομα σε τοπικές κωδικοποιήσεις όπως η [[Shift-JIS]], και πολλά δημοφιλή προγράμματα ηλ.αλληλογραφίας ακόμα και αν έχουν κάποια unicode υποστήριξη εντούτοις δεν μπορούν να χειριστούν Unicode δεδομένα σωστά. Η κατάσταση αυτή δεν προβλέπεται να αλλάξει το προσεχές μέλλον.
Η υιοθέτηση του Unicode στην [[Ηλεκτρονική αλληλογραφία]]
είναι πολύ αργή. Τα περισσότερα κείμενα στην ανατολική Ασία
κωδικοποιούνται άκομα σε τοπικές κωδικοποιήσεις όπως η
[[Shift-JIS]], και πολλά δημοφιλή προγράμματα ηλ.αλληλογραφίας
ακόμα και αν έχουν κάποια unicode υποστήριξη εντούτοις
δεν μπορούν να χειριστούν Unicode δεδομένα σωστά. Η κατάσταση
αυτή δεν προβλέπεται να αλλάξει το προσεχές μέλλον.
 
=== Διαδίκτυο ===
 
Οι καινούργιοι πλοηγοί διαδικτύου μπορούν και απεικονίζουν σωστά ιστοσελίδες με Unicode χαρακτήρες εφόσον έχει εγκατασταθεί η ανάλογη [[γραμματοσειρά]].
σωστά ιστοσελίδες με Unicode χαρακτήρες εφόσον έχει εγκατασταθεί
η ανάλογη [[γραμματοσειρά]].
 
Παρόλο που συντακτικοί κανόνες μπορεί να επηρεάζουν τη σειρά με την οποία οι χαρακτήρες επιτρέπεται να εμφανίζονται και η γλώσσα HTML 4.0 αλλά και η XML 1.0 εξ ορισμού υποστηρίζουν έγγραφα που αποτελούνται από χαρακτήρες από όλο το εύρος των κωδικών σημείων του Unicode εξαιρουμένων μόνο κάποιων χαρακτήρων ελέγχου τα μόνιμα μη-διαθέσιμα κωδικά σημεία D800-DFFF, οποιοδήποτε κωδικό σημείο που τελειώνει σε FFFE or FFFF και οποιοδήποτε κωδικό σημείο πάνω από 10FFFF. Αυτοί οι χαρακτήρες παρουσιάζονται είτε απευθείας ως μπάιτς σύμφωνα με την κωδικοποίηση του εγγράφου,εφόσον υποστηρίζονται από την κωδικοποίηση,ή μπορούν να γραφτούν ως αριθμητικές αναφορές χαρακτήρων βασισμένες στο κωδικό σημείο του Unicode χαρακτήρα, εφόσον η κωδικοποίηση που χρησιμοποιεί το έγγραφο επιτρέπει τα ψηφία και τα σύμβολα που χρειάζονται για να γράψουμε τις αναφορές (κάτι που συμβαίνει με όλες τις κωδικοποιήσεις που έχουν υιοθετηθεί στο διαδίκτυο)
Παρόλο που συντακτικοί κανόνες μπορεί να επηρεάζουν τη
σειρά με την οποία οι χαρακτήρες επιτρέπεται να εμφανίζονται
και η γλώσσα HTML 4.0 αλλά και η XML 1.0 εξ'ορισμού υποστηρίζουν
έγγραφα που αποτελούνται από χαρακτήρες από όλο το εύρος των
κωδικών σημείων του Unicode εξαιρουμένων μόνο κάποιων χαρακτήρων
ελέγχου τα μόνιμα μη-διαθέσιμα κωδικά σημεία D800-DFFF,
οποιοδήποτε κωδικό σημείο που τελειώνει σε FFFE or FFFF
και οποιοδήποτε κωδικό σημείο πάνω από 10FFFF.
Αυτοί οι χαρακτήρες παρουσιάζονται είτε απευθείας ως μπάιτς
σύμφωνα με την κωδικοποίηση του εγγράφου,εφόσον υποστηρίζονται
από την κωδικοποίηση,ή μπορούν να γραφτούν ως αριθμητικές
αναφορές χαρακτήρων βασισμένες στο κωδικό σημείο του Unicode
χαρακτήρα,εφόσον η κωδικοποίηση που χρησιμοποιεί το έγγραφο
επιτρέπει τα ψηφία και τα σύμβολα που χρειάζονται για να
γράψουμε τις αναφορές(κάτι που συμβαίνει με όλες τις κωδικοποιήσεις
που έχουν υιοθετηθεί στο διαδίκτυο)
Για παράδειγμα οι αναφορές :
<code>Δ</code> <code>Й</code> <code>ק</code> <code>م</code> <code>๗</code> <code>あ</code> <code>叶</code> <code>葉</code> <code>냻</code> (ή η ίδια τιμή στο δεκαεξαδικό με πρόθεμα <code>&amp;#x</code> ) εμφανίζεται στον πλοηγό σου ως Δ, Й, ק, م, ๗, あ, 叶, 葉 και 냻—εφόσον έχεις την κατάλληλη γραμματοσειρά, αυτά τα σύμβολα φαίνονται σαν [[Greek alphabet|Greek]] capital letter "Delta", [[Cyrillic alphabet|Cyrillic]] capital letter "Short I", [[Arabic alphabet|Arabic]] letter "Meem", [[Hebrew alphabet|Hebrew]] letter "Qof", [[Thai language|Thai]] [[numeral]] [[7]], [[Japanese language|Japanese]] [[Hiragana]] "A", [[simplified Chinese]] "[[Leaf]]", [[traditional Chinese]] "Leaf", and [[Korean language|Korean]] [[Hangul]] syllable "Nyaelh", αντίστοιχα.
<code>&amp;#x</code> ) εμφανίζεται στον πλοηγό σου ως Δ, Й, ק, م, ๗, あ, 叶, 葉 και 냻—εφόσον έχεις την κατάλληλη γραμματοσειρά, αυτά τα σύμβολα φαίνονται σαν [[Greek alphabet|Greek]] capital letter "Delta", [[Cyrillic alphabet|Cyrillic]] capital letter "Short I", [[Arabic alphabet|Arabic]] letter "Meem", [[Hebrew alphabet|Hebrew]] letter "Qof", [[Thai language|Thai]] [[numeral]] [[7]], [[Japanese language|Japanese]] [[Hiragana]] "A", [[simplified Chinese]] "[[Leaf]]", [[traditional Chinese]] "Leaf", and [[Korean language|Korean]] [[Hangul]] syllable "Nyaelh", αντίστοιχα.
 
=== Γραμματοσειρές ===
Γραμμή 247 ⟶ 181 :
Ελεύθερες και εμπορεύσιμες γραμματοσειρές που βασίζονται στο Unicode πρότυπο είναι κοινές, με πρώτες τις [[TrueType]] και τώρα τις [[OpenType]] γραμματοσειρές που υποστηρίζουν και οι δύο Unicode απεικονίζοντας κωδικά σημεία σε συγκεκριμένες εμφανίσεις χαρακτήρων.
 
Υπάρχουν χιλίαδες γραμματοσειρές στην αγορά,αλλά λιγότερες από δώδεκα προσπαθούν να υποστηρίξουν την πλειοψηφία του συνόλου χαρακτήρων
προσπαθούν να υποστηρίξουν την πλειοψηφία του συνόλου χαρακτήρων
του προτύπου Unicode.
Αντίθετα οι βασισμένες στο Unicode γραμματοσειρές συνήθως υποστηρίζουν μόνο βασικό ASCII και κάποια συγκεκριμένα αλφάβητα. Αυτό γίνεται κυρίως για λόγους οικονομίας των δημιουργών γραμματοσειρών και απόδοσης των προγραμμάτων που μπορεί να γονατίσουν καθώς η απόδοση γραμματοσειρών είναι μια διαδικασία που καταναλώνει πολλούς πόρους ενός υπολογιστή.
Αντίθετα οι βασισμένες στο Unicode γραμματοσειρές συνήθως υποστηρίζουν
μόνο βασικό ASCII και κάποια συγκεκριμένα αλφάβητα.Αυτό γίνεται
κυρίως για λόγους οικονομίας των δημιουργών γραμματοσειρών και απόδοσης των
προγραμμάτων που μπορεί να γονατίσουν καθώς η απόδοση γραμματοσειρών
είναι μια διαδικασία που καταναλώνει πολλούς πόρους ενός υπολογιστή.
Χαρακτήρες Unicode που δεν μπορούν να αποδωθούν γραφικά απεικονίζονται με ένα λευκό τετράγωνο.
με ένα λευκό τετράγωνο.
 
=== Μηχανές γραφικής απόδοσης πολυγλωσσικού κειμένου ===
Γραμμή 268 ⟶ 196 :
 
=== Μέθοδοι εισαγωγής ===
Οι επεξεργαστές κειμένου [[Microsoft Word]] επιτρέπουν την εισαγωγή χαρακτήρων Unicode με δυο τρόπους:
# πληκτρολογώντας το δεκαεξαδικό κωδικό σημείο, πχ 014Β(ή U+014b) για τον ''ŋ'',και πατώντας <code>alt + x</code> προκειμένου να αντικατασταθεί η συμβολοσειρά στα αριστερά του δρομέα με τον αντίστοιχο χαρακτήρα unicode. Συνήθως γίνεται και το αντίστροφο,δηλαδή άν έχεις έναν unicode χαρακτήρα στα αριστερά του δρομέα και πατήσεις <code>Alt + x</code> το Word θα αντικαταστήσει τον χαρακτήρα με το ισοδύναμό του κωδικό σημείο στο δεκαεξαδικό ή ακόμα
επιτρέπουν την εισαγωγή χαρακτήρων Unicode με δυο
# πληκτρολογώντας <code>Alt + #</code>, όπου # είναι το δεκαδικό κωδικό σημείο, πχ <code>Alt + 0331</code> θα μας δώσει τον χαρακτήρα Unicode ''ŋ''.
τρόπους:
# πληκτρολογώντας το δεκαεξαδικό κωδικό σημείο,πχ
014Β(ή U+014b) για τον ''ŋ'',και πατώντας <code>alt + x</code>
προκειμένου να αντικατασταθεί η συμβολοσειρά στα αριστερά
του δρομέα με τον αντίστοιχο χαρακτήρα unicode.
Συνήθως γίνεται και το αντίστροφο,δηλαδή άν έχεις
έναν unicode χαρακτήρα στα αριστερά του δρομέα και
πατήσεις <code>Alt + x</code> το Word θα αντικαταστήσει
τον χαρακτήρα με το ισοδύναμό του κωδικό σημείο στο
δεκαεξαδικό ή ακόμα
## πληκτρολογώντας <code>Alt + #</code>, όπου # είναι το δεκαδικό κωδικό σημείο, πχ <code>Alt + 0331</code> θα μας δώσει τον χαρακτήρα Unicode ''ŋ''.
 
Το [[GNOME|Gnome2]] ακολουθεί το πρότυπο [[ISO 14755]].
Κράτησε πατημένα τα πλήκτρα Ctrl and Shift και εισήγαγε στο δεκαεξαδικό το κωδικό σημείο του unicode χαρακτήρα που θέλεις να εμφανιστεί.
εισήγαγε στο δεκαεξαδικό το κωδικό σημείο του unicode χαρακτήρα που θέλεις να εμφανιστεί.
 
== Εξωτερικοί σύνδεσμοι ==
Γραμμή 291 ⟶ 208 :
** Unicode versions: [http://www.unicode.org/unicode/reports/tr27/ 3.1], [http://www.unicode.org/unicode/reports/tr28/ 3.2], [http://www.unicode.org/versions/Unicode4.0.0 4.0], [http://www.unicode.org/versions/Unicode4.0.1/ 4.0.1], [http://www.unicode.org/versions/Unicode4.1.0/ 4.1]
** [http://www.unicode.org/alloc/Pipeline.html new characters], [http://www.unicode.org/pending/pending.html scripts] and [http://www.unicode.org/alloc/investigation.html characters and scripts under investigation]
** [http://www.unicode.org/charts/ Code Charts] ([[portablePortable documentDocument formatFormat|PDF]])
* [http://unicode.coeurlumiere.com/ Table of Unicode characters from 1 to 65535]
* [http://www.macchiato.com/unicode/charts.html UTF-8, UTF-16, UTF-32 Code Charts] and a [http://www-atm.physics.ox.ac.uk/user/iwi/charmap.html character map] ([[JavaScript]])
* [http://www.eki.ee/letter/ The Letter Database] Uses forms to present groups in list or grid format by [[Δεκαεξαδικό σύστημα αρίθμησης|hexadecimal]].
* [http://www.cl.cam.ac.uk/~mgk25/ucs/examples/ Example text files using Unicode]
* [http://www.lazytools.com/unicode-ascii/ Unicode special character map] is similar to the Windows version. Click a symbol to obtain either the named or numeric code for HTML.
Ανακτήθηκε από "https://el.wikipedia.org/wiki/Unicode"