Page d'accueil encyclopedie-enligne.com en page d'accueil
Liste Articles: [0-A] [A-C] [C-F] [F-J] [J-M] [M-P] [P-S] [S-Z] | Liste Catégories | Une page au hasard | Pages liées

Classement alphabétique


Le terme classement alphabétique désigne deux notions distinctes d'ancienneté différente ;

Sommaire

Principes

Le principe fondamental consiste à comparer deux mots, caractère par caractère.

Si les n premiers caractères sont identiques, on prend le suivant. Si le n-ième caractère diffère, l'ordre est établi. Si le mot est fini, le mot est considéré comme venant en premier.

Il convient donc pour classer correctement de connaître :

Origines

Les écritures alphabétiques, syllabiques ou alphasyllabiques du Monde dotées d'une histoire ancienne ont toutes établi un classement de leurs graphèmes, tâche facilitée par le nombre réduit de signes. Les écritures logographiques, quant à elles, devant le nombre important de caractères, n'ont pu suivre de règles simples. On trouve ainsi de nombreuses manières de classer les sinogrammes (cf. Dictionnaires de sinogrammes).

Ordre levantin

Le premier ordre alphabétique est né avec le premier alphabet sémitique, celui d'Ougarit, un abjad cunéiforme. L'ordre est attesté sur plusieurs tablettes. Il s'est poursuivi dans un autre abjad sans lien pour la forme mais lié linguistiquement, celui du phénicien, d'où sont issus les principaux alphabets actuels : alphabet grec et ses avatars (alphabet gotique, cyrillique, latin en passant par l'étrusque), mais aussi alphabet araméen, syriaque, hébreu, arabe, etc.

C'est celui qui, maintenant l'un des plus célèbres, est désigné par le terme d'« ordre levantin », dans lequel on retrouve, souvent dissimulé par les évolutions propres à l'histoire de chaque alphabet et aux modifications qu'on a dû leur apporter pour les rendre aptes à noter la langue voulue (modifications « aggravées » par le fait que les alphabets ont pu se transmettre via des langues très éloignées phonétiquement), le classement traditionnel (notation API) /ʔ/ (coup de glotte, remplacé par /a/ à partir du grec), /b/, /g/ (devenu /k/ noté par c dès le latin), /d/, /h/ (devenu /e/ à partir du grec), /w/ (devenu /f/ à partir du latin, issu du digamma grec), /z/ (remplacé par /g/ puis rejeté en fin d'alphabet à partir du latin), etc.

Certains alphabets ont même été entièrement réordonnés pour des raison graphiques afin d'en faciliter l'apprentissage, comme l'alphabet arabe (cf. aussi Histoire de l'alphabet arabe et Numération arabe, l'ordre originel réapparaissant dans la numération). Pour ces écritures, cependant, le choix d'un ordre alphabétique cohérent est toujours resté une priorité. Ainsi, l'insertion de la nouvelle lettre G /g/ latine ─ issue d'un C /k/ modifié (lettre provenant elle-même du Γ /g/ gamma grec prononcé /k/ par les Étrusques) ─ s'est faite sans altérer l'ordre alphabétique : la nouvelle lettre a en effet remplacé un Z inutile en latin, lequel, cependant, a été réintroduit plus tard à la fin de l'alphabet quand il s'est avéré nécessaire de noter des mots grecs, à la suite du Y, autre lettre reprise aux Grecs.

Ordre sudarabique

Outre l'ordre levantin, il en existe un autre, pour les écritures dérivées de l'alphabet linéaire, dit ordre sudarabique, lui aussi ancien mais plus limité dans ses représentations. Attesté en sudarabique (et dans quelques tablettes en ougaritique trouvées hors d'Ougarit, comme celle de Beth Šemeš), il s'est transmis au syllabaire éthiopien, qui en découle.

Ses premiers rangs sont les suivants (en transcription des langues sémitiques) : h, l, , m, q, w, š, r, etc.

Ordre indien

En Inde, et à la suite dans tous les alphasyllabaires dérivés de la brāhmī (devanāgarī, et autres écritures de l'Inde, alphabet tibétain, thaï, etc.) ou qui en sont inspirés (comme, plus lointainement et après de nombreuses réfections, les kanas japonais), le classement est entièrement revu : il se fait de manière rationnelle, les graphèmes étant classés en rangées selon leur point d'articulation, d'abord les occlusives notant des phonèmes prononcés au fond de la gorge en premier puis en remontant petit à petit vers les articulations labiales puis, enfin, en dernier rang des les sonantes, les sifflantes et les dernières fricatives. Dans chaque rangée, on trouve d'abord la consonne sourde puis la sourde aspirée, la sonore, la sonore aspirée puis la nasale. Les voyelles sont classées à part, souvent en tête de liste. Il est évident que, de la même manière que pour l'ordre levantin, de nombreuses réorganisations ont pris place, selon les langues.

Voici par exemple les premiers rangs consonantiques de la devanāgarī (en transcription des langues indiennes) : k, kh, g, gh, , c, ch, j, jh, ñ, , ṭh, , ḍh, , etc.

Exemples en français

La ligature œ (ou e dans l'o) est à considérer en français comme un o suivi d'un e (deux caractères) pour le classement alphabétique, alors que oe et œ ont deux rôles entièrement distincts en français :

En première analyse les caractères accentués, de même que les majuscules, ont le même rang alphabétique que le caractère fondamental :

Si plusieurs mots ont le même rang alphabétique, on tâche de les distinguer entre eux grâce aux majuscules et aux accents (pour le e, on a l'ordre e, é, è, ê) :

Ce double classement (sans puis avec les accents) donne au final  :

À noter que la comparaison des caractères accentués se fait alors à l'envers en commençant par la dernière lettre :

Source : Gouvernement du Québec

Classement alphabétique en castillan (ou espagnol)

Le cas du classement alphabétique dans cette langue, modifié en 1994, fait l'objet d'un article séparé.

Avantages et inconvénients

Avantages

Ceci permet de trouver facilement un mot dans une liste à toute personne sachant lire la langue dans laquelle elle effectue sa recherche.

Défaut du classement alphabétique, ou le désordre alphabétique

Le principal reproche fait au classement alphabétique, est que, sous une apparence de classement rigoureux et pensé, il mélange ce qu'il range. Car en fait, suivant l'ordre alphabétique (les documentalistes disent le désordre alphabétique) des notions ou des éléments n'ayant aucun point commun se retrouvent voisins, et au contraire, les articles concernant un même sujet se retrouvent éparpillés. Par exemple, en ouvrant au hasard un dictionnaire, on trouve ronin, ronron et Ronsard. Il eût mieux valu, par proximité de sens, placer le premier avec samouraï ou au moins Japon, le second à proximité de chat et le dernier avec poésie ou bien la Pléiade. C'est ainsi que le classement de nombreuses encyclopédies se fait d'abord par thème, puis le classement de ces thèmes est fait par ordre alphabétique (qui est donc secondaire).

Programmation

Les programmeurs d'application devront donc faire attention aux spécificités locales. Cf. Classement alphabétique informatisé.

Ordre ASCII

Notons que Wikipédia considère l'ordre ASCII comme un ordre alphabétique. Cf. cette page sur Meta .

Wikipédia sur ce point est touché par le bug 164 . Pour les développeurs, on pourrait ajouter le commentaire suivant.

It looks like mySQL 4.1 support nationals collate of utf-8
http://dev.mysql.com/doc/mysql/en/Charset.html
http://bugzilla.wikipedia.org/show_bug.cgi?id=164

Articles connexes




This site support the Wikimedia Foundation. This Article originally from Wikipedia. All text is available under the terms of the GNU Free Documentation License Page HistoryOriginal ArticleWikipedia