Paper published in a book (Scientific congresses and symposiums)
Détection automatique des textes épistolaires du corpus néo-égyptien : méthodes exploitant la récurrence de motifs discriminants
Gohy, Stéphanie; Martin Leon, Benjamin
2012In Dister, Anne; Longrée, Dominique; Purnelle, Gérald (Eds.) Actes des 11es Journées internationales d'Analyse statistique des Données Textuelles
Peer reviewed
 

Files


Full Text
Gohy-Martin Leon JADT 2012.pdf
Author preprint (562.03 kB)
Download

All documents in ORBi are protected by a user license.

Send to



Details



Keywords :
motifs; néo-égyptien; détection automatique; genre épistolaire; classification; arbre de décision
Abstract :
[fr] Dans cette contribution, nous proposons de développer deux méthodes permettant une détection automatique du genre épistolaire néo-égyptien. Parmi les critères pouvant être mobilisés afin de rendre compte des différents genres composant un corpus figure nitamment l'étude de "motifs", procédé déjà appliqué, entre autres, à un corpus d'historiens latins. Dans notre communication, nous proposons d'appliquer ce procédé au corpus néo-égyptien, et plus particulièrement au genre épistolaire. Pour ce faire, deux méthodes seront appliquées à notre corpus afin d'identifier les documents appartenant ou non au genre épistolaire. Nous commencerons par expliquer le principe de fonctionnement de ces deux méthodes. Les résultats obtenus seront ensuite analysés ; on tentera de comprendre pourquoi certains documents ont été mal classés.
[en] In this paper, we will develop two methods allowing an automatic detection of the Late-Egyptian epistolary genre. Among the criteria which could be mobilized to identify different genres within a corpus, the study of “motifs” (“patterns”) represents a particularly promising approach that has already been successfully exploited for a corpus of Latin texts. In our communication, we suggest applying this process to the Late Egyptian corpus, and more particularly to the epistolary genre. Two methods will be applied to our corpus to identify whether or not particular documents belong the epistolary genre. We shall begin by explaining the principle of functioning of these two methods. The results obtained will then be analyzed; we shall try to understand why certain documents were improperly classified.
Disciplines :
Languages & linguistics
Author, co-author :
Gohy, Stéphanie ;  Université de Liège - ULiège > Département des sciences de l'antiquité > Egyptologie
Martin Leon, Benjamin ;  Université de Liège - ULiège > Département des sciences de l'antiquité > Egyptologie
Language :
French
Title :
Détection automatique des textes épistolaires du corpus néo-égyptien : méthodes exploitant la récurrence de motifs discriminants
Publication date :
2012
Event name :
JADT 2012 - 11e Journées internationales d'analyse statistique des données textuelles
Event organizer :
LASLA - SESLA
Event place :
Liège, Belgium
Event date :
13 juin 2012 au 15 juin 2012
Audience :
International
Main work title :
Actes des 11es Journées internationales d'Analyse statistique des Données Textuelles
Main work alternative title :
[en] Proceedings of the 11th International Conference on Textual Data Statistical Analysis
Editor :
Dister, Anne
Longrée, Dominique ;  Université de Liège - ULiège > Mondes anciens > Mondes anciens: Laboratoire d'Analyse statistique des Langues anciennes
Purnelle, Gérald ;  Université de Liège - ULiège > Département de langues et littératures romanes > Poésie moderne et contemporaine de la langue française
Publisher :
CIACO, Louvain-la-Neuve, Belgium
Pages :
487-500
Peer reviewed :
Peer reviewed
Available on ORBi :
since 22 January 2013

Statistics


Number of views
93 (12 by ULiège)
Number of downloads
99 (3 by ULiège)

Bibliography


Similar publications



Contact ORBi