Összesen 1 találat.
#/oldal:
Részletezés:
Rendezés:

1.

001-es BibID:BIBFORM115301
035-os BibID:(Scopus)85185533775
Első szerző:Tóth Erzsébet (informatikus könyvtáros)
Cím:Multilabel Clustering Analysis of the Croatian-English Parallel Corpus Based on Latent Dirichlet Allocation Algorithm / Tóth Erzsébet, Gál Zoltán
Dátum:2023
Megjegyzések:A parallel corpus of Croatian EU legislative documents translated automatically to English over 28 years with a year of creation and hierarchical classifier tags including descriptors, document types, and fields considered as meta information assigned to each text. Only two third part of around 1.5 thousand texts have all the fields completed, accomplishing the required manual work too time-consuming for human administration. Similar incompleteness of legal texts may appear in official legal sites operated as regular service provisioning databases. In this paper we proposed an artificial cognitive and multilabel classification method to automatically find the necessary tags for the corpus with just a tiny fraction of the manual tagging time. The Latent Dirichlet Allocation algorithm assigns field values or tags to incompletely labelled documents. The dependence of the quantitative linguistics properties was presented in the function of the type and specialty of preprocessing tasks. We successfully applied this algorithm built on no error correcting optimising codes to predict a mixture of topic probabilities of these legal texts on the basis of Hamming distance of the binary feature vectors created using the legal fields of the EUROVOC multilingual thesaurus.
ISBN:9798350325652 9798350325645
Tárgyszavak:Műszaki tudományok Informatikai tudományok előadáskivonat
könyvrészlet
jogi szövegek
több-címkés osztályozás
Latent Dirichlet Allocation algoritmus
Megjelenés:14th IEEE International Conference on Cognitive Infocommunications : Proceedings / IEEE. - p. 25-32. -
További szerzők:Gál Zoltán (1966-) (informatikus)
Pályázati támogatás:TKP2021-NKTA-34
Egyéb
Internet cím:DOI
Intézményi repozitóriumban (DEA) tárolt változat
Borító:
Rekordok letöltése1