CCL

Összesen 3 találat.
#/oldal:
Részletezés:
Rendezés:

1.

001-es BibID:BIBFORM097832
Első szerző:Gál Zoltán (informatikus)
Cím:Deep learning-based analysis of ancient Greek literary texts: A statistical model based on word frequency for the classification of texts / Gál Zoltán, Tóth Erzsébet
Dátum:2021
ISBN:978 1 6654 2495 0
Tárgyszavak:Műszaki tudományok Informatikai tudományok előadáskivonat
könyvrészlet
szövegek osztályozása
automatikus tartalomelemzés
mély tanulás
ókori irodalmi szövegek
Megjelenés:12th IEEE International Conference on Cognitive Infocommunications: CogInfoCom 2021: Proceedings / ed. Jan Nikodem, Ryszard Klempous. - p. 529-535. -
További szerzők:Tóth Erzsébet (1972-) (informatikus könyvtáros)
Internet cím:Intézményi repozitóriumban (DEA) tárolt változat
Borító:

2.

001-es BibID:BIBFORM115301
035-os BibID:(Scopus)85185533775
Első szerző:Tóth Erzsébet (informatikus könyvtáros)
Cím:Multilabel Clustering Analysis of the Croatian-English Parallel Corpus Based on Latent Dirichlet Allocation Algorithm / Tóth Erzsébet, Gál Zoltán
Dátum:2023
Megjegyzések:A parallel corpus of Croatian EU legislative documents translated automatically to English over 28 years with a year of creation and hierarchical classifier tags including descriptors, document types, and fields considered as meta information assigned to each text. Only two third part of around 1.5 thousand texts have all the fields completed, accomplishing the required manual work too time-consuming for human administration. Similar incompleteness of legal texts may appear in official legal sites operated as regular service provisioning databases. In this paper we proposed an artificial cognitive and multilabel classification method to automatically find the necessary tags for the corpus with just a tiny fraction of the manual tagging time. The Latent Dirichlet Allocation algorithm assigns field values or tags to incompletely labelled documents. The dependence of the quantitative linguistics properties was presented in the function of the type and specialty of preprocessing tasks. We successfully applied this algorithm built on no error correcting optimising codes to predict a mixture of topic probabilities of these legal texts on the basis of Hamming distance of the binary feature vectors created using the legal fields of the EUROVOC multilingual thesaurus.
ISBN:9798350325652 9798350325645
Tárgyszavak:Műszaki tudományok Informatikai tudományok előadáskivonat
könyvrészlet
jogi szövegek
több-címkés osztályozás
Latent Dirichlet Allocation algoritmus
Megjelenés:14th IEEE International Conference on Cognitive Infocommunications : Proceedings / IEEE. - p. 25-32. -
További szerzők:Gál Zoltán (1966-) (informatikus)
Pályázati támogatás:TKP2021-NKTA-34
Egyéb
Internet cím:DOI
Intézményi repozitóriumban (DEA) tárolt változat
Borító:

3.

001-es BibID:BIBFORM104243
Első szerző:Tóth Erzsébet (informatikus könyvtáros)
Cím:A mesterséges intelligencia alkalmazása görög irodalmi szövegek elemzésére / Tóth Erzsébet, Gál Zoltán
Dátum:2022
ISSN:2734-6757
Megjegyzések:Dolgozatunkban egy olyan osztályozási modellt fejlesztettünk ki, amiben több száz különböző ókori görög szövegentitást használtunk ellenőrzött tanulásra abból a célból, hogy az felismerje a szövegentitások osztályát. Meghatároztuk az (a, b, c) hármas értékeit egy olyan hatványfüggvény leírására, amely pontosan illeszkedik a kiválasztott szövegekben lévő szavak relatív gyakorisága által megadott görbére. A 200 darab szövegentitással kapcsolatban az (a, b, c) hármas értékeinek becsléséhez a szövegentitások osztály azonosítóját és a 16 dimenziós tulajdonság ("feature") vektorokat használtuk fel a Visszacsatolásos Neurális Hálózat (RNN - Recurrent Neural Network) betanításához. Arra a következtetésre jutottunk, hogy az LSTM (Long-Short Term Memory) RNN hálózat hatékonyan előrejelezte számunkra, hogy a kiválasztott szövegentitás melyik osztályba sorolható.
Tárgyszavak:Műszaki tudományok Informatikai tudományok előadáskivonat
könyvrészlet
mély tanulás
szövegosztályozás
Visszacsatolásos Neurális Hálózat (RNN)
Long-Short Term Memory hálózat
Megjelenés:XXIII. Energetika-Elektrotechnika - ENELKO és XXXII. Számítástechnika és Oktatás : SzámOkt Multi-konferencia / szerk. Sebestyén-Pál György, Szabó Loránd. - p. 173-179. -
További szerzők:Gál Zoltán (1966-) (informatikus)
Pályázati támogatás:TKP2021-NKTA-34
Egyéb
Internet cím:Szerző által megadott URL
Intézményi repozitóriumban (DEA) tárolt változat
Borító:
Rekordok letöltése1