Összesen 1 találat.
#/oldal:
Részletezés:
Rendezés:

1.

001-es BibID:BIBFORM126093
Első szerző:Tóth Erzsébet (informatikus könyvtáros)
Cím:Szövegek korrumpálódásának vizsgálata a hálózati adatátvitelsorán = Text corruption analysis during text transmission on the network / Tóth Erzsébet, Gál Zoltán
Dátum:2024
Megjegyzések:Dolgozatunkban egy olyan módszert javaslunk, amely növeli egy nem megbízható üzenetküldő alkalmazás szolgáltatásának minőségét a szövegek korrumpálódásának felderítésével. A Central Intelligence Agency (CIA) szervezet szövegeinek vizsgálata a tokenek mondatrészekbe (Parts of Speech=POS) történő besorolásábólszármazó tulajdonság ("feature") vektorokat tárja fel, amelyek speciális mintázatokat mutatnak a szövegek méretétől függetlenül. A szövegentitások csökkenő kohéziót mutatnak a szülő szöveggel, ahogyan azok mérete csökken. Exponenciális függvényt tudtunk illeszteni a tulajdonság vektorok rendezett token kategóriáinak átlag intenzitás értékére, ami egy gyakori nyelvi struktúrát jelez az angol nyelvű katonai és politikai témájú szövegekben. A zaj bevezetésére irányuló kísérletek magasabb zajszinteknél egyre inkább csökkenő átlag variációs együtthatót eredményeznek a szövegek tulajdonság ("feature") vektoraira vonatkozóan és egyre inkább növekvő átlag entrópia ingadozásokat mutatnak a szövegek tulajdonság vektorainál. Ezzel szemben az alacsony zajszinteknek minimális a hatása a tulajdonság vektorok ezen vizsgált metrikáira. Ezek az eredmények azt tükrözik, hogyha nyomon követjük az entrópia és a variációs együttható metrikákat, akkor a szöveg kohéziója megmarad még zajos feltételek mellett is. Mindez pedig lehetővé teszi, hogy egy megfelelő kvantitatív keretrendszert alakítsunk ki a szöveg korrumpálódás hatásainak megértésére ezzel is támogatva a megbízható hálózati kommunikációs rendszerek és a nyelvi modellek fejlesztését.
Tárgyszavak:Műszaki tudományok Informatikai tudományok előadáskivonat
könyvrészlet
Central Intelligence Agency (CIA) szövegek
szövegek osztályozása
mondatrész kategorizálás
kvantitatív nyelvészet
variációs együttható
entrópia
zajos szövegek
Megjelenés:XXV. Energetika-Elektrotechnika - ENELKO és XXXIV. Számítástechnika és Oktatás - SzámOkt Multi-konferencia = Enelko - 25th International Conference on Energetics-Electrical Engineering SzámOkt - 34th International Conference on Computers and Education. - p. 122-130. -
További szerzők:Gál Zoltán (1966-) (informatikus)
Pályázati támogatás:TKP2021-NKTA-34
Egyéb
Internet cím:Szerző által megadott URL
Intézményi repozitóriumban (DEA) tárolt változat
Borító:
Rekordok letöltése1