RIF! - Rejstřík informací Fóra Věda žije!

RIV/26138077:_____/12:#0000367 - Syllable-based Compression


Údaje o výsledku

Identifikační kód: RIV/26138077:_____/12:#0000367
Název v původním jazyce: Syllable-based Compression
Název česky:
Druh: B - Odborná kniha
Jazyk: eng - angličtina
Obor: IN - Informatika
Rok uplatnění: 2012
Kód důvěrnosti: S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet tvůrců: 1
Počet domácích tvůrců: 1
Tvůrce: Lánský, Jan

Údaje blíže specifikující výsledek

Popis v původním jazyce: Classic textual compression methods work over the alphabet of characters or alphabet of words. For languages with rich morphology as well as for compression of smaller files it can be advantageous to use an alphabet of syllables. For some compression methods like the ones based on Burrows-Wheeler transformation the syllable is a reasonable solution also for large files. Although the main goal of our research is the compression over the alphabet of syllables, all implemented methods can compress also over the alphabet of words. For small files we use the LZW method and Huffman coding. These methods were improved by the use of initialized dictionary containing characteristic syllables specific for given language. For the compression of very large files we implemented the project XBW allowing combination of compression methods BWT, MTF, RLE, PPM, LZC, and LZSS. We have also tried to compress XML files that are not well-formed. When compressing over a large alphabet, it is necessary to compress also the used alphabet. The alphabet of used syllables is encoded as a compressed trie what significantly reduces the space necessary for encoding of the alphabet.
Popis česky:
Klíčová slova:
Název periodka: Syllable-based Compression
Rozsah stran:
ISSN:
Svazek periodika:
Číslo periodika v rámci uvedeného svazku:
Stát vydavatele periodika:
Počet stran výsledku: 116
DOI:

Údaje o tomto záznamu o výsledku

Předkladatel: Vysoká škola finanční a správní, z.ú. (IČO: 26138077)
Dodavatel: MSM
Rok sběru: 2014
Systémové označení dodávky dat: RIV14-MSM-26138077/01:1
Kontrolní kód: [613D5F5E7F3B]