国家信访局党组推进“两学一做”学习教育常态化制度化实施方案国信党〔2017〕14号

Datakompression (best?r af processerne datakomprimering og datadekomprimering) er metoder man anvender indenfor computerteknologi til at f? datam?ngder til at fylde mindre i perioder. Man kan komprimere enkelte filer s?vel som hele samlinger af filer. Man "pakker filer", som det hedder i visse kredse. Man kan ogs? p? en gang komprimere indholdet af al data p? et eller flere datalager-enheder (fx harddiske). Datalager-kapacitet er en konkurrenceparameter, s? industrien er generelt interesseret i at data fylder s? lidt som muligt. P? trods af at m?let er at f? data til at fylde mindre, kan man i sj?ldne tilf?lde risikere at f? det modsatte resultat. Komprimering optager s?ledes megen interesse indenfor s?vel datalogien som industrien.
Hvordan komprimeres data
[redigér | rediger kildetekst]Det meste data som produceres, indeholder dublerende – redundant – information. Simple eksempler:
- En tekstfil gentager bogstaverne i alfabetet adskillige gange.
- I de fleste tekster forekommer de samme ord mange gange.
- Et billedfil gentager rigtig mange gange farvev?rdier for alle pixels, som udg?r en ensartet farveflade.
Komprimeringsprocessen finder (noget af) denne redundans, fjerner eller udskifter den med data om hvor meget den p?g?ldende datam?ngde er dubleret. Komprimeringsprogrammer arbejder med forskellige metoder, kaldet algoritmer. Nogle algoritmer komprimerer hurtigere, andre er bedre til at h?ndtere st?rre datam?ngder, andre igen opn?r st?rre kompression af data osv. Overordnet skelnes mellem to kategorier af kompression:
- Tabsfri kompression – alle data bevares og kan genskabes. Her kan der fx v?re tale om forskellige former for tekst-data, dokumenter o.l., hvor de oprindelige data skal kunne retableres 100% korrekt fra de komprimerede data. I denne kategori er ogs? komprimerede sikkerhedskopier, som gerne skal kunne retableres fuldt ud.
- IKKE-tabsfri kompression – der forekommer et vist svind af data under processen, s? data ikke fuldt kan genskabes ved dekomprimering. Denne form v?lges typisk ved fx komprimering af billeder, hvor man kan acceptere et vist kvalitetstab, mod til geng?ld at opn? h?jere grad af komprimering. Man er, med komprimeringsprogrammets valgmulighed for komprimeringsgrad, i stand til at v?lge, hvor "h?rdt" man vil reducere data.
Tabsfri kompression
[redigér | rediger kildetekst]Tabsfri datakompression er en betegnelse for, at data komprimeres med en algoritme, som sikrer, at alle data retableres 100% – uden tab – ved dekomprimering. Man kan til geng?ld forvente, at data fylder mere.
En af de kendteste algoritmer er Lempel-Ziv-Welch (LZW) fra 1978 og offentliggjort igen i 1984, komprimerer effektivt uanset anvendt ordgr?nse, tegns?t eller ordst?rrelse.
Nogle programmer kan h?ndtere kataloger med filer og underkataloger til vilk?rlig dybde, andre mange inputfiler, mens andre kun kan pakke en enkelt fil.
Prim?rt PC-programmer
[redigér | rediger kildetekst]- PowerArchiver
- WinZip
- WinRar
- Zipgenius
- 7-Zip – open source, ?ben arkitektur der kan kan anvende mange kompressionsalgoritmer og formater. Anvender ogs? den forbedrede LZ77-algoritme LZMA.
Prim?rt Linux-programmer
[redigér | rediger kildetekst]- bzip2 – er fra 1996 og er i snit en bedre kompression end compress og gzip. Kompressionsprocessen er lidt langsommere end gzip, men komprimerer data m?rkbart bedre.
- gzip – er fra 1992 og er en ?ben standard udgivet som RFC 1950, RFC 1951 og RFC 1952. Anvender LZ77 og Huffman-kodning.
- compress – gammelt program fra ca. 1983. Bruger LZ78 som igen anvender LZW.
Ikke-tabsfri kompression
[redigér | rediger kildetekst]Ikke-tabsfri datakompression er en betegnelse for, at data komprimeres med datatab. Datatabet resulterer i, at det dekomprimerede arkiv eller fil, vil v?re forskellig fra originalen.
Ikke-tabsfri datakompressionsalgoritmer anvendes is?r p? lyd, r? scannet tekst, illustrationer, billeder og video. Langt de fleste af disse data anvender som hovedalgoritme, en optimeret algoritmeudgave af diskret Fourier-transformation; kaldet fast fourier transformation (FFT). En nyere og bedre algoritme til at komprimere anvender diskret Wavelet-transformation – faktisk fast wavelet-transformation (FWT).
FFT anvendes i bl.a. JPEG, MPEG-2 og MPEG-4.
FWT anvendes i bl.a. JPEG 2000.
Eksterne henvisninger
[redigér | rediger kildetekst]- Komprimering – Kan man f? data til at fylde mindre? Arkiveret 24. september 2020 hos Wayback Machine
Spire Denne artikel om datalogi eller et datalogi-relateret emne er en spire som b?r udbygges. Du er velkommen til at hj?lpe Wikipedia ved at udvide den. |