Taula de continguts:
- Definició: què significa Burrows-Wheeler Transform (BWT)?
- Techopedia explica la transformació de Burrows-Wheeler (BWT)
Definició: què significa Burrows-Wheeler Transform (BWT)?
La transformació Burrows-Wheeler (BWT) és un algorisme que agafa blocs de dades, com les cadenes, i els reordena en tirades de caràcters similars. Després de la transformació, el bloc de sortida conté els mateixos elements de dades exactes abans que s’haguessin iniciat, però difereix en la comanda. La naturalesa de l'algorisme tendeix a situar caràcters similars els uns als altres, cosa que facilita la compressió de les dades resultants. Per tant, s'utilitza en molts algorismes de compressió.
Techopedia explica la transformació de Burrows-Wheeler (BWT)
L’algoritme de transformació Burrows-Wheeler és un algoritme relativament nou inventat el 1994 per Michael Burrows i David Wheeler i basat en una transformació inèdita descoberta per Wheeler el 1983, publicada al seu treball “Un algorisme de compressió de dades sense pèrdues de dades sense classificació de blocs”.
D'allò més bàsic, BWT agafa un bloc de dades com una cadena, afegint un caràcter EOF i després ordena totes les rotacions d'aquesta cadena per ordre lexicogràfic. El següent pseudocodi o passos il·lustren l'algorisme:
- Creeu una taula que contingui files que representin totes les rotacions possibles d'un increment de la cadena.
- Ordena totes les files alfabèticament.
- Sortiu l’última columna de la taula.
Per exemple: la paraula "plàtan"; Si afegeix un caràcter EOF es converteix en "banana $" i després apliquem l'algorisme:
1. Creeu una taula amb files que representi totes les rotacions possibles:
plàtan $
anana $ b
nana $ ba
ana $ prohibició
na $ bana
un $ banan
$ plàtan
2. Ordeneu les files alfabèticament / lexicogràficament a partir de la primera columna:
$ plàtan
un $ banan
ana $ prohibició
anana $ b
plàtan $
nana $ ba
na $ bana
3.Retornem l'última columna com a sortida de BWT: anb $ aa
La cadena resultant és més fàcil de comprimir perquè els caràcters repetits s'agrupen un al costat de l'altre. Però cal que hi hagi dades addicionals emmagatzemades amb les dades transformades perquè es pugui fer una transformació inversa. Tot i que les dades transformades resultants són més grans que la seva forma original, però la seva característica de compressibilitat és multiplicada, essencialment convertint-la en un mètode "lliure" per millorar l'eficiència dels mètodes de compressió.
