--- a/doc/memoria.tex Thu Oct 25 12:45:59 2007 +0200
+++ b/doc/memoria.tex Thu Oct 25 13:25:44 2007 +0200
@@ -41,13 +41,14 @@
% Wikipedia
\subsection{La codificació JPEG}
-El 1986 es va crear un comitè per a establir un estàndard de codificació
+El 1986 es va crear un comitè per establir un estàndard de codificació
d'imatges de to-continu (continous tone), per exemple, fotografies. Aquest
comitè tenia el nom de Joint Photographic Experts Group, i el 1992 va aprovar
l'estàndard conegut arreu amb el nom de JPEG. Va decidir tant la
codificació de la imatge, efectivament amb les sigles del grup, i també un
-format fitxer que contindria la informació (JIF - JPEG Interchange Format).
-Aquest primer JIF tenia algunes mancances, que al llarg de la història s'han
+format fitxer que contindria la informació codificada
+(JIF - JPEG Interchange Format).
+Aquest primer JIF tenia algunes mancances que al llarg de la història s'han
suplit amb nous formats, com JFIF i EXIF. La majoria de gent sol anomenar-los
indistintament "Fitxers JPEG", o bé amb la reducció a tres lletres obligada sota
sistemes MS-DOS, "Fitxers JPG".
@@ -59,30 +60,31 @@
amb pèrdues. D'ara en endavant parlarem exclusivament de la compressió amb
pèrdues.
-La imatge original, prèvia a codificar-la, la trobem definida amb un mapa de
+La imatge original, prèvia a codificar, la trobem definida amb un mapa de
bits. Això significa que tenim la imatge dividida en espai, amb una malla
quadriculada de punts de color. Cada punt (pícsel, píxel, pel, de \emph{picture
element}) ens defineix el color en aquell lloc de la quadrícula. Si tenim una
quadricula de punts suficientment densa, el nostre ull no la distingirà,
-i el conjunt li semblarà una imatge de color contínua o de to continu. Sobretot
+i el conjunt li semblarà una imatge de color contínua o de to continu --
+sobretot
en el cas de que la imatge sigui d'orígen fotogràfic, en comptes de generada
artificialment.
La codificació JPEG, mitjançant les pèrdues i diversos sistemes de compressió de
dades, permet convertir el mapa de bits a una representació més densa, tot i que
no fidel, de la original. Si tenim la imatge codificada amb els plans de color
-Vermell-Verd-Blau (RGB), amb 8 bits per punt i per component, tenim una densitat
+Vermell-Verd-Blau (RGB), amb 8 bits per punt i component, tenim una densitat
d'informació de 24 bits per punt (bpp). Amb la compressió JPEG podem arribar a
relacions de 1,5 bpp sense escatimar en qualitat d'imatge. En el cas de tenir el
mapa de bits a partir d'una fotografia, almenys a una densitat de pícsels de 72
-ppi (72 pícsels per pulgada) en horitzontal i vertical, l'ull humà en prou
+ppi (72 pícsels per polzada) en horitzontal i vertical, l'ull humà mitjà en prou
feines pot distingir la pèrdua de definició del JPEG a 1,5 bpp.
En el procés de codificació (o compressió) JPEG, es llença part de la informació
del mapa de bits original. Això vol dir que en el procés de descodificació
-tindrem només part de la informació de la original, i que per a construir una
-nova imatge sencera, el descodificador s'ha d'inventar la part que falta. En
-totes les implementacions populars de descodificadors JPEG que hem vist
+tindrem només part de la informació original, i que per construir una
+nova imatge sencera, el descodificador s'ha d'inventar la part que falta. A
+les implementacions populars de descodificadors JPEG que hem vist
\cite{libjpeg}, la invenció d'informació és molt simple, i no sempre encertada,
considerant que cal obtenir una imatge el més semblant possible a l'original
d'acord amb els criteris de l'ull humà. En aquest treball analitzarem
@@ -245,10 +247,19 @@
plans, però sense delmar els plans de color. Ja no s'hi aprecia tant el
vessament.}
-\subsubsection{Quantització dels coeficients}
+\subsubsection{Blocs i quantització dels coeficients}
+
+La imatge es parteix en blocs de 8x8 pícsels, i cada bloc es codifica de manera
+independent. La informació que es llença s'escull exclusivament en
+relació al bloc i això vol dir que no es té en compte la conservació de
+propietats dels entorns locals dels punts. Degut a això, sovint podem
+distingir molesties visuals precisament a les vores entre blocs,
+on la informació pertany a dos blocs considerats completmaent independents pel
+codificador.
Dels 64 punts d'intensitat de color que determinen cada bloc de 8x8 pícsels
-obtenim 64 coeficients. Aquests es solen ordenar en
+obtenim 64 coeficients mitjançant la transformada DCT 2D.
+Aquests es solen ordenar en
freqüències de menor a major, utilitzant l'ordre de Zig Zag
(Figura \ref{fig:jpeg-coeficients}) definit a l'estàndard de JPEG.
@@ -316,16 +327,16 @@
marca l'ordre de Zig Zag de JPEG. Es poden apreciar els intervals de
quantització, i la pèrdua d'informació sobretot a les freqüències més altes.}
-A la pèrdua d'informació deguda a la quantització se l'anomena
+A la pèrdua d'informació deguda a la quantització se l'anomena
\emph{soroll de quantització}. Té diverses conseqüències visibles a la imatge
-descodificada de manera convencional, i en podem veure algunes classificades a
+descodificada de manera convencional, i en podem veure una classificació a
la Figura \ref{fig:quant-problems}.
\figura{lena-blocking.pdf}{
\label{fig:quant-problems} Pla de lluminositat de la Lena de 256x256 píxels, a
qualitat 40 segons la \texttt{libjpeg}. Podem veure els efectes a) d'ones
-(\emph{ringing}) als blocs que tenen un canvi brusc d'intensitat pel mig, b) de
-cantonades (\emph{corner}) i c) de blocs \emph{blocking}, entre blocs a les
+(\emph{ringing}) als blocs que tenen un canvi brusc d'intensitat pel mig, b)
+d'escala (\emph{staircase}) i c) de blocs \emph{blocking}, entre blocs a les
superfícies de lluminositat similar.}
\bibliography{cited}