More on techniques: QCS and Probability of the coeficients.
authorviric@llimona
Sun, 28 Oct 2007 20:48:36 +0100
changeset 208 b73581e219fa
parent 207 d90083253791
child 209 79a15788ef38
More on techniques: QCS and Probability of the coeficients.
doc/cited.bib
doc/memoria.tex
--- a/doc/cited.bib	Fri Oct 26 17:37:24 2007 +0200
+++ b/doc/cited.bib	Sun Oct 28 20:48:36 2007 +0100
@@ -109,3 +109,45 @@
     volume = "5",
     number = "2"
 }
+
+@article{froment2005,
+    author = "François Alter and Sylvain Durand and Jacques Froment",
+    title = "Adapted Total Variation for Artifact Free Decompression of JPEG Images",
+    year = "2005",
+    journal = "Journal of Mathematical Imaging and Vision",
+    volume = "23",
+    pages = "199-211"
+}
+
+@article{orourke1995,
+    author = "Thomas P. O'Rourke and Robert L. Stevenson",
+    title = "Improved Image Decompression for Reduced Transform Coding Artifacts",
+    year = "1995",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    volume = "5",
+    month = "December",
+    pages = "490-499"
+}
+
+@article{trianta2003,
+    author = "G. A. Triantafyllidis and M. Varnuska and D. Sampson and D.
+        Tzovaras and M. G. Strintzis",
+    title = "An efficient algorithm for the enhancement of JPEG-coded images",
+    year = "2003",
+    journal = "Computers and Graphics",
+    pages = "529-534",
+    volume = "27",
+}
+
+@article{queiroz1998,
+    author = "Ricardo L. de Queiroz",
+    title = "Processing JPEG-compressed Images and Documents",
+    year = "1998",
+    month = "December",
+    journal = "IEEE Transactions on Image Processing",
+    pages = "1661-1672",
+    number = "12",
+    volume = "7"
+}
+
+
--- a/doc/memoria.tex	Fri Oct 26 17:37:24 2007 +0200
+++ b/doc/memoria.tex	Sun Oct 28 20:48:36 2007 +0100
@@ -161,6 +161,7 @@
 per a dur a terme les descodificacions.
 
 \subsection{Les pèrdues al JPEG}
+\label{sec:perdues}
 
 % TODO: mal sangrat
 \revisar{mal sagnat}
@@ -193,7 +194,8 @@
 decisions, inventar, el millor possible)
 \item Fem la transformada inversa DCT dels coeficients obtinguts, per
 arribar a la representació en blocs de mapa de bits de 8x8 pícsels.
-\item Els blocs constitueixen la informació espaial dels plans, i cal reescalar
+\item Els blocs constitueixen la informació espacial dels plans, i cal reescalar
+
 els plans delmats a la seva dimensió original. (Aquí el descodificador també ha
 d'inventar els nous punts al escalar la imatge)
 \item Ja tenim una versió dels tres plans que determinaven la imatge.
@@ -323,8 +325,11 @@
 d'un bloc a la Figura \ref{fig:quant-intervals}.De tota manera, a la
 descodificació, del coeficient original només sabem que es troba dins
 l'\emph{interval de quantització}:
-\[ y_i \in Q_i \left[ \hat y_i - 0,5 \, , \,
-\hat y_i + 0,5 \right] \]
+\begin{equation}
+\label{eqn:quant-intervals}
+y_i \in Q_i \left[ \hat y_i - 0,5 \, , \,
+\hat y_i + 0,5 \right] 
+\end{equation}
 
 \figura{block16x16simple.pdf}{
 \label{fig:quant-intervals} Coeficients del bloc situat a la fila 17,
@@ -376,7 +381,9 @@
 que es sol expressar en decibels i és definida així:
 \[ PSNR = 10 \log_{10} \frac{255^2}{MSE} \]
 
-A la pràctica, la PSNR es considera una mesura adequada quan es comparen imatges
+A molts articles on proposen mètodes per millorar la descompressió JPEG
+justifiquen les millores amb la PSNR. A la pràctica,
+la PSNR es considera una mesura adequada quan es comparen imatges
 codificades a alta qualitat. En general, la PSNR mesura bé l'error percebut
 quan no hi ha gaires diferències a zones d'altes freqüències. Concretament,
 nosaltres no distingim gaire els desfasaments a altes freqüències, i en canvi la
@@ -460,16 +467,90 @@
 
 \section{Tècniques}
 
-A la l'apartat anterior hem explicat quines pèrdues de senyal trobem al JPEG, i
+A la l'apartat \ref{sec:perdues} hem explicat quines pèrdues de senyal
+trobem al JPEG, i
 quins són els marges de llibertat que tenim a l'hora d'intentar recuperar la
 imatge original. Des de l'aparició de l'estàndard JPEG que s'han proposat
 mètodes per a millorar la descompressió mitjançant algorismes més complexes que
-el convencional.
+el convencional. Hem procurat estudiar l'estat de l'art del JPEG, i classificar
+els mètodes més interessants segons les tècniques en què es basen.
+
+\subsection{Projecció sobre l'espai de quantització}
+
+Aquesta tècnica no millora les imatges en si, però sí que la utilitzen a molts
+mètodes. Podem diferenciar els mètodes en dos grans grups: els de \emph{dins la
+cadena de descodificació}, i els de {post-processat}. Els primers consideren
+tota la informació del JPEG, i els segons treballen exclusivament a partir de la
+imatge obtinguda després d'una descodificació convencional. Els primers tenen
+un avantatge clar sobre els altres, ja que poden accedir als intervals de
+quantització, als plans abans de reescalar-los i a la codificació del color.
+
+Considerem la descodificació d'un pla del JPEG, no necessàriament amb el mètode
+convencional. Si al recodificar el pla amb
+les mateixes taules de quantització obtenim la mateixa versió codificada que
+l'original, vol dir que hem aplicat una descodificació \emph{no destructiva}.
+Els mètodes de \emph{post-processat} això no poden garantir-ho, ja que
+per començar desconeixen les taules de quantització.
+
+Alguns mètodes de descodificació basen la seva estimació d'imatge en
+filtres espacials per obtenir lluminositat espacial, a vegades fins i tot en
+processos iteratius. Per assegurar-se que la seva imatge no divergeix de la
+informació del JPEG, duen a terme projeccions sobre l'espai de quantització.
+Quan tenen el nou pla espacial estimat, li fan la transformada DCT per blocs de
+8x8, com a la codificació JPEG. Els coeficients obtinguts $z_i$ els comparen
+amb els
+intervals de quantització (eq. \ref{eqn:quant-intervals}), i si se'n surten,
+els consideren al límit de
+l'interval.
+\[ z'_i = \begin{cases}
+    (\hat y_i - 0.5) Q_i & z_i < (\hat y_i - 0.5) Q_i \\
+    (\hat y_i + 0.5) Q_i & z_i > (\hat y_i + 0.5) Q_i \\
+    z_i & \textrm{altrament}
+    \end{cases} \]
 
-Tot i que a dia d'avui ja s'han proposat molts mètodes diversos, podem
-classificar-los segons el tipus de tècnica en què es basen.
+Aquest mètode es coneix a la literatura amb el nom de \emph{projection to QCS}
+(Quantization Constraint Set)\revisar{Hauríem d'introduir QCS abans?} o
+\emph{projection to the constraint space},
+i s'utilitza als mètodes iteratius de \cite{froment2005}, \cite{orourke1995},
+\cite{robertson2004}, i en general a qualsevol mètode iteratiu. \revisar{Per
+garantir convergència? Evitar divergència?}
+
+\subsection{Coeficients com a variables aleatòries}
+
+La descodificació convencional d'agafar el punt mig de l'interval de
+quantització per cada coeficient compleix la \emph{no destrucció}. Aquest cas
+resulta de considerar l'interval com una variable aleatòria
+uniforme.\revisar{uniforma?} En aquest cas el punt mig és el millor estimador de
+la variable.
+
+Alguns articles suggereixen altres distribucions de probabilitat. Per exemple,
+a \cite{trianta2003} proposen utilitzar una v.a. exponencial, de
+mitjana a determinar segons la imatge. A \cite{robertson2004} i a
+\cite{queiroz1998}
+mencionen utilitzar una v.a. Laplaciana. El primer, basant-la amb la imatge a
+descodificar. El segon, basant-la amb estadístiques d'altres
+imatges.\revisar{Com ho fa exactament el primer?}
+
+\subsection{Segmentació i suavitzat}
+
+Un dels efectes que més es distingeixen a les imatges codificades amb una
+relació de compressió alta (més denses) és el de blocs. A les zones de baixes
+freqüències, on en prou feines s'haurien de distingir canvis de lluminositat,
+apareixen discontinuitats segons el patró de blocs del JPEG. El cas més extrem
+és quan a zones amb freqüències baixes es conserva només el
+coeficient de component contínua (el primer, en ordre Zig Zag).
+
+Aquest tipus d'efecte de blocs es pot arreglar amb un simple suavitzat, per
+exemple amb un filtre de Gauss. Així, el que fan alguns algorismes
+(\revisar{quins})
+consisteix en distingir les zones de baixes freqüències,
+i aplicar-los el suavitzat.
+
+Alguns algorismes més complexos suggereixen processar les zones d'altes
+freqüències de manera especial.
 
 \subsection{POCS - Projecció sobre conjunts convexos}
+\label{sec:POCS}
 
 \printindex