Some more doc on techniques
authorviric@llimona
Fri, 09 Nov 2007 12:19:27 +0100
changeset 209 79a15788ef38
parent 208 b73581e219fa
child 210 241e8a9137e6
Some more doc on techniques
doc/cited.bib
doc/memoria.tex
--- a/doc/cited.bib	Sun Oct 28 20:48:36 2007 +0100
+++ b/doc/cited.bib	Fri Nov 09 12:19:27 2007 +0100
@@ -139,6 +139,7 @@
     volume = "27",
 }
 
+% Selective Gaussian
 @article{queiroz1998,
     author = "Ricardo L. de Queiroz",
     title = "Processing JPEG-compressed Images and Documents",
@@ -150,4 +151,208 @@
     volume = "7"
 }
 
+@article{chen2001,
+    author = "Tao Chen and Hong Ren and Bin Qiu",
+    title = "Adaptive Postfiltering of Transform Coefficients for the Reduction
+        of Blocking Artifacts",
+    year = "2001",
+    month = "May",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "594-602",
+    number = "5",
+    volume = "11"
+}
 
+% TODO: Aquest té imatges INCREIBLES.
+@article{alfahoum2001,
+    author = "Amjed S. Al-Fahoum and Ali M. Reza",
+    title = "Combined Edge Crispiness and Statitstical Differencing for
+        Deblocking JPEG Compressed Images",
+    year = "2001",
+    month = "September",
+    journal = "IEEE Transactions on Image Processing",
+    pages = "1288-1298",
+    number = "9",
+    volume = "10"
+}
+
+@article{liu2002,
+    author = "Shizhong Liu and Alan C. Bovik",
+    title = "Efficient DCT-Domain Blind Measurement and Reduction of Blocking
+        Artifacts",
+    year = "2002",
+    month = "December",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "1139-1149",
+    number = "12",
+    volume = "12"
+}
+
+@article{gao2002,
+    author = "Wenfeng Gao and Coskun Mermer and Yongmin Kim",
+    title = "A De-Blocking Algorithm and a Blockiness Metric for Highly
+        Compressed Images",
+    year = "2002",
+    month = "December",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "1150-1159",
+    number = "12",
+    volume = "12"
+}
+
+@article{pham2005,
+    author = "Tuan Q. Pham and Lucas J. van Vliet",
+    title = "Blocking artifacts removal by a hybrid filter method",
+    year = "2005",
+    month = "June",
+    journal = "11th Annual Conf. of the Advanced School for Computing and
+        Imaging",
+    pages = "372-377"
+}
+
+% Selective Gaussian
+@article{kim1999,
+    author = "Sung Deuk Kim and Jaeyoun Yi and Hyun Mun Kim and Jong Beom Ra",
+    title = "A Deblocking Filter with Two Separate Modes in Block-Based Video Coding",
+    year = "1999",
+    month = "February",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "156-160",
+    volume = "9",
+    number = "1"
+}
+
+% Interessant!
+% Aconsegueixen molt bons resultats
+% Treballen a domini freqüencial
+@article{trianta2002,
+    author = "George A. Triantafyllidis and Dimitrios Tzovaras and Michael
+        Gerassimos Strintzis",
+    title = "Blocking Artifact Detection and Reduction in Compressed Data",
+    year = "2002",
+    month = "October",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "877-887",
+    volume = "12",
+    number = "10"
+}
+
+@article{liew2004,
+    author = "Alan W.-C. Liew and Hong Yan",
+    title = "Blocking Artifacts Suppression in Block-Coded Images Using
+        Overcomplete Wavelet Representation",
+    year = "2004",
+    month = "April",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "450-461",
+    volume = "14",
+    number = "4"
+}
+
+@article{lee1998,
+    author = "Y. L. Lee and H. C. Kim and H. W. Park",
+    title = "Blocking Effect Reduction of JPEG Images by Signal Adaptive
+        Filtering",
+    year = "1998",
+    month = "February",
+    journal = "IEEE Transactions on Image Processing",
+    pages = "229-234",
+    volume = "7",
+    number = "2"
+}
+
+@article{yang1993,
+    author = "Yoingyi Yang and Nikolas P. Galatsanos and Aggelos K. Katsaggelos",
+    title = "Regularized Reconstruction to Reduce Blocking Artifacts of Block
+        Discrete Cosine Transform Compressed Images",
+    year = "1993",
+    month = "December",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "421-432",
+    volume = "3",
+    number = "6"
+}
+
+@article{jung1998,
+    author = "J. Jung and M. Antonini and M. Barlaud",
+    title = "Optimal JPEG Decoding",
+    year = "1998",
+    month = "October",
+    journal = "International Conference on Image Processing 1998. ICIP 98. Proceedings.",
+    pages = "410-414",
+    volume = "1"
+}
+
+@article{kwon2002,
+    author = "Kee-Koo Kwon and Byung-Ju Kim and Suk-Hwan Lee and Jong-Won Lee
+        and Seong-Geun Kwon and Kuhn-Il Lee",
+    title = "Postprocessing Algorithm in Block-Based Codec Images Using Wavelet
+        Transform and Adaptive MLP",
+    year = "2002",
+    journal = "International Conference on Multimedia and Expo 2002. ICME '02. Proceedings.",
+    pages = "165-168",
+    volume = "1"
+}
+
+@article{yang1997,
+    author = "Yoingyi Yang and Nikolas P. Galatsanos",
+    title = "Removal of Compression Artifacts Using Projections onto Convex Sets
+        and Line Process Modeling",
+    year = "1998",
+    month = "October",
+    journal = "IEEE Transactions on Image Processing",
+    pages = "1345-1357",
+    volume = "6",
+    number = "10"
+}
+
+@article{weer2002,
+    author = "Chaminda Weerasinghe and Alan Wee-Chung Liew and Hong Yan",
+    title = "Artifact Reduction in Compressed Images Based on Region Homogeneity
+        Constraints Using the Projection Onto Convex Sets Algorithm",
+    year = "2002",
+    month = "October",
+    journal = "IEEE Transactions on Image Processing",
+    pages = "891-897",
+    volume = "12",
+    number = "10"
+}
+
+@article{coudoux2004,
+    author = "François-Xavier Coudoux and Marc Gazalet and Patrick Corlay",
+    title = "An Adaptive Postprocessing Technique for the Reduction of Color
+        Bleeding in DCT-Coded Images",
+    year = "2004",
+    month = "January",
+    journal = "IEEE Transactions on Circuits and Systems for Video Technology",
+    pages = "891-897",
+    volume = "14",
+    number = "1"
+}
+
+@article{sugita2006,
+    author = "Hiroshi Sugita and Akira Taguchi",
+    title = "Chrominance Signal Interpolation of YUV 4:2:0 Format Color Images",
+    year = "2006",
+    journal = "Electronics and Communications in Japan, Part 3",
+    volume = "89",
+    number = "9"
+}
+
+@article{nosratinia2002,
+    author = "Aria Nosratinia",
+    title = "Enhancement of JPEG-Compressed Images by Re-application of JPEG",
+    year = "2002",
+    month = "October",
+    journal = "Internet Publication",
+}
+
+@article{hp2004,
+    author = "Ramin Samadani and Arvind Sundararajan and Amir Said",
+    title = "Deringing and Deblocking DCT Compression Artifacts with Efficient
+        Shifted Transforms",
+    year = "2004",
+    month = "October",
+    journal = "IEEE International Conference on Image Processing (ICIP),
+    Singapore"
+}
--- a/doc/memoria.tex	Sun Oct 28 20:48:36 2007 +0100
+++ b/doc/memoria.tex	Fri Nov 09 12:19:27 2007 +0100
@@ -5,6 +5,7 @@
 \usepackage{babel}
 \usepackage{units}
 \usepackage{amsmath}
+\usepackage{amssymb}
 \usepackage{subfigure}
 \usepackage{icomma}
 \usepackage{url}
@@ -204,6 +205,7 @@
 
 \subsubsection{Plans de color i delmat}
 
+\label{sec:plans-color}
 Les nostres pantalles solen utilitzar tres plans per a determinar la imatge a
 mostrar en color: vermell, verd i blau. El nostre ull és bastant sensible a
 qualsevol variació en aquests plans - precisament són els colors que els nostres
@@ -490,7 +492,8 @@
 les mateixes taules de quantització obtenim la mateixa versió codificada que
 l'original, vol dir que hem aplicat una descodificació \emph{no destructiva}.
 Els mètodes de \emph{post-processat} això no poden garantir-ho, ja que
-per començar desconeixen les taules de quantització.
+per començar desconeixen les taules de quantització.\revisar{Citar-ne alguns,
+perquè fan falta.}
 
 Alguns mètodes de descodificació basen la seva estimació d'imatge en
 filtres espacials per obtenir lluminositat espacial, a vegades fins i tot en
@@ -508,24 +511,32 @@
     z_i & \textrm{altrament}
     \end{cases} \]
 
-Aquest mètode es coneix a la literatura amb el nom de \emph{projection to QCS}
+Aquest mètode es coneix a la literatura amb el nom de
+\index{QCS}\emph{projection to QCS}
 (Quantization Constraint Set)\revisar{Hauríem d'introduir QCS abans?} o
 \emph{projection to the constraint space},
 i s'utilitza als mètodes iteratius de \cite{froment2005}, \cite{orourke1995},
 \cite{robertson2004}, i en general a qualsevol mètode iteratiu. \revisar{Per
 garantir convergència? Evitar divergència?}
 
+Alguns articles proposen projectar sobre \index{NQCS}NQCS
+(\emph{Narrow Quantization
+Constraint Set}), que consisteix en agafar un marge més estret que el de $[-0,5,
+0,5]$ al voltant del centre de l'interval de quantització. A \cite{liew2004},
+per exemple, consideren millors els resultats amb un marge de $[-0,3, 0,3]$.
+
 \subsection{Coeficients com a variables aleatòries}
 
 La descodificació convencional d'agafar el punt mig de l'interval de
 quantització per cada coeficient compleix la \emph{no destrucció}. Aquest cas
 resulta de considerar l'interval com una variable aleatòria
-uniforme.\revisar{uniforma?} En aquest cas el punt mig és el millor estimador de
+uniforme. En aquest cas el punt mig és el millor estimador de
 la variable.
 
 Alguns articles suggereixen altres distribucions de probabilitat. Per exemple,
 a \cite{trianta2003} proposen utilitzar una v.a. exponencial, de
-mitjana a determinar segons la imatge. A \cite{robertson2004} i a
+mitjana a determinar segons la imatge. A \cite{robertson2004},
+\cite{trianta2002} i a
 \cite{queiroz1998}
 mencionen utilitzar una v.a. Laplaciana. El primer, basant-la amb la imatge a
 descodificar. El segon, basant-la amb estadístiques d'altres
@@ -539,18 +550,116 @@
 apareixen discontinuitats segons el patró de blocs del JPEG. El cas més extrem
 és quan a zones amb freqüències baixes es conserva només el
 coeficient de component contínua (el primer, en ordre Zig Zag).
+\revisar{Ho il·lustrem?}
 
 Aquest tipus d'efecte de blocs es pot arreglar amb un simple suavitzat, per
 exemple amb un filtre de Gauss. Així, el que fan alguns algorismes
 (\revisar{quins})
 consisteix en distingir les zones de baixes freqüències,
-i aplicar-los el suavitzat.
+i aplicar-los el suavitzat. A \cite{chen2001},
+\cite{alfahoum2001}, \cite{pham2005}, \cite{trianta2003},
+utilitzen filtres 2D simples; a \cite{lee1998},
+\cite{kim1999} i \cite{queiroz1998} fan servir filtres adaptatius 2D;
+a \cite{gao2002} i a \cite{liew2004}
+fan servir filtres 1D; i a \cite{liu2002}
+fan servir interpolació lineal sobre la component contínua..
 
 Alguns algorismes més complexos suggereixen processar les zones d'altes
-freqüències de manera especial.
+freqüències de manera especial. A \cite{chen2001} i
+\cite{liu2002} fan servir un filtre amb molt
+poc pes dels punts del voltant; i a \cite{alfahoum2001}, \cite{pham2005} i
+\cite{trianta2003} fan servir filtres direccionals. 
+
+\subsection{\index{POCS}POCS - Projecció sobre conjunts convexos}
+
+Els mètodes basats en POCS solen donar molts bons resultats, i apareixen a la
+literatura des dels inicis de l'ús del JPEG. Malauradament l'algorisme és lent,
+ja que consisteix en dur a terme passos iteratius.
+
+Referint-me a l'explicació de \cite{yang1993}, assumim que les imatges $f$, representades amb un vector, són elements d'un
+espai de Hilbert $H$. Llavors, per qualsevol $f \in H$, la seva projecció $Pf$
+en un conjunt tancat convex $C \subset H$ es defineix com l'element més proper a
+$f$ dins $C$. Això és:
+\[ \| f - Pf \| = \min_{g \in C} \| f - g \| \]
+
+Considerem que la projecció $Pf$ ve determinada exclusivament per $f$ i $C$; o
+sigui, per a cada conjunt tancat convex, tenim el seu projector.
+
+Si tenim diversos $C_i \subset H$, $i = 1, 2, \cdots, m$, i igual nombre de
+projectors $P_i$ sobre $C_i$, podem veure que per qualsevol imatge inicial $f_0$
+podem obtenir una seqüència d'imatges $\{f_k\}$,
+\[ f_{k+1} = T_m T_{m-1} \cdots T_1 f_k \]
+on $T_i = I + \lambda_i ( P_i - I ), 0 < \lambda_i < 2, i = 1, 2, \cdots, m$.
+Aquesta seqüència convergeix al punt
+\[ f^* \in C_0 \triangleq \bigcap_{i=1}^{m} C_i . \]
+
+Relacionant POCS amb la millora d'imatges, el que ens cal fer és tenir un
+conjunt tancat convex $C_i$ (i el seu projector $P_i$) per cada característica
+de la imatge. Llavors, per a $m$ característiques diferents, podem trobar la
+imatge $f^*$ que millor les compleix. Iterativament, apliquem tots els
+projectors, partint de la primera aproximació a la imatge desitjada. Sovint
+aquesta primera aproximació consisteix de la descodificació convencional
+\revisar{referenciar la dec. convencional?} de JPEG.
+
+Els mètodes basats en POCS solen tenir el QCS \revisar{referenciar-lo?} com a
+conjunt tancat convex involucrat $C_1$,
+i solen presentar un altre conjunt que els
+distingeix dels altres mètodes ($m=2$). A \cite{yang1993} intenten reduir les
+discontinuitats dels punts entre blocs amb $C_2$ i a \cite{weer2002}
+utilitzen un $C_2$ basat amb prèvia classificació dels punts en regions
+homogènies de la imatge. En canvi, \cite{yang1997} incorpora 
+fins a sis conjunts per eliminar \emph{l'efecte de blocs} i amb especial
+incís \emph{l'efecte d'ones}.
+
+\subsection{\index{MAP}Maximum A Posteriori}
 
-\subsection{POCS - Projecció sobre conjunts convexos}
-\label{sec:POCS}
+Aquesta tècnica és similar a la de POCS, ja que és iterativa, i té projeccions
+sobre conjunts convexes. Estrictament, a POCS els mètodes venen
+definits pels conjunts convexes involucrats. Amb la tècnica de MAP el que es
+busca és la minimització d'una funció.
+
+En general l'objectiu és minimitzar una funció, sempre i quan mentenim els
+coeficients dins els intervals de quantització. Si $\hat z$ és la nostra imatge
+estimada a la descodificació, i $Z$ és el conjunt d'imatges amb coeficients dins
+el QCS,
+\[ \hat z = \min_{z \in Z} P(z) \]
+
+Essent $P(z)$ derivable \revisar{condicions?},
+podem trobar una funció gradient per acostar-nos a la minimització. A
+\cite{orourke1995} i a \cite{robertson2004} utilitzen un model de camp
+aleatori de Huber-Màrkov. A \cite{froment2005} utilitzen una versió adaptada
+de la norma de Variació Total (TV).
+
+\subsection{Altres mètodes de recuperació de plans}
+
+Alguns mètodes (\cite{jung1998}, \cite{kwon2002})
+utilitzen transformacions d'ondetes, ja que aquestes aporten
+informació freqüencial i espacial. Amb la primera poden distingir zones de més i
+menys textures per aplicar \emph{segmentació}, i amb la segona poden tractar els
+efectes de bloc, que estan determinats en espai.
+
+A \cite{nosratinia2002} i \cite{hp2004} utilitzen la recompressió JPEG de
+versions desplaçades de la imatge descodificada de manera convencional, fent una
+mitjana de les múltiples versions de les imatges desplaçades descodificades.
+
+\subsection{Recuperació del color basat en lluminància}
+
+Tal com hem vist a l'apartat \ref{sec:plans-color},
+el JPEG aïlla tota la informació de color en dos
+plans que es codifiquen a menys qualitat que el de lluminància. Tots les
+tècniques que hem presentat fins ara es poden utilitzar per recuperar qualsevol
+dels plans del JPEG, però a la literatura també trobem tècniques que utilitzen
+la correlació entre lluminància i color per a recuperar millor els plans
+cromàtics.
+
+A \cite{coudoux2004} detecten les cantonades del pla de lluminància, i les
+utilitzen amb un algorisme adaptatiu
+per corregir els vessaments de color deguts a l'escalat. A \cite{sugita2006}
+ponderen els canvis d'intensitat dels plans de color d'acord amb els canvis
+d'intensitat del pla de lluminància.
+
+\section{Programari}
+ 
 
 \printindex