Before going to Olot...
authorviric@llimona
Thu, 06 Dec 2007 23:59:38 +0100
changeset 230 67b1f6da1d87
parent 229 c3814dedd423
child 232 721e24aa7c18
Before going to Olot...
doc/cited.bib
doc/memoria.tex
--- a/doc/cited.bib	Mon Dec 03 13:44:27 2007 +0100
+++ b/doc/cited.bib	Thu Dec 06 23:59:38 2007 +0100
@@ -19,6 +19,14 @@
     year = "1992"
 }
 
+@book{eyeandbrain,
+    title = "Eye and Brain -- The Psychology of Seeing",
+    author = "Richard L. Gregory",
+    publisher = "Princeton University Press",
+    year = "1997",
+    edition = "5th"
+}
+
 @misc{libjpeg,
     organization = "The Independent JPEG's Group",
     author = "The Independent JPEG's Group",
@@ -367,3 +375,11 @@
     month = "September",
     year = "1992"
 }
+
+@book{kou1995,
+    title = "Digital Image Compression -- Algorithms and Standards",
+    author = "Weidong Kou",
+    edition = "1st",
+    publisher = "Kluwer Academic Publishers",
+    year = "1995"
+}
--- a/doc/memoria.tex	Mon Dec 03 13:44:27 2007 +0100
+++ b/doc/memoria.tex	Thu Dec 06 23:59:38 2007 +0100
@@ -20,6 +20,8 @@
 \author{Lluís Batlle}
 \date{\today}
 
+\setcounter{tocdepth}{1}
+
 % For in-paragraph lists of a), b), c).
 \newcommand{\subcite}[1]{\emph{#1)}}
 
@@ -50,14 +52,13 @@
 
 \tableofcontents
 % TODO: Remove subsections
-% TODO: Add Bibliography
 
 \chapter*{Introducció}
 
 La codificació d'imatges JPEG ofereix unes imatges bastant fidels amb molt pocs
 bits per pícsel, reduint en bona mesura la mida dels fitxers d'imatge i els
-seus temps de transferència per internet.Per això ha estat molt popular en la publicació d'imatges
-per internet, i ho continua sent en l'ambient domèstic degut a les càmeres
+seus temps de transferència per Internet. Per això ha estat molt popular en la publicació d'imatges
+per Internet, i ho continua sent en l'ambient domèstic degut a les càmeres
 digitals. Per
 tant, qualsevol esforç a millorar la descodificació d'aquestes imatges té molt
 valor.
@@ -88,16 +89,26 @@
 \revisar{Això ve de la Viquipèdia. Cal trobar una font millor.}
 El 1986 es va crear un comitè per establir un estàndard de codificació
 d'imatges de to-continu (continous tone), per exemple, fotografies. Aquest
-comitè tenia el nom de Joint Photographic Experts Group, i el 1992 va aprovar
-l'estàndard conegut arreu amb el nom de JPEG. Va decidir tant la
-codificació de la imatge, efectivament amb les sigles del grup, i també un
-format fitxer que contindria la informació codificada
-(JIF - JPEG Interchange Format).
-Aquest primer JIF tenia algunes mancances que al llarg de la història s'han
-suplit amb nous formats, com JFIF i EXIF. La majoria de gent sol anomenar-los
-indistintament ``Fitxers JPEG'',
-o bé amb la reducció a tres lletres obligada sota
-sistemes MS-DOS, ``Fitxers JPG''.
+comitè tenia el nom de Joint Photographic Experts Group, i el 1992 la ISO i el
+CCITT van aprovar
+l'estàndard conegut arreu amb el nom de JPEG (ISO/IEC IS 10918-1 - ITU-T
+Recommendation T.81)\footnote{\url{http://www.jpeg.org/jpeg/index.html}}.
+Van decidir tant la
+codificació de la imatge, efectivament amb les sigles del grup, i en paral·lel
+també es va decidir un
+format de fitxer que contindria la informació codificada
+(JFIF - JPEG File Interchange Format), ja que en informàtica sovint convé
+conservar informació en fitxers. Aquest format de fitxer permetia especificar-hi
+diferents espais de
+color al JPEG, i el delmat d'alguns dels plans.
+Amb les càmeres digitals que directament
+conservaven les fotografies en JPEG i en fitxers, es va creure que la informació
+que permetia conservar el JFIF no era suficient. Va aparèixer l'EXIF, que
+permet conservar molta més informació de les circumstàncies de la fotografia
+(estat de la càmera, sensors, etc.). La majoria de gent sol anomenar els
+contenidors JFIF i EXIF indistintament ``Fitxers JPEG'',
+o bé amb la reducció a tres lletres obligada sota sistemes MS-DOS,
+``Fitxers JPG''.
 
 Dins l'estàndard s'hi inclouen dues formes diferents de codificar la imatge: amb
 pèrdues (\emph{lossy}) o sense (\emph{lossless}). Aquesta última no ha
@@ -145,7 +156,7 @@
 Des de l'establiment de l'estàndard JPEG com a norma ISO (10918-1) el 1994, i de
 la donació al domini públic de la implementació coneguda amb el nom de
 \texttt{libjpeg} \cite{libjpeg}, en versió 5 el mateix any, aquesta codificació
-ha esdevingut molt popular. Als inicis d'internet, JPEG oferia la major densitat
+ha esdevingut molt popular. Als inicis d'Internet, JPEG oferia la major densitat
 d'informació per a transmetre fotografies. La publicació de l'estàndard va
 alliberar l'ús de qualsevol restricció per patents, i la velocitat de procés de
 la \texttt{libjpeg} va permetre introduir suport pel format en moltíssimes
@@ -153,7 +164,7 @@
 personals.
 
 L'alta densitat de la informació JPEG, junt amb les restriccions d'ample de
-banda dels primers anys de l'internet popular, van fer que la gent publiqués les
+banda dels primers anys de l'Internet popular, van fer que la gent publiqués les
 seves fotografies en aquest format. Els límits en espai d'emmagatzematge també
 van causar que la gent conservés les fotografies només en aquest format. Aquesta
 corrent continua fins ara, tot i que els amples de banda i l'espai per
@@ -171,8 +182,8 @@
 millor densitat d'informació que el JPEG, però malgrat que han passat set anys
 des de la seva definició, no ha guanyat popularitat. Parlant exclusivament de la
 codificació d'imatges de to continu, el comitè garanteix que no està subjecte a
-patents. Però la seva implementació lliure més popular, \texttt{jasper} 
-\revisar{Referència al jasper?}
+patents. Però la seva implementació lliure més popular,
+\texttt{jasper}\footnote{\url{http://www.ece.uvic.ca/~mdadams/jasper/}}
 conté molt de càlcul i ús de memòria, fins i tot pels ordinadors
 personals actuals. Tampoc hi ha implementacions en maquinari per part dels
 fabricants de càmeres digitals. Tanmateix, per posar un exemple popular, el
@@ -205,7 +216,6 @@
 \section{Les pèrdues al JPEG}
 \label{sec:perdues}
 
-\revisar{mal sagnat?}
 El process de codificació segueix els següents passos:
 \begin{compactenum}
 \item Dividir la imatge en plans de color.
@@ -252,11 +262,12 @@
 cons distingeixen millor. Les freqüències de llum concretes s'avenen amb les de
 màxima sensibilitat pels nostres tres cons, de manera que amb la pantalla es
 produeix, pràcticament, l'excitació independent dels nostres cons, donant la
-sensació d'un espai de color continu. Un color groc, per exemple, degut a les
-responstes freqüencials dels cons, excita parcialment el con blau i el con verd.
-La pantalla enganya els cons, excitant concretament una mica el blau, i també
-una mica el verd.
-\revisar{No puc citar res per això?}
+sensació d'un espai de color continu (\cite{eyeandbrain}).
+Un color groc, per exemple, degut a les
+responstes freqüencials dels cons, excita parcialment el con vermell
+i el con verd.
+La pantalla enganya els cons, excitant concretament una mica els vermell,
+i també una mica els verd.
 
 El nostre ull distingeix variacions d'intensitat de llum millor que variacions
 de color.
@@ -271,14 +282,19 @@
 \figura{rapids-nens-rgb2ycc.pdf}{
 \label{fig:cb-rgb2ycc} Plans RGB, i els anàlogs en YCbCr}
 
-L'ull humà és menys sensible a defectes als plans Cb i Cr (ref ?), per tant, en
-la majoria de codificadors JPEG veurem que aquests plans es delmen. La majoria
+Quan parlem d'imatges amb formes reconeixedores, aquestes formes són molt
+importants a l'hora d'evaluar la percepció de la imatge. En bona part les formes
+vindran determinades per la lluminositat general, i per això l'ull humà el
+considerem
+menys sensible a defectes als plans Cb i Cr (\cite{eyeandbrain}). Per tant, en
+la majoria de codificadors JPEG veurem que aquests plans es delmen i
+es quantitzen a menys qualitat. La majoria
 de càmeres digitals delmen per maquinari a 2:1 només en horitzontal, mentre que
 molts codificadors per programari delmen a 2:1 tant en horitzontal com en
 vertical.
 
-\figura{rapids-nens-cb-rescale.pdf}{
-\label{fig:cb-rescale} Delmat de l'original de 2:1, i posterior
+\figura{rapids-nens-cb-rescale.pdf}{\label{fig:cb-rescale}Delmat
+de l'original de 2:1, i posterior
 reescalat de la versió delmada.}
 
 A la descodificació, cal reescalar els plans delmats a la seva mida original,
@@ -415,8 +431,6 @@
 \emph{soroll de quantització}. Té diverses conseqüències visibles a la imatge
 descodificada de manera convencional i en podem veure una classificació a
 la Figura \ref{fig:quant-problems}.
-\revisar{Cal comentar l'efecte de \emph{suavitzat} del senyal? (menyspreu
-d'altes freqüències)}
 
 \figura{lena-blocking.pdf}{
 \label{fig:quant-problems} A l'esquerra, pla de lluminositat de la Lena de 256x256 píxels, a
@@ -577,8 +591,11 @@
 \ref{fig:qcs-margins} el marge pot ser bastant gran segons les taules de
 quantització.
 Els mètodes de \emph{post-processat} no poden garantir aquesta coherència amb el
-JPEG ja que desconeixen les taules de quantització. \revisar{Citar-ne alguns,
-perquè fan falta.}
+JPEG ja que desconeixen les taules de quantització. Per exemple, amb programes
+informàtics
+de retoc fotogràfic es sol utilitzar el filtrat
+Gaussià sel·lectiu per a eliminar
+soroll, entre d'altres, de la descodificació JPEG convencional.
 
 \begin{figure}[!htp]
 \centering
@@ -894,9 +911,19 @@
 Alguns dels algorismes que col·locarem a les baules són configurables.
 Això vol dir que el resultat que donin dependrà tant de l'entrada de
 l'algorisme (provinent de la baula anterior) com de la configuració dels seus
-paràmetres interns.
+paràmetres interns. Podem veure l'aspecte de l'aplicació mentre intentem
+restaurar un JPEG de poca qualitat de la imatge Lena a la Figura
+\ref{fig:qjpeg-screenshot}. Per entendre els noms d'algorismes que s'hi
+distingeixen, podem consultar la Taula \ref{tab:algnames}, pàg.
+\pageref{tab:algnames}.
 
-\subsection{Desquantització i IDCT 2D de cada pla}
+\figura{images/projecteui.png}{\label{fig:qjpeg-screenshot}Mostra de les
+principals finestres del programa. La principal, amb versions de la imatge a
+restaurar. A sota, la cadena de descompressió. A dalt a la dreta, de fons, la
+configuració de la baula de Froment. A l'esquerra, configuració de la baula
+Hcontrast.}
+
+\section{Desquantització i IDCT 2D de cada pla}
 
 \begin{description}
 \item[entrada] els intervals de quantització d'un pla de la imatge ocdificada
@@ -914,7 +941,7 @@
 primer coeficient de cada bloc) com variables aleatòries exponencials d'igual
 mitjana, com a \cite{trianta2003}. L'usuari pot configurar-ne la mitjana.
 
-\subsection{Restaurador de pla}
+\section{Restaurador de pla}
 
 \begin{description}
 \item[entrada] els intervals de quantització d'un pla de la imatge ocdificada
@@ -971,7 +998,7 @@
 resultats competitius amb altres algorismes, segons el tipus de imatge i el
 tipus de codificació JPEG.
 
-\subsection{Escalador dels plans}
+\section{Escalador dels plans}
 
 \begin{description}
 \item[entrada] $n$ plans independents, possiblement alguns delmats
@@ -1050,7 +1077,7 @@
 només tindrem en compte la meitat esquerra descodificada
 de 4 pícsels d'amplada.
 
-\subsection{Canvi de plans de color}
+\section{Canvi de plans de color}
 
 \begin{description}
 \item[entrada] $n>1$ plans de color
@@ -1270,7 +1297,7 @@
 c) & d)
 \end{tabular}
 \caption{\label{fig:masxa}Codificació/descodificació d'una fotografia
-publicada a internet, de 256x256 pícsels.
+publicada a Internet, de 256x256 pícsels.
 \subcite{a}publicació original,
 \subcite{b}descodificació amb Froment \cite{froment2005} (pesos de Froment, 5 iteracions, mida
 inicial de pas 1),
@@ -1288,7 +1315,7 @@
 l'ha utilitzat per a conservar i distribuir imatges artificials com dibuixos o
 logotips. En aquests casos el soroll ocasionat per la pèrdua d'informació pot
 ser més molest que en una fotografia codificada amb els mateixos paràmetres.
-Fins el 1996 els dibuixos artificials a través d'internet estaven dominats pel
+Fins el 1996 els dibuixos artificials a través d'Internet estaven dominats pel
 format GIF, ja que fins el 1995 aquest format va ser de lliure ús. Des de
 llavors, l'empresa Unisys va decidir fer complir la patent inherent en el GIF. A
 més, el format GIF limitava la imatge a 256 colors d'una paleta de 24 bits, amb
@@ -1321,7 +1348,7 @@
 a) & b)
 \end{tabular}
 \caption{\label{fig:dibuix-logo}\subcite{a}Logotip d'un campionat del món
-codificat amb JPEG, agafat d'internet
+codificat amb JPEG, agafat d'Internet
 (\logocopamon). \subcite{b}Recuperació segons una baula
 d'\emph{O'Rourke} (7 passos, mida de pas de 1, $T=0,1$) per canal, i
 \emph{LumScaler}.
@@ -1335,9 +1362,9 @@
 \includegraphics[width=4cm]{images/stimpy-3orourke-5steps.png} \\
 a) & b)
 \end{tabular}
-\caption{\label{fig:dibuix-stimpy}\subcite{a}Personatge dibuixat (Stimpy, de John
-Kricfalusi)
-codificat amb JPEG, agafat d'internet
+\caption{\label{fig:dibuix-stimpy}\subcite{a}Personatge dibuixat
+(Stimpy, de John Kricfalusi)
+codificat amb JPEG, agafat d'Internet
 (\stimpy). \subcite{b}Recuperació segons una baula
 d'\emph{O'Rourke} (5 passos, mida de pas de 1, $T=0,1$) per canal, i
 \emph{LumScaler}.
@@ -1357,9 +1384,7 @@
 
 \appendix
 
-\chapter{Fonaments matemàtics}
-
-\section{Transformada DCT}
+\chapter{Transformada DCT}
 
 \label{sec:dct}
 
@@ -1371,7 +1396,7 @@
 coeficients AC (de freqüència diferent de zero). Mitjançant la transformada
 IDCT (\emph{Inverse DCT}) podem tornar a recuperar els valors dels pícsels,
 donats els 64 valors del domini DCT. Per a un bloc de pícsels $s_{xy}$
-($x,y=0,1,\ldots,7$), la FDCT està establerta com:
+($x,y=0,1,\ldots,7$), la FDCT està establerta com (\cite{kou1995}):
 \[
 S_{uv} = \frac{1}{4} C_u C_v \sum_{x=0}^7 \sum_{y=0}^7 s_{xy}
 \cos \frac{(2x+1)u\pi}{16}
@@ -1416,7 +1441,8 @@
 convencional.
 Pas per pas, evaluem segons el contrast 
 local per cada punt $i,j$ de la imatge. El contrast el valorem segons
-Michelson: \revisar{Ho he tret de la wikipedia}
+Michelson: \revisar{Ho he tret de la wikipedia. Crec que és prou conegut com per
+no citar-ne cap font.}
 \newcommand{\Itext}[1]{I_{\text{#1}}}
 \[ C(i,j) = \frac{\Itext{max}(i,j) - \Itext{min}(i,j)}{\Itext{max}(i,j)
 + \Itext{min}(i,j)} \]