Més revisió de la memòria.
authorviric@mandarina
Fri, 28 Nov 2008 00:33:19 +0000
changeset 246 90ee7d3a52d8
parent 245 f06d2f3b8d43
child 247 20f497435c50
Més revisió de la memòria.
doc/memoria.tex
--- a/doc/memoria.tex	Thu Nov 27 19:14:32 2008 +0000
+++ b/doc/memoria.tex	Fri Nov 28 00:33:19 2008 +0000
@@ -760,22 +760,23 @@
 
 \section{\index{MAP}Maximum A Posteriori}
 
-Aquesta tècnica és similar a la de POCS, ja que és iterativa, i té projeccions
+Aquesta tècnica és similar a la de POCS en els aspectes de que és iterativa, i té projeccions
 sobre conjunts convexes. Estrictament, a POCS els mètodes venen
 definits pels conjunts convexes involucrats. Amb la tècnica de MAP el que es
-busca és la minimització d'una funció.
+busca és la maximització d'una funció determinada, considerant la informació que sabem
+de la imatge. Aquesta funció avalua les imatges segons diferents mesures preses de la imatge, i hauria de donar un valor alt per mesures que considerem d'imatge més correcta, i un valor baix per mesures que considerem d'imatge incorrecta. Per exemple, podem establir una mesura de si hi ha poques o moltes diferències entre el color dels pícsels entre blocs. Com més diferències hi hagi entre aquests pícsels, més baix és el valor que retorna la funció.
 
-En general l'objectiu és minimitzar la funció sempre i quan mantenim els
+En el cas del JPEG, l'objectiu és maximitzar la funció sempre i quan mantenim els
 coeficients dins els intervals de quantització. Si $\hat z$ és la nostra imatge
-estimada a la descodificació, i $Z$ és el conjunt d'imatges amb coeficients dins
-el QCS,
-\[ \hat z = \min_{z \in Z} P(z) \]
+estimada a la descodificació, $Z$ és el conjunt d'imatges amb coeficients dins
+el QCS, i $P(z)$ una funció que mesura la imatge tal com hem explicat abans:
+\[ \hat z = \max_{z \in Z} P(z) \]
 
-Essent $P(z)$ derivable \revisar{condicions?},
-podem trobar una funció gradient per acostar-nos al valor mínim . A
-\cite{orourke1995} i a \cite{robertson2004} utilitzen un model de camp
-aleatori de Huber-Màrkov. A \cite{froment2005} utilitzen una versió adaptada
-de la norma de Variació Total (TV).
+Els mètodes que hem vist utilitzen funcions $P(z)$ dues vegades derivables, i
+minimitzen mitjançant el \emph{mètode del gradient}. A \cite{orourke1995} i a
+\cite{robertson2004} utilitzen com a funció un model de camp aleatori de Huber-Màrkov. A
+\cite{froment2005} utilitzen una versió adaptada de la norma de Variació Total
+(TV).
 
 \section{Altres mètodes de recuperació de plans}
 
@@ -792,19 +793,19 @@
 \section{Recuperació del color basada en lluminositat}
 
 Tal com hem vist a l'apartat \ref{sec:plans-color},
-el JPEG aïlla tota la informació de color en dos
+el JPEG aïlla tota la informació de tonalitat de color en dos
 plans que es codifiquen a menys qualitat que el de lluminositat. Totes les
 tècniques que hem presentat fins ara es poden utilitzar per recuperar qualsevol
 dels plans del JPEG, però a la literatura també trobem tècniques que utilitzen
 la correlació entre lluminositat i color per a recuperar millor els plans
-cromàtics.
+cromàtics, sovint delmats fins i tot.
 
 A \cite{coudoux2004} detecten les cantonades del pla de lluminositat, i les
 utilitzen amb un algorisme adaptatiu
 per corregir els vessaments de color deguts a l'escalat. A \cite{sugita2006}
 ponderen els canvis d'intensitat dels plans de color d'acord amb els canvis
-d'intensitat del pla de lluminositat. Aquest l'últim l'hem adaptat al delmat del
-JPEG, explicat en detall a l'Apèndix \ref{sec:colorponderat}.
+d'intensitat del pla de lluminositat, per a imatges YUV en general. Aquest l'últim l'hem adaptat
+al delmat del JPEG, explicat en detall a l'Apèndix \ref{sec:colorponderat}.
 
 \chapter{Programari}
 % TODO: Add program captures: cadena de descodificació, algunes imatges
@@ -838,14 +839,13 @@
 del programa:
 \begin{itemize}
 \item Només permet manipular una imatge JPEG alhora, junt amb versions
-recuperades o que teníem guardades a disc.
+restaurades o que teníem guardades a disc.
 \item Tot el procés i emmagatzematge intern de la informació de les imatges
-es realitza en coma flotant (\texttt{float} en C), per evitar pèrdues per
-arrodoniment als càlculs.
+es realitza en coma flotant de 32 bits (\texttt{float} en C), per evitar masses
+pèrdues per arrodoniment als càlculs.
 \item El programa requereix que l'usuari entengui la part de descodificació JPEG
-que hem explicat al primer apartat, ja que
-l'usuari determinarà com es realitzaran diversos passos d'aquesta
-descodificació.
+que hem explicat al primer apartat, ja que és ell qui determinarà com es realitzaran diversos
+passos d'aquesta descodificació.
 \end{itemize}
 
 L'aplicació inclou implementacions dels algorismes de
@@ -862,17 +862,16 @@
 ofereixen una bona idea del millor resultat que l'algorisme permet assolir.
 Creiem que
 alguns articles presenten molt poca millora (valorant subjectivament a ull nu)
-com per a tenir-los en compte en una
-implementació.
+com per a tenir-los en compte en una implementació.
 \item L'algorisme ha de permetre millorar imatges en general. Alguns només
-milloren les zones de baixes freqüències, o fins i tot només serveixen per a
-dibuixos artificials en comptes de fotografies.
+milloren determinades zones de molt baixes freqüències, o fins i tot només
+serveixen per a dibuixos artificials en comptes de fotografies.
 \item L'efecte de l'algorisme s'ha de caracteritzar per pocs paràmetres, i
 aquests han de tenir una relació monòtona amb els seus efectes.
 En la majoria de casos l'usuari no
-entendrà internament algorisme, i en variarà intuïtivament els paràmetres. Si
+entendrà algorisme, i en variarà intuïtivament els paràmetres. Si
 l'usuari no pot entendre l'efecte que té cada paràmetre, segurament refusarà
-manipular-lo, o fins i tot utilitzar-lo.
+manipular-ne aquests paràmetres, o fins i tot no el tindrà en compte a l'hora de restaurar.
 \end{itemize}
 
 Podem classificar els algorismes segons la seva funció. A la nostra aplicació
@@ -895,7 +894,7 @@
 \emph{cadena de descodificació} amb les baules buides, similar al de la Figura
 \ref{fig:cadena}. Segons on es troben de la cadena, les baules fan referència
 a una part o altra del procés de descodificació. A cada tipus de baula li
-correspon un tipus d'algorisme. Considerem aquests quatre tipus:
+correspon un tipus d'algorisme. Considerem només aquests quatre tipus:
 \begin{itemize}
 \item Desquantització i transformada inversa de cada pla.
 \item Restaurador de pla
@@ -924,9 +923,9 @@
 
 \figura{images/projecteui.png}{\label{fig:qjpeg-screenshot}Mostra de les
 principals finestres del programa. La principal, amb versions de la imatge a
-restaurar. A sota, la cadena de descompressió. A dalt a la dreta, de fons, la
+restaurar. A sota, la cadena de descodificació. A dalt a la dreta, de fons, la
 configuració de la baula de Froment. A l'esquerra, configuració de la baula
-Hcontrast.}
+HContrast.}
 
 \section{Desquantització i IDCT 2D de cada pla}
 
@@ -975,13 +974,13 @@
 propostes d'articles, inclou un
 senzill algorisme de millora de les zones amb textura desenvolupat per nosaltres
 mateixos que aprofita la naturalesa del programa: combinar i encadenar
-tècniques. L'explicarem més endavant a l'apartat \ref{sec:hcontrast}.
+tècniques. L'explicarem més endavant a l'Apèndix \ref{sec:hcontrast}.
 Finalment, la implementació actual també inclou uns mòduls especials
 que ens permeten alterar els
 plans mitjançant una altra aplicació informàtica. Són els següents:
 \begin{itemize}
 \item \emph{salvar pla a disc}. Si l'usuari col·loca aquesta funció dins
-'duna baula de
+d'una baula de
 restauració de pla, al aplicar la descodificació definida per la cadena, el pla
 d'entrada de la baula s'escriurà a disc. Llavors l'usuari pot utilitzar el seu
 programa preferit de manipulació fotogràfica aplicant les tècniques que cregui
@@ -1011,15 +1010,13 @@
 \end{description}
 
 Tal com hem explicat a l'apartat \ref{sec:plans-color}, alguns dels plans de
-color de la imatge poden haver estat delmats abans de codificar
-independentment els
-plans (DCT 2D i quantització). La imatge final descodificada ha de tenir tots
-els plans de color de la mateixa mida. Per això al descodificar
-ens cal interpolar els plans delmats, de manera que adquireixin les
-seves dimensions originals. Cal recordar que el codificador delmarà els plans
-dividint
-les dimensions originals per un número enter, i els delmats més comuns són 4:2:2
-i 4:2:0.
+color de la imatge poden haver estat delmats abans de codificar independentment
+els plans (DCT 2D i quantització). La imatge final descodificada ha de tenir
+tots els plans de color de la mateixa mida. Per això al descodificar ens cal
+interpolar dels punts dels plans delmats, de manera que obtinguem les seves
+dimensions originals. Cal recordar que el codificador delmarà els plans
+dividint les dimensions originals per un número enter, i els delmats més comuns
+són 4:2:2 i 4:2:0.
 
 Al programa hem implementat tres tipus d'escaladors. El primer simplement
 duplica els punts per aconseguir les dimensions desitjades. Per exemple, si
@@ -1077,10 +1074,10 @@
 l'encarregat de retallar
 els últims blocs en horitzontal i vertical per a aconseguir la imatge final de
 la mida que toca. Així, si una imatge mesura 124 pícsels d'amplada,
-s'haurà codificat amb 16 blocs de 8 pícsels, però de l'últim
+s'haurà codificat amb 16 blocs de 8 columnes, però de l'últim
 bloc de cada fila (codificada d'esquerra a dreta)
 només tindrem en compte la meitat esquerra descodificada
-de 4 pícsels d'amplada.
+de 4 columnes d'amplada.
 
 \section{Canvi de plans de color}
 
@@ -1139,10 +1136,10 @@
 
 En aquest anàlisi no ens hem basat gaire amb mesures matemàtiques, ja que
 precisament un dels objectius que ens havíem proposat a l'hora de fer aquest
-programari consisteix en permetre a l'usuari comparar resultats variant
+programari consisteix en permetre a l'usuari comparar resultats a ull nu, variant
 paràmetres manualment. L'usuari dels algorismes, en aquest cas, provarà
-d'aplicar diversos mètodes i a anar variant els paràmetres, fins a obtenir
-una imatge que el acontenti pel seu objectiu.
+d'aplicar diversos mètodes i a anar variant els seus paràmetres, fins a obtenir
+una imatge que l'acontenti pel seu objectiu.
 Els articles ofereixen mesures objectives dels
 resultats de diversos algorismes, i no sempre hi ha una correspondència clara
 entre aquestes mesures i l'opinió d'individuals. A l'avaluació hi
@@ -1150,8 +1147,8 @@
 paisatges), la
 resolució (de quina distància es miraran els punts de la imatge), i
 l'objectiu de la restauració (impressió, postprocessat). Les mesures objectives
-que hem analitzat no tenen en consideració aquests paràmetres, i per tant no ens
-són suficients per avaluar els resultats dels algorismes. I és amb això que
+que hem vist no tenen en consideració tots paràmetres, i per tant no ens
+semblen suficients per avaluar útilment els resultats dels algorismes. I en part així
 justifiquem l'existència d'una aplicació informàtica com la que presentem. En
 aquest apartat, quan comparem algorismes, ens referirem a les opinions
 d'uns pocs individus després d'haver escollit manualment tant els algorismes com
@@ -1164,13 +1161,13 @@
 i poc detall de textures.
 Partint d'una descodificació convencional, els algorismes iteratius
 no-adaptatius de \emph{Froment}, \emph{O'Rourke},
-i \emph{Robertson} són els que produeixen millors resultats.
+i \emph{Robertson} són els que ens han donat millors resultats.
 El de Trianta, com que funciona de manera
-adaptativa segons informació espacial, no distingeix bé els blocs de
-cantonades reals de la imatge. Els de \emph{Nosratinia} i
+adaptativa segons informació espacial, no distingeix bé els blocs del JPEG
+de blocs de cantonades reals de la imatge. Els de \emph{Nosratinia} i
 \emph{HP} suavitzen excessivament la
-imatge, comparat amb els tres primers que hem mencionat. Podeu veure un exemple
-de baixa qualitat a la Figura \ref{fig:lena40g}.
+imatge, comparant amb els tres primers que hem mencionat. Podeu veure un exemple
+d'aquestes imatges a baixa qualitat a la Figura \ref{fig:lena40g}.
 
 \begin{figure}[!htp]
 \centering
@@ -1198,7 +1195,7 @@
 algorismes que suavitzen la imatge, permet recuperar bé moltes cantonades
 accentuant-les. Cal mencionar que aquest algorisme no manté els coeficients dins
 l'espai de quantització, i per això després d'aplicar-lo, recomanem una
-\emph{projecció sobre el QCS}. Podeu veure un exemple de compressió a molt baixa
+\emph{projecció sobre el QCS}. Podeu veure un exemple del seu ús en compressió a molt baixa
 qualitat a la Figura \ref{fig:lena10g}.
 
 \begin{figure}[!htp]
@@ -1239,7 +1236,7 @@
 \section{Efecte d'ones superior al de blocs}
 
 Quan els plans es codifiquen a la qualitat sovint oferta per defecte als
-programes de manipulació gràfica ($\approx 75$ a la \texttt{libjpeg}), els
+programes de manipulació gràfica ($75$ a la \texttt{libjpeg}), els
 efectes d'ones sovint superen els de blocs. En aquests casos,
 \emph{Nosratinia} i \emph{HP} no
 els eliminen del tot, i els algorismes iteratius de \emph{Froment},
@@ -1256,12 +1253,12 @@
 cadena de descodificació. Si es tracta d'una codificació d'alta qualitat (amb
 intervals de quantització prou petits), aquest algorisme no ens suavitzarà zones
 d'altes freqüències. Això sí, caldrà aplicar una projecció sobre el QCS abans de
-l'escalador per a obtenir una versió possiblement més fidel a la codificació
+l'escalador per a obtenir una versió més fidel a la codificació
 original.
 
 Respecte als plans de color, l'escalador de color que pondera segons la
 lluminositat ens dóna els millors resultats dels tres que hi ha implementats en
-totes les imatges que hem provat, també en el cas d'alta qualitat si és que hi
+totes les imatges que hem provat, també en el cas de JPEG d'alta qualitat si és que hi
 ha delmat de color. Podem veure un exemple a la Figura \ref{fig:nenufar75}
 
 \begin{figure}[!htp]
@@ -1301,7 +1298,7 @@
 \includegraphics[width=6cm]{images/masxa-crop-froment-5-orourke-lum-hcontrast-0,5.png} \\
 c) & d)
 \end{tabular}
-\caption{\label{fig:masxa}Codificació/descodificació d'una fotografia
+\caption{\label{fig:masxa}Descodificació d'una fotografia
 publicada a Internet, de 256x256 pícsels.
 \subcite{a}publicació original,
 \subcite{b}descodificació amb Froment \cite{froment2005} (pesos de Froment, 5 iteracions, mida
@@ -1322,7 +1319,7 @@
 ser més molest que en una fotografia codificada amb els mateixos paràmetres.
 Fins el 1996 els dibuixos artificials a través d'Internet estaven dominats pel
 format GIF, ja que fins el 1995 aquest format va ser de lliure ús. Des de
-llavors, l'empresa Unisys va decidir fer complir la patent inherent en el GIF. A
+llavors, l'empresa Unisys va decidir fer respectar la patent inherent en el GIF. A
 més, el format GIF limitava la imatge a 256 colors d'una paleta de 24 bits, amb
 un dels colors representant la transparència (útil en la composició d'imatges
 en una web). Quan Internet es va popularitzar, poc programari suportava el
@@ -1391,10 +1388,10 @@
 
 En aquest document presentem tant els problemes de la codificació JPEG com
 l'estat de l'art de la seva descodificació, convertint-se en el document ideal
-pels catalans que vulguin introduir-se en aquest camp.
+pels catalano-parlants que vulguin introduir-se en aquest camp.
 El programa informàtic representa una
-plataforma còmoda per acostar les investigacions en aquest camp al
-públic més o menys profà. Nosaltres hem decidit aturar el desenvolupament de
+plataforma còmoda per acostar les investigacions en aquest camp a
+públic més profà. Nosaltres hem decidit aturar el desenvolupament de
 l'aplicació de manera que ens permetés elaborar aquesta investigació, i alhora
 usuaris ja se'n poguessin beneficiar. A partir d'aquest punt hem considerat
 aquest projecte acabat, i hem publicat l'aplicació a Internet. Això no vol dir
@@ -1403,28 +1400,28 @@
 considerar la resposta dels usuaris.
 
 Hem publicat l'aplicació amb C++ sota la llicència GPL versió
-2\footnote{\url{http://www.fsf.org}}; \revisar{la web de la GPLv2} en part
+2\footnote{\url{http://www.gnu.org/licenses/old-licenses/gpl-2.0.html}}; en part
 perquè volem que la seva evolució continuï lliure i pública, i en part perquè
 utilitzem
-la llibreria Qt\footnote{\url{http://trolltech.com/}, també lliure sota la
-llicència GPLv2}
+la llibreria Qt\footnote{\url{http://trolltech.com/}, que ens exigeix seguir
+la llicència GPLv2.}
 per a la interfície
 gràfica. Aquesta tecnologia ens permet publicar una base de codi única per a
 Linux/X-Windows, Macintosh OS X i Microsoft Windows. A més el programa està
 preparat per a ser traduït a diferents idiomes, havent publicat de moment
 l'interfície en català, esperanto i anglès.
 
-El fet de publicar el programa ens ha permès constatar una de les principals
-consideracions del seu disseny: a l'usuari l'interessa més comparar les
-diferents restauracions a cop d'ull, independent de qualsevol mesura matemàtica.
-I diferents usuaris (amb les seves circumstàncies) solen arribar a diferents
-restauracions, cadascú preferint la seva. Entre els comentaris dels usuaris
-i alguns investigadors hi preval el de sorpresa i alegria de que per fi
-existeixi un programa com aquest. Per tant, considerem que hem assolit els
-objectius de fer arribar tecnologia de restauració JPEG recent
-dels laboratoris
-als usuaris, i hem recopilat l'estat de l'art d'aquest camp amb la plusvàlua
-d'informació pràctica gràcies a les pròpies implementacions d'algorismes.
+Abans de la publicació del programa, l'hem mostrat a un petit nombre
+d'individus que ens han corroborat consideracions del seu disseny: els
+interessava més comparar les diferents restauracions a cop d'ull, independent
+de qualsevol mesura matemàtica.  I diferents usuaris (amb les seves
+circumstàncies) solen arribar a diferents restauracions, cadascú preferint la
+seva. Entre els comentaris dels usuaris i alguns investigadors hi preval el de
+sorpresa i alegria de que per fi existeixi un programa com aquest. Per tant,
+considerem que hem assolit els objectius de fer arribar tecnologia de
+restauració JPEG recent dels laboratoris als usuaris, i hem recopilat l'estat
+de l'art d'aquest camp amb la plusvàlua de resultats pràctics gràcies a les
+pròpies implementacions d'algorismes.
 
 % Parlar amb els dels articles
 % Acompliment d'objectius
@@ -1491,10 +1488,10 @@
 aquest tipus de zones. Ens basem en que si suavitzem una
 zona d'altes freqüències, el seu contrast es veurà reduït. Per cada punt de la
 imatge, considerem que si hem
-reduït molt el contrast local, val més recuperar el punt de la descompressió
-convencional.
-Pas per pas, avaluem segons el contrast 
-local per cada punt $i,j$ de la imatge. El contrast el valorem segons
+reduït molt el contrast local respecte la descodificació convencional,
+val més utilitzar el valor del pícsel d'aquesta descodificació simple.
+Avaluem tota la imatge segons el contrast local per cada punt $i,j$ de la imatge.
+El contrast el valorem segons
 Michelson: \revisar{Ho he tret de la Viquipèdia. Crec que és prou conegut com per
 no citar-ne cap font.}
 \newcommand{\Itext}[1]{I_{\text{#1}}}