Biopsychology.org

English

Artículos Casos   Libros Apuntes Otros  

Análisis del Comportamiento Verbal Articulatorio en Conversaciones Grupales Espontáneas. E. Barrull, 1992. (esteban@biopsychology.org)

Atrás Arriba Siguiente

 

Apéndice C: Análisis digital(1).

Muestreo digital
Error de cuantificación
Teorema del muestreo (Frecuencia de Nyquist)
Transformada discreta de Fourier
Cálculo espectral

El problema de la varianza

Muestreo digital

La captura de la información acústica se realiza mediante transductores analógicos y requiere la realización de un muestreo digital o conversión analógica/digital (A/D), antes de poder procesar la información por medios informáticos.

El muestreo digital es un proceso de muestreo, a intervalos de tiempo regulares, consistente en la obtención del valor que toma la señal original en un momento dado. El parámetro fundamental del muestreo digital es el intervalo de muestreo seg., o su equivalente frecuencia de muestreo Hz. Lógicamente, cuanto menor sea , mayor número de valores obtendremos de la señal, y viceversa.

El resultado de dicho muestreo es la obtención de una serie discreta ordenada {xr} = {x0x1x3, ..., xr, ... }, en la que el índice r indica la posición de orden temporal del valor xr. Así, el valor de la señal original, en el tiempo , se representa por xr. A la señal continua de origen la llamamos serie temporal continua, mientras que a la serie obtenida por el muestreo la llamamos serie temporal discreta.


Fig. 1 Muestreo de una serie temporal continua


Error de cuantificación

La precisión en el valor de la muestra depende del rango de valores enteros que maneje el conversor A/D utilizado. Este rango viene dado por 2k, donde k es el número de bits en que se exprese el valor de la muestra. Como que la muestra sólo puede tomar uno de los 2k valores posibles, cuanto mayor sea k, mayor será la aproximación del valor muestral al valor de la señal original.

Para k mucho mayor que uno, la relación entre la señal y el ruido debido a la cuantificación viene dada aproximadamente por

(Hess, 1983, pag. 15).

Así, en nuestra investigación usamos un convertidor A/D con una resolución de 14 bits, por lo que, para un valor de k = 14 bits, tenemos aproximadamente una relación S/R 84 dB, lo que representa un valor más que suficiente para nuestros propósitos (hay que recordar que el dB es una unidad logarítmica).



Teorema del muestreo (Frecuencia de Nyquist)


¿Hasta que punto la señal continua puede reconstruirse exactamente a partir de sus muestras? Teóricamente, si la frecuencia de muestreo es superior a dos veces la máxima frecuencia presente en la señal continua, es posible reconstruirla con toda exactitud a partir de las muestras obtenidas. Decimos teóricamente porque en la práctica, el error de cuantificación y la longitud finita de los registros impiden esta reconstrucción exacta.


Por lo tanto, para que el muestreo sea correcto, deberemos escoger la frecuencia de muestreo de tal forma que

Normalmente se suele filtrar la señal de entrada para eliminar las frecuencias que no pueden ser detectadas mediante el proceso del muestreo, debido a la limitación de los aparatos. Además es conveniente que la frecuencia de muestreo sea muy superior al doble de la frecuencia máxima de la señal puesto que ningún filtro pasa bajos puede eliminar completamente las frecuencias superiores a la frecuencia de corte. En la práctica se suele usar una frecuencia de muestreo de entre 5 a 10 veces la frecuencia de corte del filtro pasa bajos.

 

Transformada discreta de Fourier

La definición de la transformada de Fourier para series temporales continuas x(t), (ver Apéndice A), ya no nos sirve para una serie temporal discreta {xr}. Supongamos que obtenemos, mediante muestreo, una serie temporal discreta {xr} de N items, con un intervalo de muestreo dado por seg. La longitud temporal de la serie será seg.


Se define la transformada discreta de Fourier (DFT, Discrete Fourier Transform) de la serie de N items {xr} como

es decir, la DFT de la serie discreta {xr}, es una nueva serie (compleja) {Xk} de igual número de items. La frecuencia correspondiente a la componente Xk es .

Por otro lado, la transformada discreta de Fourier inversa (IDFT, Inverse Discrete Fourier Transform) está dada por

Conviene hacer notar que aunque la serie discreta {xr} es una aproximación a la serie continua x(t), las relaciones entre las DFT e IDFT son exactas y no aproximadas.

 

Cálculo espectral(2)

Aunque la función de densidad espectral de una señal se defina como la transformada de Fourier de su función de autocorrelación, es posible demostrar que no es necesario calcular la función de autocorrelación para obtener la función de densidad espectral, ya que esta puede estimarse directamente a partir de la DFT de la serie muestreada.

Como habíamos visto (ver Apéndice B), la función de densidad espectral de un proceso aleatorio venia dada por una función continua real de la frecuencia S(). Para series discretas, dicha función se convierte en una serie discreta Sk donde el índice k determina la frecuencia asociada . Se demuestra que el cálculo de Sk viene dado por

donde Xk es la DFT k-ésima de la serie discreta {xr} y Xk* es su compleja conjugada. Así pues, no es necesario hallar la función de autocorrelación de la serie {xr} para obtener su densidad espectral, nos basta con el cálculo de su DFT.

Para el cálculo del espectro de una serie discreta {xr} de N muestras, sólo es necesario hallar los N/2+1 primeros componentes de la DFT puesto que, si calculamos valores de la DFT para k = N/2 + l, es decir, para valores mayores que N/2, tenemos que

ahora bien, dado que

para cualquier valor entero de r, obtenemos que

En otras palabras, los valores del espectro se repiten cíclicamente a partir de k > N/2, con lo que no nos pueden aportar ninguna información sobre sus frecuencias correspondientes. La última frecuencia sobre la que podemos obtener información espectral será o .

 

El problema de la varianza(3)

Si T es suficientemente grande entonces , sin embargo, la varianza de ST() no es pequeña. De hecho, para cualquier T

Luego, no es un buen estimador de por grande que hagamos T. Así pues, el espectro de potencia de un proceso x(t) no puede determinarse a partir de una sola muestra por larga que sea. Para reducir la varianza de la estimación, debemos aceptar una versión alisada de , o sea, debemos sacrificar en resolución.

Alisado de estimaciones espectrales(4)

Una forma de eliminarlas, o de al menos reducir su amplitud, consiste en suavizar o alisar el espectro, de forma que en lugar de S(w) lo que representamos es un espectro alisado Sa(w),

donde W es una variable auxiliar y W(W) es una función de ponderación (ventana espectral) que satisface(5)

 

La precisión de una medida espectral depende de la anchura de banda efectiva Be (Hz) de la medida y de la duración T (segundos) del registro. Si s es la desviación tipo de una medida de densidad espectral cuyo valor medio es m, entonces

suponiendo que las características del espectro no varían bruscamente a lo largo de intervalos de frecuencia del orden 1/T. Para la mayor parte de los cálculos prácticos

de forma que

es decir, la desviación tipo de la medida es aproximadamente igual a su valor medio, lo que significa que la precisión es muy escasa. Por otra parte, incrementar la duración T de los registros (para incluir más datos en el análisis) no mejora en nada las cosas. Esto es sorprendente, pues lógicamente sería de esperar que al analizar más datos consiguiéramos mayor precisión. La razón es sencilla: al aumentar T disminuye la anchura de banda espectral y el producto (anchura de banda) x (duración del registro) es constante, con lo que conseguimos mejor resolución pero la misma precisión.

Lo único que podemos hacer para mejorar la precisión de nuestros resultados es promediar estimaciones adyacentes en el espectro alisado . Tomamos como primera estimación de para la frecuencia . Una forma sencilla de mejorar esta estimación es calcular la media aritmética de varias estimaciones adyacentes. Por ejemplo, si Sk(wk) es el resultado de promediar tres valores adyacentes de S(wk), entonces

y, en general, si se promedian 2n+1 valores adyacentes, obtenemos

La anchura de banda equivalente es ahora , en lugar de , de modo que

con lo que la precisión estadística no se puede mejorar más que a costa de la capacidad de resolución frecuencial (capacidad de distinguir frecuencias próximas).

Transformada rápida de Fourier (FFT)(6)

A partir de 1965 contamos con un algoritmo de calculo para la transformada discreta de Fourier que permite su implementación con un ahorro considerable de tiempo a la par que un aumento en la precisión de los cálculos. Aunque existen variaciones del algoritmo fundamental, nosotros utilizaremos el más simple que se caracteriza por restringir la longitud de la serie a transformar a una potencia de 2. Es decir, que

Para el cálculo de una transformada de Fourier (DFT) en modo directo de una serie de longitud N, tendríamos que realizar N2 multiplicaciones complejas y N(N-1) sumas complejas, mientras que con el más simple de los algoritmos FFT solo hay que hacer N/2 log2 N multiplicaciones complejas y N log2 N sumas complejas

Longitud de la sucesión N log2 N Relación
4 2 2
16 4 4
64 6 10,7
256 8 32
1024 10 102,4



Procesos no estacionarios(7)

Durante toda nuestra exposición metodológica hemos estado suponiendo que los procesos analizados eran estacionarios, es decir, que sus características eran independientes del tiempo t. Necesitábamos hacer esta suposición para poder progresar en el desarrollo de la teoría; como aproximación es aceptable en la mayor parte de los casos prácticos. Pero fácilmente se plantea la pregunta: dada una función aleatoria, ¿es una muestra de un proceso estacionario?

En ningún caso podremos responder a esta pregunta con certeza (a no ser que dispongamos de infinitas funciones muestra de duración infinita), porque siempre tendremos la duda de que si las características del proceso habrían variado si hubiésemos observado una muestra más, o si hubiésemos observado las mismas muestras durante más tiempo. El mejor criterio práctico es seguramente el sentido común. Por definición, si un proceso tiene principio i/o fin, es no estacionario. No obstante, si su duración es suficientemente larga (en comparación con el periodo de su componente espectral de frecuencia más baja), puede ser razonable aceptar que el proceso es estacionario durante la mayor parte de su existencia.

Aunque un proceso no sea estacionario, pero tengamos razones para suponer la existencia de fases estables distintas dentro del proceso, lo que se puede hacer es dividir el proceso en secciones lo suficientemente pequeñas como para que estas correspondieran completamente dentro de alguna de las fases. Entonces, cada una de ellas puede ser considerada como aproximadamente estacionaria, es decir, como un tramo de duración finita cortado de una muestra de un proceso estacionario (distinto para cada muestra).

Esta es la estrategia básica que nos permite acomodar el análisis hecho al estudio de los procesos vibrantes del comportamiento verbal.

Resumen de las etapas esenciales de al determinación de espectros mediante análisis digital(8)

1. Hacer una estimación del margen de frecuencias de interés y de la máxima frecuencia de las componentes espectrales significativas contenidas en las señales que van a ser analizadas. Si fuera necesario, filtrar las señales para eliminar las componentes de frecuencia excesivamente alta.

2. Elegir un intervalo de muestreo (segundos) apropiado, con la precaución de que la frecuencia de Nyquist 1/2 (Hz) sea mayor que la máxima frecuencia presente en la señal, y al menos el doble de la máxima frecuencia de interés.

3. Elegir la precisión requerida.

4. Hacer una estimación de la resolución frecuencial requerida, y de ahí especificar la máxima anchura de banda Be (Hz) permisible.

5. Calcular la longitud T de los registros requerida (excluyendo los ceros añadidos) mediante la fórmula

6. Determinar el número de datos que han de obtenerse muestreando cada registro.

7. Hallar el número de ceros L, necesario para alargar la longitud (N+L) de cada sucesión de datos hasta la siguiente potencia de 2.

8. Determinar el número (2n+1) de estimaciones espectrales adyacentes que han de ser promediadas (con igual ponderación) para dar la anchura de banda requerida según la fórmula

9. Ejecutar el proceso de cálculo de la siguiente forma:

(i) Generar la serie temporal discreta {ur}, r=0, 1, 2, ..., (N-1), muestreando los registros con un intervalo de muestreo .

(ii) Calcular el valor medio

(iii) Generar una nueva serie, promediando a 0 {ur} para eliminar posibles perturbaciones de un valor alto en la frecuencia 0.

{xr} tiene valor medio nulo y ha sido extendida con L ceros adicionales.

(iv) Calcular la DFT de la serie {xr} según la fórmula

donde k=0, 1, 2, ..., (N+L-1).

(v) Calcular los coeficientes espectrales {Sk} requeridos formando el producto

para k=0, 1, 2, ...,(N+L-1).

(vi) Si es necesario, calcular la correspondiente función de autocorrelación (circular) Rk, tomando la IDFT de {Sk}:

r=0, 1, 2, ..., (N+L-1).

10. Calcular las estimaciones del espectro continuo mediante la fórmula

[donde ]. A continuación se ajusta el margen de k para que vaya de

siendo . Esto se hace para limitar el margen de a , ya que es la frecuencia de Nyquist y cuando . Con este cambio no se pierde información, pues los valores de Sk en el margen no son más que repetición de los valores del margen .

11. Modificar estas estimaciones para dar cuenta de los ceros adicionales multiplicando por el factor de corrección ,

donde .

12. Llevar a cabo un alisado final calculando el valor medio de estimaciones espectrales adyacentes mediante la fórmula

donde

para . Los valores depara se suponen nulos. El resultado es un conjunto de ordenadas que da una gráfica alisada de en función de en el margen de frecuencias (rad/s).

 

Notas:

1. (Casacuberta, cap. 3, pp 37-43), (Papoulis, cap. 5, pp 141-), (Newland, cap. 10-11)

2. (Papoulis, pp 279, 281)

3. (Papoulis, p 281)

4. (en capitulo 11, Newland), (Papoulis, p 281 ...)

5. (ver Newland, p 107)

6. (Newland, p 163 ss), (Stearns, cap. 3)

7. (Newland, p 210 ss.)

8. (Newland, pp 143-145)

 

© Biopsychology.org, 1998-2006

 
Última actualización:
22/12/07