Análisis del Comportamiento Verbal Articulatorio en Conversaciones Grupales Espontáneas. E. Barrull, 1992. (esteban@biopsychology.org)
|
Apéndice C: Análisis digital(1).
La captura de la información acústica se realiza mediante transductores analógicos y requiere la realización de un muestreo digital o conversión analógica/digital (A/D), antes de poder procesar la información por medios informáticos. El muestreo digital es un proceso de muestreo, a intervalos de tiempo regulares, consistente en la obtención del valor que toma la señal original en un momento dado. El parámetro fundamental del muestreo digital es el intervalo de muestreo seg., o su equivalente frecuencia de muestreo Hz. Lógicamente, cuanto menor sea , mayor número de valores obtendremos de la señal, y viceversa. El resultado de dicho muestreo es la obtención de una serie discreta ordenada {xr} = {x0, x1, x3, ..., xr, ... }, en la que el índice r indica la posición de orden temporal del valor xr. Así, el valor de la señal original, en el tiempo , se representa por xr. A la señal continua de origen la llamamos serie temporal continua, mientras que a la serie obtenida por el muestreo la llamamos serie temporal discreta. Fig. 1 Muestreo de una serie temporal continua La precisión en el valor de la muestra depende del rango de valores enteros que maneje el conversor A/D utilizado. Este rango viene dado por 2k, donde k es el número de bits en que se exprese el valor de la muestra. Como que la muestra sólo puede tomar uno de los 2k valores posibles, cuanto mayor sea k, mayor será la aproximación del valor muestral al valor de la señal original. Para k mucho mayor que uno, la relación entre la señal y el ruido debido a la cuantificación viene dada aproximadamente por (Hess, 1983, pag. 15). Así, en nuestra investigación usamos un convertidor A/D con una resolución de 14 bits, por lo que, para un valor de k = 14 bits, tenemos aproximadamente una relación S/R 84 dB, lo que representa un valor más que suficiente para nuestros propósitos (hay que recordar que el dB es una unidad logarítmica).
Normalmente se suele filtrar la señal de entrada para eliminar las frecuencias que no pueden ser detectadas mediante el proceso del muestreo, debido a la limitación de los aparatos. Además es conveniente que la frecuencia de muestreo sea muy superior al doble de la frecuencia máxima de la señal puesto que ningún filtro pasa bajos puede eliminar completamente las frecuencias superiores a la frecuencia de corte. En la práctica se suele usar una frecuencia de muestreo de entre 5 a 10 veces la frecuencia de corte del filtro pasa bajos.
Transformada discreta de Fourier La definición de la transformada de Fourier para series temporales continuas x(t), (ver Apéndice A), ya no nos sirve para una serie temporal discreta {xr}. Supongamos que obtenemos, mediante muestreo, una serie temporal discreta {xr} de N items, con un intervalo de muestreo dado por seg. La longitud temporal de la serie será seg.
es decir, la DFT de la serie discreta {xr}, es una nueva serie (compleja) {Xk} de igual número de items. La frecuencia correspondiente a la componente Xk es . Por otro lado, la transformada discreta de Fourier inversa (IDFT, Inverse Discrete Fourier Transform) está dada por
Conviene hacer notar que aunque la serie discreta {xr} es una aproximación a la serie continua x(t), las relaciones entre las DFT e IDFT son exactas y no aproximadas.
Cálculo espectral(2) Aunque la función de densidad espectral de una señal se defina como la transformada de Fourier de su función de autocorrelación, es posible demostrar que no es necesario calcular la función de autocorrelación para obtener la función de densidad espectral, ya que esta puede estimarse directamente a partir de la DFT de la serie muestreada. Como habíamos visto (ver Apéndice B), la función de densidad espectral de un proceso aleatorio venia dada por una función continua real de la frecuencia S(). Para series discretas, dicha función se convierte en una serie discreta Sk donde el índice k determina la frecuencia asociada . Se demuestra que el cálculo de Sk viene dado por donde Xk es la DFT k-ésima de la serie discreta {xr} y Xk* es su compleja conjugada. Así pues, no es necesario hallar la función de autocorrelación de la serie {xr} para obtener su densidad espectral, nos basta con el cálculo de su DFT. Para el cálculo del espectro de una serie discreta {xr} de N muestras, sólo es necesario hallar los N/2+1 primeros componentes de la DFT puesto que, si calculamos valores de la DFT para k = N/2 + l, es decir, para valores mayores que N/2, tenemos que ahora bien, dado que para cualquier valor entero de r, obtenemos que
En otras palabras, los valores del espectro se repiten cíclicamente a partir de k > N/2, con lo que no nos pueden aportar ninguna información sobre sus frecuencias correspondientes. La última frecuencia sobre la que podemos obtener información espectral será o .
El problema de la varianza(3) Si T es suficientemente grande entonces , sin embargo, la varianza de ST() no es pequeña. De hecho, para cualquier T Luego, no es un buen estimador de por grande que hagamos T. Así pues, el espectro de potencia de un proceso x(t) no puede determinarse a partir de una sola muestra por larga que sea. Para reducir la varianza de la estimación, debemos aceptar una versión alisada de , o sea, debemos sacrificar en resolución. Alisado de estimaciones espectrales(4) Una forma de eliminarlas, o de al menos reducir su amplitud, consiste en suavizar o alisar el espectro, de forma que en lugar de S(w) lo que representamos es un espectro alisado Sa(w), donde W es una variable auxiliar y W(W) es una función de ponderación (ventana espectral) que satisface(5)
La precisión de una medida espectral depende de la anchura de banda efectiva Be (Hz) de la medida y de la duración T (segundos) del registro. Si s es la desviación tipo de una medida de densidad espectral cuyo valor medio es m, entonces suponiendo que las características del espectro no varían bruscamente a lo largo de intervalos de frecuencia del orden 1/T. Para la mayor parte de los cálculos prácticos de forma que es decir, la desviación tipo de la medida es aproximadamente igual a su valor medio, lo que significa que la precisión es muy escasa. Por otra parte, incrementar la duración T de los registros (para incluir más datos en el análisis) no mejora en nada las cosas. Esto es sorprendente, pues lógicamente sería de esperar que al analizar más datos consiguiéramos mayor precisión. La razón es sencilla: al aumentar T disminuye la anchura de banda espectral y el producto (anchura de banda) x (duración del registro) es constante, con lo que conseguimos mejor resolución pero la misma precisión. Lo único que podemos hacer para mejorar la precisión de nuestros resultados es promediar estimaciones adyacentes en el espectro alisado . Tomamos como primera estimación de para la frecuencia . Una forma sencilla de mejorar esta estimación es calcular la media aritmética de varias estimaciones adyacentes. Por ejemplo, si Sk(wk) es el resultado de promediar tres valores adyacentes de S(wk), entonces y, en general, si se promedian 2n+1 valores adyacentes, obtenemos La anchura de banda equivalente es ahora , en lugar de , de modo que con lo que la precisión estadística no se puede mejorar más que a costa de la capacidad de resolución frecuencial (capacidad de distinguir frecuencias próximas). Transformada rápida de Fourier (FFT)(6) A partir de 1965 contamos con un algoritmo de calculo para la transformada discreta de Fourier que permite su implementación con un ahorro considerable de tiempo a la par que un aumento en la precisión de los cálculos. Aunque existen variaciones del algoritmo fundamental, nosotros utilizaremos el más simple que se caracteriza por restringir la longitud de la serie a transformar a una potencia de 2. Es decir, que Para el cálculo de una transformada de Fourier (DFT) en modo directo de una serie de longitud N, tendríamos que realizar N2 multiplicaciones complejas y N(N-1) sumas complejas, mientras que con el más simple de los algoritmos FFT solo hay que hacer N/2 log2 N multiplicaciones complejas y N log2 N sumas complejas
Durante toda nuestra exposición metodológica hemos estado suponiendo que los procesos analizados eran estacionarios, es decir, que sus características eran independientes del tiempo t. Necesitábamos hacer esta suposición para poder progresar en el desarrollo de la teoría; como aproximación es aceptable en la mayor parte de los casos prácticos. Pero fácilmente se plantea la pregunta: dada una función aleatoria, ¿es una muestra de un proceso estacionario? En ningún caso podremos responder a esta pregunta con certeza (a no ser que dispongamos de infinitas funciones muestra de duración infinita), porque siempre tendremos la duda de que si las características del proceso habrían variado si hubiésemos observado una muestra más, o si hubiésemos observado las mismas muestras durante más tiempo. El mejor criterio práctico es seguramente el sentido común. Por definición, si un proceso tiene principio i/o fin, es no estacionario. No obstante, si su duración es suficientemente larga (en comparación con el periodo de su componente espectral de frecuencia más baja), puede ser razonable aceptar que el proceso es estacionario durante la mayor parte de su existencia. Aunque un proceso no sea estacionario, pero tengamos razones para suponer la existencia de fases estables distintas dentro del proceso, lo que se puede hacer es dividir el proceso en secciones lo suficientemente pequeñas como para que estas correspondieran completamente dentro de alguna de las fases. Entonces, cada una de ellas puede ser considerada como aproximadamente estacionaria, es decir, como un tramo de duración finita cortado de una muestra de un proceso estacionario (distinto para cada muestra). Esta es la estrategia básica que nos permite acomodar el análisis hecho al estudio de los procesos vibrantes del comportamiento verbal. Resumen de las etapas esenciales de al determinación de espectros mediante análisis digital(8)
|
|