1.2 Contexto disciplinar. En Análisis del Comportamiento Verbal Articulatorio en Conversaciones Grupales Espontáneas. E. Barrull, 1992. Tesis.

	Biopsychology.org							English
	Artículos	Casos		Libros	Apuntes	Otros

Análisis del Comportamiento Verbal Articulatorio en Conversaciones Grupales Espontáneas. E. Barrull, 1992. (esteban@biopsychology.org)

1.2 Contexto disciplinar

1.2.1 Contexto general de la investigación

1.2.2 Antecedentes próximos a nuestra investigación

Podemos situar nuestra investigación dentro del contexto de la tradición de las investigaciones del comportamiento verbal en su dimensión no-léxica o extralingüística. Es decir, todas aquellas investigaciones en las que al menos una variable o dimensión trata del comportamiento verbal sin considerar el contenido semántico del mismo.

Dividiremos la contextualización en dos partes. Una visión de conjunto de las investigaciones del comportamiento verbal extralingüístico y una revisión más detallada de las investigaciones realizadas hasta la fecha cuyo objetivo ha sido dilucidar el grado de estructuración temporal que presenta dicho comportamiento. Dichas investigaciones constituyen los antecedentes más próximos de nuestra investigación.

1.2.1 Contexto general de la investigación

La investigación del comportamiento verbal extralingüístico es el punto de encuentro de muchas corrientes e intereses dentro de la psicología. Dada la complejidad del comportamiento verbal, podríamos decir que casi todos los fenómenos psicológicos encuentran su representación en él.

Para dar una idea de la extensión de la investigación desarrollada en torno a las características del habla, excluyendo los contenidos semánticos, haremos una breve descripción de las principales líneas de investigación.

Siguiendo la clasificación de Siegman (1987) se pueden distinguir seis grupos de investigaciones, que en modo alguno se excluyen entre si. Cada una de estas líneas intenta correlacionar las propiedades físicas del habla con determinadas variables y/o procesos psicológicos:

- variables demográficas

- variables de personalidad

- procesos de percepción y atribución

- emoción y afecto

- procesos sociales

- procesos cognitivos

En el primer grupo de investigaciones encontramos aquellas que tratan de examinar la relación entre las variables sexo, edad o estrato social y las características vocales de los sujetos. En general se trata de determinar el acuerdo que se produce en los oyentes respecto a la estimación de dichas variables, así como el acierto en dichas estimaciones.

Con respecto a las variables sexo y edad, que son las más fáciles de identificar mediante la voz, el problema principal consiste en determinar las influencias debidas a diferencias fisiológicas y anatómicas, y las debidas al origen cultural, rol social, etc.

La diferencia más importante entre varones y mujeres viene dada por el tono de la voz, básicamente la frecuencia fundamental. Las mujeres tienen un tono significativamente superior al de los varones. También se han encontrado diferencias en la pronunciación, en los patrones de entonación, vacilación, etc.

En cuanto a la edad, existe acuerdo en que el tono de voz va haciéndose mas grave con la edad, en los dos sexos. No obstante, existen ciertas evidencias de que el tono puede aumentar en edades avanzadas de los varones. La explicación aún no es clara, pero se apunta a motivos de stress emocional debido a la nueva situación social que, normalmente, el varón debe afrontar (jubilación, disminución de prestigio social, etc.) (Scherer, 1981b).

Por ultimo, es ampliamente reconocido que el estrato social influencia en varias dimensiones del habla (vocabulario, sintaxis, pronunciación). Lo que ya no esta tan claro es la naturaleza de dicha influencia. Inicialmente se suponía que provenía fundamentalmente de las diferencias en educación de los distintos estratos sociales, pero esta idea ha ido perdiendo fuerza en sucesivas investigaciones.

La base teórica de la mayor parte de las investigaciones en este campo se debe a Bernstein (1961), el cual propuso la existencia de dos códigos lingüísticos. Un código restringido, usado principalmente por las clases bajas, caracterizado por una limitación en la complejidad sintáctica, así como en el vocabulario. Por otro lado, un código elaborado, más flexible y complejo, y con un vocabulario mucho más amplio, el cual es usado por las clases medias y altas. Con este planteamiento, los códigos elaborados pueden transmitir más información que los restringidos puesto que la probabilidad asociada a cada palabra emitida es mucho menor.

Teniendo en cuenta las necesidades de gestión para la elaboración de los mensajes, se deriva de dicha teoría que los códigos restringidos necesitarán de menos tiempo para codificar, por lo que se darán menos pausas en la señal verbal que cuando se utilizan los códigos elaborados. Así, Bernstein (1962) encontró que la clase social baja utilizaba menos tiempo de pausa y usaba frases más largas que la clase social media. Brotherton (1979) y Howland y Siegman (1982) confirmaron los estos mismos resultados.

Otra línea de investigación se centra en el problema de la relación entre personalidad y características vocales. Quizá sea esta la que primero captó la atención de los investigadores.

Entre las décadas de 1920 y 1940 se realizaron numerosas investigaciones con el fin de determinar la habilidad de los sujetos para inferir correctamente la personalidad del emisor verbal a partir de sus componentes extralingüísticas. Generalmente se obtuvo un gran acuerdo por parte de los jueces en su valoración de la personalidad del emisor, pero existían importantes dificultades para validar este consenso sobre la base de criterios externos que determinasen la personalidad del emisor.

El uso de jueces en las investigaciones acarrea una serie de problemas metodológicos importantes. En primer lugar, el ya mencionado de la validación externa de dichos juicios. Por otra parte, con el uso de tests de personalidad, para tal validación, no queda asegurado que el concepto a juzgar por los jueces coincida con el que mide el test. Por último, la mayoría de las investigaciones no utilizan material verbal espontáneo, con el fin de poder así limitar la influencia del contenido semántico, con lo que se pone en duda la posibilidad de que emerjan determinados aspectos de la personalidad en dichas condiciones. Por ello, las sucesivas investigaciones han ido prescindiendo de los jueces y se han centrado más en el estudio de la relación entre las medidas de personalidad externas y determinadas propiedades cuantificables del habla.

Entre las variables de personalidad más estudiadas cabe resaltar los estudios sobre extraversión-introversión. Parece clara la relación entre la extraversión y un menor uso de pausas, así como una mayor fluidez verbal y mayor fuerza de voz, con respecto a la introversión (Eysenck y Eysenck, 1963; Siegman y Pope, 1965; Ramsay, 1968; Scherer y Scherer, 1981; Feldstein y Sloan, 1984; Siegman y Reynolds, 1985).

Con respecto a otras variables de personalidad no se han encontrado tantas evidencias de relación, aunque se puede destacar la existente entre dominancia y asertividad, y el volumen de voz y la velocidad de verbalización (Mehrabian y Williams, 1969; Scherer, 1979; Natale et al., 1979). También existe cierta evidencia de relación entre la estabilidad emocional y la fuerza de la voz así como su contraste (Cope, 1969; Scherer, 1979).

Una línea de investigación muy relacionada con la anterior es la que trata de los efectos de atribución e influencia que ejercen sobre los oyentes las características vocales del emisor. Existen suficientes evidencias de que tanto el dialecto, el acento, las cualidades de la voz así como el fenómeno del cambio de código son fuentes de atribución de la personalidad, las actitudes y las motivaciones, hechas por los oyentes sobre los emisores.

Manipulando técnicamente las características de la voz (tono, tasa de articulación, etc.) Brown et al. (1972, 1973, 1974) encontraron una relación lineal directa entre la atribución de competencia y la tasa de articulación verbal (86% de la varianza). Por otra parte, encontraron la relación de U invertida entre la tasa de articulación y la atribución de benevolencia, siendo el punto medio el de mayor atribución positiva.

No obstante parece que estas atribuciones dependen del contexto social en las que se producen. Tanto el origen social como étnico de los oyentes y emisores, así como el contenido semántico involucrado en la interacción, modifican el sentido de la atribución. En concreto, Siegman y Reynolds (1982) han confirmado los resultados de Brown sólo en el caso de que los temas tratados afectasen poco a la intimidad de la persona. No obstante, cuando se trataban temas más íntimos, la atribución de competencia era inversamente proporcional a la tasa de verbalización, y directamente proporcional a las pausas.

Otra línea de investigación, derivada de la anterior, es la que ha tratado de encontrar relaciones entre las propiedades no-verbales del habla y los estados emotivos o afectivos, especialmente con los estados de ansiedad.

Mahl (1956) propone la hipótesis de que la ansiedad provoca interferencias en el curso del habla normal. El autor encontró un aumento en las repeticiones superfluas de palabras, falsos inicios de frases, omisiones de palabras, etc., así como un aumento en la duración de los silencios.

No obstante, estos resultados se han mostrado poco claros al encontrarse contradicciones en sucesivos estudios. Siegman y Pope (1965, 1972) obtuvieron que la situación de ansiedad aumentaba la tasa de vocalización, disminuía el tiempo de latencia en la respuesta así como la tasa de silencio. Dado que la generación de ansiedad se producía por medio del tema tratado por los sujetos (personal-impersonal), los autores alertan sobre la influencia del tema tratado en los efectos que la ansiedad pueda producir sobre los parámetros no-verbales del habla.

No obstante, tampoco parece estar clara la influencia del tema tratado en los efectos de la ansiedad. Pope et al. (1970) encontraron un aumento en la productividad verbal y Sunshine y Horowitz (1968) un aumento de la diversidad de vocabulario, independientemente de los temas tratados por los sujetos experimentales.

En el estudio de la ansiedad provocada por el hecho de hablar en público, Levin y Silverman (1965) encontraron una disminución significativa de las pausas breves (menos de 1 seg.) y un aumento de las pausas sonoras (filled pauses), es decir, los tiempos de duda formados con expresiones sin sentido como ah, um, eh, etc., pero no encontraron efecto sobre las pausas largas. En general, en niveles bajos de ansiedad se aceleraba la verbalización mientras que en altos se desaceleraba.

Relacionados con los estudios de la ansiedad, han aparecido en la última década varias investigaciones sobre el efecto de la mentira en las propiedades del habla, sobre el supuesto de que la mentira va asociada con estados de ansiedad. Reynolds et al. (1983) encontraron que las situaciones de engaño estaban asociadas a un aumento en el tiempo de respuesta, un aumento de las pausas y a una disminución de la tasa de verbalización.

También se han estudiado otras emociones, tales como la alegría, la ira, el miedo, etc. Los parámetros vocales que parecen ser los más afectados son el tono vocal (frecuencia fundamental), la variabilidad del tono, la intensidad verbal y la tasa de verbalización. No obstante, existen aún pocas investigaciones sobre el tema debido a las grandes dificultades que comporta.

Uno de los problemas de estas investigaciones es que parece muy difícil aislar una determinada emoción ya que todo indica que los estados emocionales son siempre una combinación de emociones diversas. Por otra parte, la generación experimental de emociones presenta problemas de orden ético y es por ello que se recurre a una generación teatral de las mismas, con lo que no se puede estar seguro de si se estudia una emoción o bien su estereotipo social.

En cuanto a la investigación de la relación entre procesos sociales y las propiedades del habla, podemos señalar las investigaciones concernientes a la relación entre la atracción inter-personal y un estilo más pausado en el habla (más silencios, menor tasa de verbalización, etc.) (Heller, 1968; Johnson y Dabbs, 1976; Siegman y Pope, 1965, 1972).

Por otra parte, se ha investigado el fenómeno llamado de sincronicidad o congruencia dentro de la dinámica de la interacción verbal. El fenómeno consiste en el ajuste que se efectúa entre los participantes, de los parámetros que caracterizan su comportamiento verbal. Matarazzo y Wiens (1972) encontraron que se producía un ajuste entre la duración de las preguntas y las respuestas en entrevistas diadicas.

Este fenómeno se ha evidenciado con respecto a varios parámetros de comportamiento verbal, como la latencia de respuesta (Howland y Siegman, 1982), interrupciones (Matarazzo y Wiens, 1972), duración de silencios (Feldstein, 1972), tasa de verbalización (Webb, 1972), intensidad vocal (Welkowitz, et al., 1972, Natale, 1975) y precisión de la articulación (Tolhurst, 1955).

Otro tema investigado es el que hace referencia a las señales que se intercambian en la interacción verbal para que esta se organice temporalmente en una serie de turnos de participación. En la mayoría de las conversaciones podemos observar como la sucesión de las distintas intervenciones de los participantes se produce de forma natural, sin atropellos ni incertidumbres. Maclay y Osgood (1959) consideran que las pausas sonoras (ah, em, etc.) constituyen las señales, aunque no las únicas, mediante las cuales se indica que ya no se está dispuesto a seguir manteniendo la emisión, es decir, para que otro participante asuma su turno de participación. En este sentido, Kasl y Mahl, (1965) evidenciaron un aumento de las pausas sonoras en interacciones sin contacto visual.

Por último, queremos destacar las investigaciones concernientes a la estructura temporal de los turnos de participación (las intervenciones) en la interacción verbal. Dicha orientación constituye uno de los métodos más claros para la investigación de los procesos de dinámica grupal, a partir de observaciones de carácter puramente objetivo.

Esta línea de investigación se basa en el desarrollo técnico del llamado cronógrafo. Básicamente se trata de un dispositivo que va almacenando información concerniente a quien está interviniendo verbalmente en cada momento. El primer cronógrafo fue realizado por Chapple (1949) pero necesitaba de la intervención de un operador manual. Posteriormente Cassotta, Feldstein y Jaffe (1964) realizaron el primer cronógrafo completamente automático, llamado AVTA (Automatic Vocal Transaction Analyzer).

A partir de la información sobre los tiempos de participación de cada sujeto, se pueden realizar diversos análisis sobre la dinámica grupal producida.

Mediante el análisis cronográfico de la dinámica grupal, Dabbs y sus colaboradores (Dabbs et al., 1987, Ruback et al., 1984, Dabbs y Ruback, 1984) han obtenido una clara correlación entre la mayor participación verbal y la atribución de liderazgo. Por otra parte, el líder se caracteriza por emitir más en su propio turno e interferir menos en los turnos ajenos. A nivel grupal, una menor presencia de silencios y una mayor verbalización simultánea, producen mayor satisfacción en los participantes.

En una investigación sobre brainstorming (Ruback et al., 1984), determinaron que en la generación de nuevas ideas, estas eran precedidas por períodos de silencio entre los participantes.

Los autores proponen un modelo de Markov para describir la dinámica del comportamiento verbal a nivel grupal. Dicho modelo es una evolución del propuesto por Jaffe y Feldstein (1970) para sistemas diadicos, el cual tendremos ocasión de comentar más adelante.

El siguiente diagrama (Dabbs y Ruback, 1987) ilustra el modelo de Markov propuesto por los autores. Cada circulo representa uno de los estados posibles (y excluyentes) en los que puede estar el grupo con respecto a su comportamiento verbal. Los valores numéricos dentro de cada circulo indican las probabilidades de cada estado mientras que los números asociados a las flechas indican la probabilidad de transición entre dos estados (los valores de la figura corresponden a una investigación concreta).

Fig. 1.5 Modelo de Markov para el comportamiento verbal en interacción grupal (Dabbs y Ruback, 1987)

Los estados posibles se dividen en dos grupos. El primer grupo corresponde a los posibles estados dentro del llamado turno individual, es decir, cuando un solo sujeto adquiere el control de la emisión en la interacción grupal, y estos son: 1) vocalización: cuando un sujeto está emitiendo verbalmente; 2) pausa: cuando un sujeto detiene su emisión para luego reanudarla; 3) pausa de cambio: cuando un sujeto detiene su emisión dando por finalizado su turno. Un segundo grupo viene dado por el llamado turno grupal. Este grupo de estados describe el comportamiento verbal simultáneo de un conjunto de sujetos dentro del grupo. Estos son, 4) vocalización grupal: cuando dos o más sujetos emiten simultáneamente; 5) pausa grupal: cuando dos o más sujetos detienen su emisión simultanea para reanudarla seguidamente y 6) pausa de cambio grupal: cuando el subgrupo que poseía el turno grupal deja de emitir y le sigue un nuevo turno grupal (otro subgrupo coge el turno).

Por último, una importante serie de investigaciones han tratado de inferir del comportamiento verbal, determinadas propiedades de los procesos cognitivos. Revisaremos con más detenimiento esta línea de investigación en el siguiente apartado dado que se trata de los antecedentes más próximos a nuestro trabajo, tanto desde el punto de vista teórico como metodológico.

Para concluir esta visión general, es necesario comentar los condicionantes tecnológicos asociados a la evolución de la investigación.

La historia de la investigación del comportamiento verbal extralingüístico está íntimamente ligada a los desarrollos técnicos disponibles en cada momento. Así, podemos distinguir tres etapas, que, nombrándolas por el elemento técnico más característico, son: 1) la etapa de las válvulas, 2) la etapa de los transistores y 3) la etapa de los chips.

En la primera etapa (hasta la década de 1940), aparecen los primeros instrumentos electrónicos, y con ellos, los sistemas de comunicación de masas (teléfono, radio y TV). Es en el contexto del desarrollo de las comunicaciones telefónicas donde se empieza a plantear la necesidad de conocer mejor las características del comportamiento verbal espontáneo: distribución de tiempos, turnos, intensidades, silencios, etc.

No obstante, son muy pocas las investigaciones de esta época, ya que los instrumentos eran altamente costosos y sólo eran accesibles dentro de un contexto muy tecnificado (léase industria), donde la presencia de científicos sociales era inexistente.

Es a partir de la década de los 50, cuando se produce una explosión de investigaciones entorno al tema. Sencillamente aparece el avance técnico llamado 'transistor', y con él, los circuitos integrados.

Como todo avance en la electrónica, se consiguen grandes aumentos en la integración (miniaturización) y en las capacidades de producción, con lo que los aparatos son más complejos y mas accesibles. No obstante, el tratamiento de la información sigue siendo completamente analógica, con las limitaciones que ello conlleva. En esta época se accede por primera vez a la cuantificación de las propiedades del comportamiento verbal, pero con serias limitaciones en cuanto al volumen de la información a tratar.

Dado que la tercera fase sólo ha hecho que empezar, podemos considerar que el conjunto de investigaciones nacidas con el soporte del transistor constituyen el 'grueso' y la parte más importante de todo lo que hasta ahora existe sobre el tema.

Con el advenimiento del chip (principios de los 70), se produce una revolución tecnológica de una magnitud aún por determinar. La posibilidad de digitalizar la señal acústica, almacenarla en un formato digital, y someterla a cualquier tipo de análisis matemático con suma facilidad, definitivamente abre las puertas a la consecución de un conocimiento exacto de los procesos de comportamiento verbal.

Con el chip van desapareciendo paulatinamente las limitaciones en cuanto al volumen de información, así como las restricciones analíticas impuestas por los sistemas analógicos. La gran ventaja que supone el ordenador para el investigador es la posibilidad de crear y modificar las rutinas de análisis a voluntad, sin tener que cambiar por ello el equipo adquirido.

1.2.2 Antecedentes próximos a nuestra investigación

Nuestro tema de investigación, es decir, el estudio de la organización temporal del comportamiento verbal articulatorio, se ha visto impedido por la falta de tecnologías adecuadas y por ello, no podemos encontrar investigaciones sobre este tema que podamos considerar como antecedentes directos de nuestra investigación. Dicho estudio requiere necesariamente el uso extenso e intenso de los ordenadores que han ido apareciendo a lo largo de la década de 1980 (los famosos PC), junto con soportes adicionales, como las tarjetas digitalizadoras (A/D).

Además, los programas comerciales de análisis de Fourier son insuficientes para este propósito, lo que nos ha llevado a tener que realizar versiones 'a medida', con el fin de poder aprovechar al máximo las posibilidades de los ordenadores para tratar el comportamiento verbal a nivel articulatorio.

No obstante, existen investigaciones que han intentado dilucidar el nivel de organización del comportamiento verbal a una escala de análisis superior, es decir, en la banda de emisión/silencio. Consideramos que dichos estudios pueden considerarse como los antecedentes más próximos del trabajo que hemos realizado, tanto en sus aspectos teóricos como metodológicos.

La historia que nos interesa particularmente empieza en 1966 cuando Henderson, Goldman-Eisler y Skarbek publican su trabajo "Sequential temporal patterns in spontaneous speech", en el que se plantean el problema de dilucidar entre dos concepciones opuestas con respecto al proceso psicolingüístico de la elaboración cognitiva de la señal verbal.

Por un lado, la concepción expuesta por Skinner (1957) de que dicho proceso es lineal, es decir, que la elaboración del producto verbal se realiza mediante un proceso secuencial (paradigma estímulo-respuesta), procesando unidad por unidad, en la misma secuencia temporal en que estas vienen dadas y sin implicar procesos previos de elaboración global y estructural. Por ello, se considera que el comportamiento verbal puede ser descrito mediante un proceso estocástico de Markov de primer orden.

De otro lado, el punto de vista expresado por Lashley (1951) sostiene que el comportamiento verbal mantiene una organización interna. La secuencia lineal de orden temporal en que resulta finalmente el comportamiento verbal se elabora mediante un proceso previo de estructuración global del mensaje. Por consiguiente, se supone la existencia de dos fases: 1) la elaboración global del mensaje como unidad y 2) su transmisión mediante una señal portadora (voz).

Así pues, con la tecnología del momento, que permitía estudiar la relación entre las fases de emisión y de silencio verbal, los autores concluyen que "estas dos aproximaciones al proceso psicolingüístico parecen predecir diferentes distribuciones de las fases de vacilación (predominio de silencios) en el comportamiento verbal espontáneo" (p. 207). En concreto, asumir el segundo punto de vista implica que deberían encontrarse algún tipo de patrones no-aleatorios en dicho comportamiento verbal.

Su investigación se centró tanto en material obtenido de conversaciones espontáneas como de lecturas de texto. Los registros obtenidos consistían en unas gráficas cartesianas cuyos ejes venían definidos por (tiempo de silencio) y (tiempo de emisión) y abarcaban aproximadamente un minuto de duración total. En ellos se representaban la secuencia de silencios y emisiones de fragmentos de conversación correspondientes a un mismo sujeto.

Los autores encontraron claras diferencias entre los registros de comportamiento espontáneo y los registros de lectura. Como puede apreciarse en la Fig. 1.6, aportada por los autores, en los primeros se observaba claramente una alternancia entre fases de vacilación (hesitation) y fases de fluidez verbal (fluency), mientras que en los registros de lectura se observaba una ausencia de dichas fases.

Fig. 1.6 Ciclos de vacilación y fluidez verbal en conversaciones espontáneas (Henderson et al., 1966)

Los autores concluyen que "Estos datos sugieren la existencia de una unidad funcional basada en lo que podría llamarse ritmo cognitivo o paso cognitivo. Ciertamente el uso de conceptos tales como 'planning' y estructura, acerca de la producción verbal espontánea parece ser apoyada dichos datos. El proceso psicolingüístico no parece ser, desde esta evidencia, un simple proceso Markoviano, sino en el que claramente períodos regulares de planificación y de organización interna gobiernan la salida verbal final" (p. 216)

El concepto fundamental que introduce este trabajo es el de ritmo cognitivo. Con él se designa la propiedad ondulatoria y estructurada de la actividad cognitiva responsable de la elaboración y transmisión del mensaje verbal. El ritmo viene dado por la alternancia entre las fases de elaboración o 'planing' (vacilación) y transmisión (fluidez verbal).

A partir de este trabajo, se desarrolla un polémica muy interesante entre quienes obtienen pruebas empíricas de la existencia de tales ritmos y entre quienes obtienen pruebas empíricas de la ausencia de dichos ritmos.

Como veremos, quizás el motivo de la polémica venga determinado por la diversidad y precariedad de los métodos de análisis empírico utilizados, ya que, en general, existe acuerdo entre los distintos investigadores siempre y cuando utilicen la misma metodología de análisis.

La réplica al punto de vista anterior viene dada por Schwartz y Jaffe (1968) en su trabajo "Markovian prediction of sequential temporal patterns in spontaneous speech". Su trabajo consiste en generar mediante ordenador y de forma aleatoria una secuencia de estados de emisión y silencio de tal forma que se reproduzcan los mismos resultados empíricos obtenidos por Henderson et al. (1966).

Los autores asumen que la distribución estadística de la duración de las pausas es exponencial (negativa), al igual que la duración de los períodos de emisión. Dicha suposición esta ampliamente apoyada en trabajos anteriores, como los de Norwine y Murphy (1938), Chapple (1940), Verzeano (1950), Goldman-Eisler (1961), Hargreaves (1960), Matarazzo, Hess y Saslow (1962), entre otros.

En consecuencia, si la distribución de silencios y períodos de emisión en el comportamiento verbal sigue un proceso estocástico de Markov de primer orden, es decir, que la probabilidad de transición de cada estado en cualquier momento sólo depende del estado inmediatamente anterior en el que se encuentra el sistema, una secuencia alternada de estados de emisión y silencio generada aleatoriamente según la distribución exponencial negativa, deberían reproducir los mismos resultados empíricos obtenidos de una conversación real.

Fig. 1.7 Generación aleatoria de ciclos de vacilación y fluidez verbal (Schwartz y Jaffe, 1968)

El resultado de dicho proceso de modelación es una gráfica del mismo tipo que la empleada por Henderson et al. (1966), dando unos resultados cualitativamente similares a los obtenidos empíricamente, tal y como podemos observar en la Fig. 1.7 aportada por los autores.

Este importante resultado permite apoyar con firmeza la idea de que el comportamiento verbal de emisión/silencio puede ser descrito mediante un proceso aleatorio de Markov de primer orden, y por consiguiente es necesario revisar la idea de la existencia de patrones ordenados en dicho comportamiento.

A partir de estas dos posturas, se sucederán diversos trabajos en apoyo de ambas, manteniendo así una polémica que aun hoy no ha quedado definitivamente resuelta.

- Goldman-Eisler (1967) desarrolla el estudio de los ritmos cognitivos y obtiene el resultado de que las diferencias encontradas entre las conversaciones espontáneas y las sesiones de lectura en la investigación de Henderson et al. (1966), no se debían a dicha circunstancia sino al porcentaje de silencios dentro del período total estudiado: "la única condición necesaria aunque no suficiente para que aparezcan ritmos temporales es que un mínimo del 30% del tiempo sean pausas" (p. 122).

- Jaffe, Breskin y Gerstman (1970), aportan nuevas pruebas sobre la idoneidad del modelo de Markov para la descripción del comportamiento de silencio/emisión, esta vez sobre material de conversaciones espontáneas reales. Si dicho comportamiento es aleatorio, el estado del sistema en un momento determinado debe ser independiente del estado en un tiempo anterior. Los autores obtienen el resultado de que más allá de 2 seg., los estados de emisión/silencio son estadísticamente independientes. Es decir, si en un determinado momento, el sujeto se halla en el estado de emisión, ello es completamente independiente del estado en que se encontraba 2 seg. atrás. En consecuencia, la hipótesis de la existencia de ritmos cognitivos y de planificación verbal queda seriamente afectada.

Fig. 1.8 Generación aleatoria de los ciclos de vacilación y fluidez verbal en función del porcentaje de pausas (Jaffe et al., 1972)

- Jaffe, Breskin y Gerstman (1972) aportan la replica al trabajo de Goldman-Eisler (1967). Del mismo modo en que los autores replicaron en 1970 el trabajo de Henderson et al. (1966), ahora introducen en la simulación por ordenador, como nueva variable el porcentaje de pausas en el tiempo total. Al igual que ocurrió en su anterior trabajo, obtienen unos resultados muy parecidos a los obtenidos empíricamente de situaciones reales. Como muestra la Fig. 1.8, a partir del 30% de pausas aparecen con claridad períodos de relativa vacilación seguidos de períodos de relativa fluidez, pero generados de forma aleatoria. Dado el estado de la polémica, los autores advierten de que "son necesarios métodos objetivos para discernir con propiedad estos ritmos, y diferenciarlos de aquellos dados por las variaciones de carácter aleatorio" (p. 71).

- Cobb (1973) introduce un nuevo elemento de análisis en la polémica: el método de Fourier. Por primera vez, se plantea el tema de la periodicidad como determinante de la existencia de ritmos en el comportamiento verbal. El problema no sólo es si existen fases de relativa vacilación y fluidez verbal, sino si dichas fases guardan algún tipo de dependencia temporal entre ellas, es decir, si se advierte la existencia de un orden temporal. La existencia de un ritmo depende de que exista una cadencia ordenada, o en términos de la teoría ondulatoria, la presencia de armónicos en la vibración comportamental (certidumbre frecuencial). El análisis de Fourier constituye un método objetivo para la evaluación de la periodicidad de cualquier señal vibratoria.

Cobb utiliza la técnica de la autocorrelación (basada en la inversa de Fourier) y obtiene el resultado de que 8 sobre 10 conversaciones analizadas mostraban la presencia de periodicidad de forma significativa. Para corroborar sus resultados realiza el mismo análisis sobre una secuencia generada por un proceso aleatorio de Markov sin encontrar ninguna periodicidad significativa (como era lógico esperar).

Aparece pues un nuevo elemento de análisis, la periodicidad del comportamiento verbal, y se encuentra que dicho comportamiento muestra la existencia de tales períodos, con lo que se vuelve a obtener un nuevo apoyo a la hipótesis de los ritmos cognitivos.

- Henderson (1974) critica los trabajos de Jaffe y asociados en la medida en que estos no son capaces de aportar una hipótesis alternativa al proceso cognitivo de elaboración del mensaje verbal. En realidad, considera que la alternativa de que el comportamiento verbal sea un proceso azaroso juega más bien un papel de hipótesis nula en las investigaciones.

Quizás, la crítica más importante de Henderson se base en una propia autocrítica "Sin embargo, se requieren métodos mas sensitivos y objetivos para el acceso a la estructura temporal del comportamiento verbal en este área para su progreso" (p. 124). Schwartz y Jaffe creen generar aleatoriamente los mismos patrones que se producen en el comportamiento verbal espontáneo, pero no disponen de ningún método objetivo para afirmar que se tratan de los mismos patrones. Lógicamente, en la misma situación se encuentra Henderson ya que sólo dispone de la apreciación visual (siempre subjetiva) para afirmar la existencia de ciclos periódicos en el comportamiento verbal.

Por otra parte, argumenta que las evidencias empíricas existentes con respecto a la estrecha relación entre las pausas y la medida de la cantidad de información textual, constituyen un apoyo indirecto a la tesis de los ritmos cognitivos. Las investigaciones de Goldman-Eisler (1958), Tannenbaum, Williams y Hillier (1965) y Martin y Strange (1968), en donde se evidencia una relación entre los silencios y la cantidad de información textual de las palabras que les siguen, indican una función cognitiva en la distribución de silencios. Lounsbury (1954) fue quien formuló por primera vez la tesis al hipotetizar que "Las pausas y los puntos de alta incertidumbre estadística se corresponden a los puntos iniciales de las unidades codificadas" (p. 100). Se teoriza pues, que el silencio constituye el tiempo en el que se elabora la información a transmitir. Por consiguiente, cabe esperar que existan períodos de vacilación (elaboración del mensaje) y períodos de fluidez (emisión del mensaje), es decir, ciclos cognitivos.

- Butterworth (1975) replica el trabajo de Henderson et al. (1966), pero añadiendo la intervención de unos jueces para la determinación (subjetiva) de la presencia o ausencia de ritmos cognitivos.

A los sujetos experimentales (jueces) se les pedía que identificasen sobre las gráficas de silencio/emisión los puntos de inflexión entre períodos con predominio de pausas y los períodos de predominio de emisión.

El resultado fue un elevado acuerdo entre los distintos jueces en la apreciación de las distintas fases, en su duración y sus limites, encontrándose que la duración de los ciclos estaba comprendida entre 10,6 seg. y 39,2 seg., siendo la media 18,0 seg.

Por otra parte, se pidió a los sujetos que señalasen en la transcripción textual, las unidades semánticas presentes, bajo el concepto genérico de 'idea'. En esta tarea se encontró una mayor variación entre los distintos jueces, pero seleccionando los tramos de mayor acuerdo, se observó que dichos tramos de texto (ideas) correspondían a ciclos completos de vacilación/fluidez identificados anteriormente.

Por lo que concluye que "Los ciclos temporales descritos muestran claramente que están asociados tanto a las unidades semánticas como a los límites sintácticos. Esto refuta la afirmación de Jaffe et al. (1972) de que dichos ciclos son generados aleatoriamente. Y se apoya la tesis de Goldman-Eisler y sus colegas (Goldman-Eisler, 1968; Henderson et al., 1966) de que estos ciclos no son aleatorios, sino que están asociados a la elaboración del habla espontáneo" (p. 83).

Butterworth introduce una nueva dimensión en apoyo a la tesis cognitiva de la elaboración estructurada del mensaje: la relación entre las pausas y la estructura sintáctica del texto transmitido. Esta relación ya había sido puesta de manifiesto por las investigaciones de Maclay y Osgood (1959), Boomer (1965), y constituirá en los años sucesivos una importante línea de investigación independiente, con resultados sorprendentes tales como la generación de la estructura sintáctica de la emisión textual mediante técnicas de clasificación (cluster) a partir de la duración de los silencios (Grosjean, et al., 1979).

- Beattie (1979) utiliza el mismo procedimiento que Henderson et al (1966) para el análisis de los ritmos cognitivos y obtiene igualmente la confirmación de su existencia. En concreto halla que su duración media es de 21,88 seg., con una desviación típica de 15,68 seg. Por otra parte, confirma también los resultados de Butterworth (1975) con respecto a la correspondencia entre ciclos cognitivos y correlatos semánticos y sintácticos.

- Warner (1979) realiza por primera vez un análisis espectral (transformada de Fourier) para determinar la presencia de ciclos periódicos en el comportamiento verbal. Esta investigación marcará la línea de solución a la polémica entorno a los ciclos cognitivos, puesto que sólo con métodos de análisis matemático se podrá concluir dicho tema. No obstante, la precariedad de los ordenadores en dicha época limitó de forma importante las posibilidades que ofrece esta técnica.

Puesto que nosotros vamos a utilizar este mismo método de análisis, consideramos dicho trabajo como el antecedente más directo de nuestra investigación a nivel metodológico.

La autora abre, por otra parte, el abanico teórico hacia nuevos puntos de vista, bajo los cuales podría ser explicada también la presencia de patrones de comportamiento verbal.

A parte del punto de vista cognitivo, que hasta ahora había acaparado la teorización de la investigación, Warner destaca explicaciones de orden social y de orden fisiológico.

Desde el punto de vista social, "es posible que las normas sociales que gobiernan los turnos de participación verbal puedan producir ritmos periódicos en las conversaciones" (p. 385). Así, "durante la interacción social, los participantes deben sincronizar sus patrones de actividad para satisfacer normas sociales que afecten a la toma de la palabra o a la cooperación" (p. 385)

La investigación sobre los turnos de participación aún son escasas y los criterios de medida divergen según los autores. Así, Duncan y Fiske (1977) hallan que la duración media de dichos turnos es de 13,5 seg., con una desviación típica de 9,8 seg. Gallois y Markel (1976) obtienen una duración media sensiblemente menor, 3 a 5 seg.

No obstante, aunque sea posible que las normas sociales induzcan la presencia de ritmos verbales, no queda claro el porque dicha inducción debe producir ritmicidad.

Desde la perspectiva fisiológica se apela a lógica del propio organismo. Ante la evidencia de numerosos procesos fisiológicos claramente rítmicos (respiración, temperatura corporal, ritmo cardíaco, etc.), parece razonable que, siendo el habla un proceso conductual estrechamente ligado al proceso respiratorio, muestre en algún nivel, la presencia de ritmos periódicos (Chapple, 1970).

Si tomar partido definitivamente por ninguna explicación teórica en concreto, el objetivo de la investigación de Warner es "mostrar que estas alteraciones entre alto y bajo nivel de actividad (verbal) tienden a ocurrir en intervalos de tiempo regulares, es decir, periódicamente" (p. 382).

Su hipótesis de trabajo es que han de existir ciclos regulares cuyos períodos deben estar entre los 6 seg. y los 6 minutos. Ello implica encontrar 'picos' espectrales en las frecuencias que corresponden a dichos períodos.

Por otra parte, "La hipótesis nula es que los datos son aperiódicos, conteniendo ciclos no regulares, y ninguna frecuencia puede ser discriminada significativamente. Si este es el caso, entonces el espectro se mostrará aproximadamente uniforme sin la presencia de picos significativos" (p. 387).

Como material empírico utiliza 6 conversaciones diadicas de 35 a 45 minutos de duración. De ellas obtiene un registro del estado de silencio/emisión para cada sujeto y conversación y calcula su espectro correspondiente (12 espectros en total).

En todos los casos, los espectros muestran la presencia de líneas espectrales significativas en la región de bajas frecuencias, tal y como puede observarse en los dos ejemplos superiores de la Fig. 1.9, aunque dichas líneas varían su posición para cada sujeto, lo cual parece indicar la influencia de diferencias de orden individual.

Fig. 1.9 Dos espectros de conversaciones y espectro medio de seis conversaciones (Warner, 1979)

Para contrastar su hipótesis nula, simula un registro obtenido mediante un proceso aleatorio de Markov (aunque no indica que tipos de distribuciones de probabilidad utiliza para cada estado) y calcula su correspondiente espectro. El resultado se muestra en el espectro inferior de la Fig. 1.9, en la que se compara el espectro medio de los 6 registros junto con el obtenido del proceso Markoviano. Mientras este último muestra una distribución uniforme (hipótesis nula), el primero indica una presencia de frecuencias significativas en la parte baja del mismo.

De los análisis realizados, la autora concluye la existencia de ciclos regulares entre 3 y 6 minutos de duración, mientras que no existe evidencia para ciclos de 16 a 40 seg. Por otra parte, su análisis no incluía la banda de 2 a 5 seg., por lo que no puede contrastar los trabajos de Jaffe et al. (1970).

El trabajo de Warner es importante en la medida en que introduce por primera vez la técnica de Fourier, ya que es la más adecuada para el análisis de la ritmicidad de fenómenos vibratorios. No obstante, el análisis espectral debe ser utilizado con mucho rigor para obtener resultados fiables y, desde nuestro punto de vista, encontramos a faltar un análisis segmentado para confirmar la estabilidad de los ritmos encontrados por la autora, lo cual es perfectamente comprensible dadas las técnicas disponibles en la época.

Como veremos en el apartado metodológico de nuestro trabajo, es necesario el estudio de la evolución espectral de la señal para determinar correctamente la presencia (y su duración) de patrones ordenados de comportamiento. La obtención de picos en un solo espectro, por muy pronunciados que estos sean, no indica necesariamente la presencia de ritmos estables o patrones.

Si nos atenemos a su análisis, parece que a lo largo de una conversación de 45 minutos, cada sujeto presenta un ritmo cíclico constante, y las cosas no tienen porque ser así de sencillas. Es necesario investigar la evolución interna de la conversación para determinar si existe un solo ritmo constante a lo largo de la misma o bien si existen diversas fases, cada una de ellas caracterizada por un patrón rítmico distinto. Esta será la estrategia de análisis que desarrollaremos en nuestra investigación.

En todo caso, dicha investigación aporta indicios objetivos para suponer la existencia de ciclos rítmicos en el comportamiento verbal, pero no logra resolver satisfactoriamente la controversia existente. Entre otras razones, los ciclos que encuentra son de un período muy grande, de 3 a 6 minutos, y estos no parecen que estén relacionados con funciones de tipo cognitivas.

- Power (1983) analiza el comportamiento de emisión/silencio de 9 sujetos en 6 monólogos de 1 minuto cada uno, con el mismo procedimiento de Henderson et al. (1966). Los gráficos obtenidos son presentados a dos jueces (uno de ellos el propio autor) y son valorados en cuanto a la presencia de 'ritmos cognitivos' por una escala de 1 a 7. La valoración de los dos jueces fue significativamente coincidente pero no apreciaron la presencia de dichos ritmos. Por otra parte, se generaron gráficos aleatorios mediante el mismo procedimiento que Jaffe et al. (1972) y se pidió a los jueces que realizasen la misma valoración. No se encontraron diferencias entre la valoración de los registros aleatorios y los registros reales.

El autor concluye que, en su estudio, no sólo no aparecen ritmos en los registros reales sino que también son ausentes en los generados aleatoriamente, con lo que se pone de manifiesto, una vez más, la precariedad de las conclusiones cuando estas se basan en la inspección visual directa de la señal vocal.

Este estudio abrió de nuevo la polémica (Beattie, 1984; Power, 1984) sobre la realidad de los ritmos cognitivos. Esta vez, se obtienen resultados negativos utilizando la misma técnica con la que anteriormente otros autores los habían encontrado positivos.

- Greene y Cappella (1986) aportan un nuevo punto de vista al problema a partir de la 'action assembly theory' desarrollada por Greene (1984). Se trata de formular una teoría que concilie los resultados aparentemente adversos que hasta la fecha se han obtenido con respecto al comportamiento verbal de emisión/silencio, y que involucran a los procesos cognitivos de la elaboración del mensaje verbal.

Fundamentalmente, la teoría propugna una serie de procesos cognitivos para la elaboración del comportamiento (activación de memoria, selección de registros, organización de la información, etc.) de tal forma que dicho proceso "se refleja en la velocidad y en la latencia de la respuesta" (p. 142). El resultado final de dicho proceso es la llamada 'representación final', la cual tiene una estructura jerárquica consistente en un número de planos definidos por su nivel de abstracción. Los niveles altos contienen especificaciones abstractas de la acción, mientras que los niveles bajos contienen parámetros para las ordenes motoras.

La elaboración del mensaje verbal, en su plano más abstracto, está constituida por una o más transiciones, llamadas 'movimientos' (moves). En realidad, cada uno de estos 'movimientos', se corresponden con el concepto genérico de 'idea', ya utilizado por Butterworth (1975).

Por ello, "esperamos que la construcción de un movimiento (idea) se acompañe por un incremento de las pausas en el habla; una vez ha sido formulada, el habla se volverá más fluida hasta que el movimiento sea completado" (p. 143). Ahora bien, dicho fenómeno dependerá de las necesidades de proceso de cada acción, y por consiguiente, acciones que no requieran de una formulación complicada no mostrarán esta variación en la distribución de las pausas.

Lo más importante a destacar, no obstante, es que desde esta perspectiva, "los ciclos no necesitan ser necesariamente periódicos" (p. 148). Por primera vez, se formula la idea de la existencia de fases de vacilación/fluidez verbal sin necesidad de que muestren una estructura temporal ordenada. No obstante, la teoría aportada por los autores rehuye el problema puesto que no afirma nada con respecto a si dichos ciclos deben ser ordenados o no. Sólo afirma que dichos ciclos deben estar siempre y cuando las necesidades cognitivas de elaboración sean suficientemente significativas.

En su estudio utilizan un procedimiento parecido al de Butterworth (1975), utilizando jueces para la determinación de las 'ideas' (moves) presentes en el texto verbalizado. En una primera condición se instruye a los sujetos para que expongan un tema concreto, dándoles para ello una información no estructurada sobre el mismo. En la segunda condición, se les da a los sujetos una información completamente estructurada, con lo que se supone que las necesidades cognitivas de elaboración disminuyen sensiblemente.

Los resultados confirman las expectativas formuladas, encontrándose que en el primer caso, las transiciones entre las distintas 'ideas' correlacionan con los períodos de vacilación verbal, mientras que en el segundo caso esto no ocurre así.

En todo caso, el estudio confirma la existencia de fases o ciclos de vacilación/fluidez asociados al contenido simbólico transmitido, dependiendo del esfuerzo cognitivo involucrado.

- Warner y Mooney (1988) extienden el estudio de Warner (1979) con la pretensión de determinar diferencias individuales a partir de las frecuencias características de los ritmos vocales.

Analizaron conversaciones diadicas de 40 minutos de duración, de las cuales obtuvieron registros separados para cada participante. Cada registro estaba compuesto por 160 valores (uno cada 15 seg.). En total se analizaron los espectros de 108 registros distintos.

Globalmente obtuvieron los mismos resultados que en 1979: "todas las componentes periódicas significativas se encontraron en la región de bajas frecuencias del espectro (ciclos desde 2,67 hasta 32 minutos)" (p. 105). No obstante no todas las conversaciones mostraron una periodicidad estadísticamente significativa, aunque casi todas las conversaciones tendían a un espectro con las componentes concentradas en las bajas frecuencias. Por otra parte, se encontraron diferencias individuales significativas en cuanto a la distribución espectral de los ritmos.

Hasta aquí hemos revisado las investigaciones más significativas que, sobre los ritmos en el comportamiento verbal, se han realizado hasta la fecha. La impresión general es que el tema aún no esta cerrado y que involucra una gran complejidad tanto teórica como metodológica.

Parece claro que existen fases de vacilación y fluidez verbal del orden de 10 seg. aproximadamente, aunque con una gran varianza. También está claro que dichas fases o ciclos están relacionados con las exigencias de operación del sistema cognitivo, ya que parece probado la estrecha relación tanto de la estructura simbólica como de la sintáctica con las fases de vacilación y fluidez verbal.

Lo que ya no parece tan claro es que dichas fases tengan un carácter periódico, es decir, una disposición ordenada en el tiempo. Aunque la mayoría de los autores se inclinan a afirmar dicha periodicidad, no existen pruebas objetivas concluyentes de que ello sea así.

Sólo los estudios de Warner y Cobb, presentan un análisis objetivo de la existencia de ritmos periódicos (series de Fourier) pero Warner, por ejemplo, centra su investigación en una banda superior a la de los ritmos cognitivos. Si los ciclos cognitivos se dan con períodos de 5 a 20 seg., al autora encuentra ritmos entre 3 y 30 minutos. Lógicamente se tratan de fenómenos distintos, y probablemente estos últimos estén relacionados tanto con variables fisiológicas, como con variables sociales (turnos de palabra, etc.).

Otro problema muy importante, de cara a dilucidar resultados, es la precariedad empírica con la que se ha trabajado hasta la fecha. Aunque se manejen correctamente los test de significatividad estadística, el uso de pequeñas muestras, es decir, el uso de poca información, constituye un handicap para la obtención de resultados concluyentes.

En general se analizan unas pocas muestras de 1 minuto de duración, con lo que normalmente se analizan del orden de 600 datos por cada muestra. Warner analiza períodos completos de 45 minutos pero con una reducción a 450 o 160 datos por conversación (integra a 8 y 15 seg.) y obtiene un solo espectro por conversación.

Uno de los esfuerzos que nos hemos propuesto ha sido el de trabajar con grandes masas de datos, con el fin de hacer valer la ley estadística de los grandes números. Así, de cada conversación hemos obtenido y analizado del orden de 130.000 datos y 1.000 espectros. Ello supone un salto cualitativo en orden a la clarificación del fenómeno verbal, lo que sin duda no hubiera sido posible sin la ayuda de las nuevas generaciones de ordenadores personales que hemos podido utilizar.

Desde el punto de vista teórico, no parece justificarse el porqué las fases de vacilación/silencio deben sucederse en el tiempo de una forma ordenada (rítmica). La teoría de las dos fases cognitivas (1. elaboración del mensaje y 2. transmisión de la señal) permite derivar sólo la presencia de fases (ciclos) pero no su ritmicidad.

En el siguiente apartado abordamos una reflexión teórica sobre la base del análisis de los presupuestos no-explícitos que se encuentran detrás de las investigaciones revisadas. Ello nos permitirá una mayor clarificación del tema, así como derivar nuestra hipótesis de investigación.

Última actualización:

22/03/06