Analisis Espectral de los sonidos de los pájaros

8
UNIVERSIDAD NACIONAL DE QUILMES Acústica y Psicoacústica Terrile Germán Andrés Análisis sobre los sonidos de las aves OBJETIVOS Se pretende realizar un análisis sobre distintos sonidos producidos por aves. Por un lado ver la composición de los mismos, tanto espectral como formal y por otro lado buscar indicios que permitan demostrar la formación de melodías y si las supuestas notas utilizadas tienen relación alguna con las notas musicales de la escala temperada. METODO DE TRABAJO Como material primario de análisis se utilizaron entre ocho y diez grabaciones de entre cinco y diez minutos cada una. Las grabaciones fueron tomadas en el parque que rodea El Rosedal desde distintos puntos. Se utilizó un grabador digital Tascam dr40 y un micrófono Audio Technica AT897. Del material obtenido se descartó lo que no servía para la investigación y se hizo una selección de cinco pequeños fragmentos. En cada uno de ellos se observan resultados dispares y se analizaron desde distintos puntos de vista. El análisis se realizó con el programa Adobe Audition 3.0.

Transcript of Analisis Espectral de los sonidos de los pájaros

       

   

UNIVERSIDAD  NACIONAL  DE  QUILMES  Acústica  y  Psicoacústica  

 Terrile  Germán  Andrés  

   

Análisis  sobre  los  sonidos  de  las  aves    

 

OBJETIVOS    

Se   pretende   realizar   un   análisis   sobre   distintos   sonidos   producidos   por  aves.  Por  un  lado  ver  la  composición  de  los  mismos,  tanto  espectral  como  formal  y   por   otro   lado   buscar   indicios   que   permitan   demostrar   la   formación   de  melodías  y  si  las  supuestas  notas  utilizadas  tienen  relación  alguna  con  las  notas  musicales  de  la  escala  temperada.        

METODO  DE  TRABAJO    

Como   material   primario   de   análisis   se   utilizaron   entre   ocho   y   diez  grabaciones   de   entre   cinco   y   diez   minutos   cada   una.   Las   grabaciones   fueron  tomadas  en  el  parque  que  rodea  El  Rosedal  desde  distintos  puntos.  Se  utilizó  un  grabador  digital  Tascam  dr-­‐40  y  un  micrófono  Audio  Technica  AT-­‐897.    

Del  material  obtenido  se  descartó  lo  que  no  servía  para  la  investigación  y  se   hizo   una   selección   de   cinco   pequeños   fragmentos.   En   cada   uno   de   ellos   se  observan  resultados  dispares  y  se  analizaron  desde  distintos  puntos  de  vista.  El  análisis  se  realizó  con  el  programa  Adobe  Audition  3.0.  

                 

  2  

 1.  GENERACION  DEL  SONIDO  EN  LAS  AVES  

 Se  dará  una  breve  descripción  del  aparato  encargado  de  generar  sonidos  

en  las  aves  y  sus  principales  elementos.  Los  elementos  básicos  que  lo  componen  son:  pulmones,  bronquios,  siringe,  tráquea,  laringe,  boca  y  pico  [Fig  1].        

   

Fig  1.  Partes  encargadas  de  generar  sonidos  en  las  aves.        El  sistema  generador  de  sonidos  de  las  aves  a  diferencia  del  del  humano,  

no  posee  de  cuerdas  vocales,  sino  que  posee   la  siringe.  La  siringe  es  un  órgano  que   tiene   la   particularidad   de   poder   generar   dos   sonidos   simultáneamente.   El  aire  proveniente  de  los  pulmones  pasa  por  los  bronquios  y  al  llegar  a  la  siringe,  por  medio   de   las   vibraciones   de   sus   dos  membranas,   se   genera   el   sonido   que  continua   por   la   tráquea.   El   poseer   dos   membranas   hace   que   pueda   generar  sonidos  con  una  sola  de  ellas,  con  ambas  o  parte  del  sonido  con  una  y  parte  con  la   otra.   Este   órgano   permite   que   las   aves   puedan   realizar   distintos   tipos   de  sonidos  y  como  se  verá  mas  adelante,  cada  uno  de  ellos  posee  una  composición  espectral  particular.            2.  CLASIFICACION  GENERAL      

A  modo  general,  los  sonidos  de  las  aves  se  dividen  en  dos  tipos:  cantos  y  llamadas.  Los  cantos  son  mas  elaborados,  poseen  una  estructura  mas  compleja  y  las  llamadas  son  sonidos  mas  simples  y  mecánicos.  

   

  3  

   Fig  2:  Composicion  formal  del  canto.  

   

 Fig  3:  Llamadas.  

     3.  ANALISIS       En  el  primer  fragmento  a  analizar  {Audio  1}[Fig  4],  vemos  que  el  sonido  resultante   es   un   canto   que   tiene   varias   partes   y   que   es   una   sinusoide.   Del  siguiente  fragmento  se  tomaron  como  referencia  de  análisis  aquellos  puntos  que  estén  a  los  extremos  de  la  línea  melódica,  inferior  y  superior.      

 Fig  4:  Canto  sinusoidal.  Analisis  con  tamaño  de  ventana  2048  Hamming.    

 En   el   siguiente   cuadro   se   comparan   las   frecuencias   obtenidas   en   los  recuadros  del  1  al  4  con  las  frecuencias  de  notas  musicales.    

  4  

   

Del  cuadro  anterior  se  puede  ver  que  la  nota  uno  corresponde  al  Sol  3136  hz.,  la  nota  dos  al  Do  2093  hz.,  la  nota  tres  al  Fa  2397  hz.  y  la  cuatro  al  Re  2349  hz.   y   que   el   porcentaje   de   error   en   la   entonación   es   de   0,51%,   1,95%,   1,1%   y  0,21%   respectivamente.   Para   tener   una   referencia   de   la   precisión   en   la  entonación,  el  porcentaje  de  error  entre   la  nota  musical  y  su  semitono  anterior  es  de  5,7%,  5,6%,  5,5%  y  5,6%  respectivamente.  En  todos  las  notas  analizadas,  el  error  es  menor  al  cuarto  de  tono.  

       El   segundo   fragmento   a   analizar   {Audio2}   es   una   llamada,   se   ve   en   su  

contenido   espectral   la   simplicidad   en   la   forma   y   la   replicaciones   en   distintas  bandas  de  la  nota  fundamental  [Fig  5].  

 

 Fig  5.  Llamada  con  una  zona  de  fundamental  indefinida  y  sus  réplicas.  Analisis  con  tamaño  de  ventana  2048  Hamming.    

A  simple  vista  se  puede  decir  que  es  un  sonido  armónico  basándonos  en  su   contenido   espectral,   aunque   en   la   zona   de   los   4500hz.   y   6000hz.   no   esté  definida  la  información.  Esto  se  debe  a  que,  a  diferencia  del  caso  anterior  donde  a  la   sinusoide   se   le   puede   asignar   una   frecuencia   determinada   en   un   punto  determinado  del  tiempo,  esta  llamada  no  tiene  una  fundamental,  sino  que  tiene  una   zona  de   fundamental   indefinida[Fig  6].   Se  observa  que   la   llamada  hace  un  

Canto  

Notas  Musicales  0  

1000  

2000  

3000  

4000  

Nota  1   Nota  2  Nota  3  

Nota  4  

Hz.  

Nota  1   Nota  2   Nota  3   Nota  4  Canto   3120   2051   2762   2344  Notas  Musicales   3136   2093   2793   2349  

Canto  vs.  Notas  Musicales  

  5  

pequeño  descenso  de  entonación  y  a  medida  que  continua  agrega  información  en  la  zona  de  la  fundamental.    

 Fig  6.  Zona  de  fundamental  indefinida.  Análisis  con  tamaño  de  ventana  2048  Hamming.            

PARCIALES   LIMITE  INFERIOR  (Hz)   LIMITE  SUPERIOR  (Hz)  

1er  parcial   1395   1583  2do  parcial   2903   3037  3er  parcial   4414   4563  4to  parcial   5718   6050  

 Fig  7.    Limites  de  frecuencias  de  los  cuatro  parciales.    

 En   el   cuadro   de   análisis   de   frecuencia   [Fig   8]   se   ven   las   cuatro   zonas  

donde  hay  información.    

 Fig  8.  Analisis  de  frecuencia.  Analisis  con  tamaño  de  ventana  4096  Kaiser.          

   El   tercer   fragmento   a   analizar   {Audio   3}   presenta   en   la   zona   de   la  

fundamental,   tres   fundamentales   independientes   que   se   replicaran   en   el  espectro  de  manera  mas  o  menos  armónica  [Fig  9].  Como  se  puede  observar,  este  sonido  posee  una   fundamental  mucho  mas  grave  que   las  anteriores  y  presenta  mayor  cantidad  de  parciales  que  los  casos  anteriores.      

  6  

 Fig  9.  Tres  fundamentales.              

 Fig  10.  Espectro  completo.    

Analizando  en  detalle  los  distintos  parciales  que  se  presentan  se  pudo  ver  que  algunos  de  ellos  corresponden  a  la  fundamental  mas  grave  (322,9  hz.),  otros  a   la   fundamental   intermedia   (403,9   hz.)   y   otros   a   la   fundamental   mas   aguda  (489,8   hz.)   pero   que   no   todos   guardan   una   relación   armónica   precisa   con   sus  fundamentales.   Según   la   magnitud   de   estas   imprecisiones,   los   parciales  analizados  se  organizan  en  tres  grupos.  

 a. una   diferencia   muy   pequeña   entre   el   parcial   y   el   valor   ideal  

correspondiente   a   dicho  parcial.   Ej.:   el   sexto   parcial   de   la   serie  con   fundamental   en   403,9   hz.   es   2422   hz.   cuando   idealmente  debería  ser  2423,4  hz.  Esto  es  un  error  del  0,05%.  Caso  similar  es  el  del  quinto  parcial  de  serie  con  fundamental  en  322,9  hz.  donde  el   error   es   del   0,15%.   Los   parciales   incluidos   en   este   grupo   se  entienden  prácticamente  como  ideales.  

b. Diferencia  mayor  a  la  del  primer  grupo.  Ej.:  el  segundo  parcial  de  la   serie   con   fundamental   en   489,8   hz.   es   968,9   hz.   cuando  debería  ser  979,6  hz.  Error  del  1,1%.  Caso  similar  es  el  del  cuarto  parcial  de  la  primera  serie  donde  el  error  es  del  0,8%.  

c. Parcial  no  considerado.  En  este  grupo  se  ubican  los  parciales  que  no  poseen  valores  significativos  como  para  ser  considerados,  ya  sea  por  diferencia   en   la   frecuencia   o  por   la   escasa   amplitud   en  esa  región  del  espectro.  Parciales  del  seis  en  adelante  en  la  serie  con  fundamental  en  322,9  hz.  y  del  cinco  en  adelante  en  la  serie  de  489,8  hz.  

 

  7  

 Fig  11.  Tres  fundamentales  y  sus  replicas  en  el  espectro.  Analisis  con  tamaño  de  ventana  16384  Kaiser.              

   De  las  tres  series  armónicas,  la  que  presenta  parciales  mas  fieles  es  la  que  

tiene  como  fundamental  403,9  hz.  donde  casi   todos  sus  parciales  pertenecen  al  primer  grupo,  siendo  0,6%  el  máximo  error  en  toda  la  serie.  

En  cuanto  a  la  vinculación  con  notas  musicales,   la  fundamental  403,9  hz.  tiene   un   error   del   2,7%   con   el   Sol   sostenido   de   frecuencia   415,3   hz.   La  fundamental  322,9  hz.  tiene  un  error  del  2%  con  el  Mi  de  frecuencia  329,6  hz.  y  la   fundamental   489,8   tiene   un   error   del   1%   con   respecto   al   Si   de   frecuencia  493,8  hz..  En  el  {Audio  4}  se  pueden  escuchar  las  tres  fundamentales  aisladas.  

         

P1   P2   P3   P4   P5   P6   P7   P8   P9  Series  1   322,9   645,9   968,9   1302   1612   0   0   0   0  Series  2   403,9   810,1   1219   1612   2016   2422   2826   3227   3631  Series  3   489,8   968,9   0   1962   0   0   0   0   0  

0  

500  

1000  

1500  

2000  

2500  

3000  

3500  

4000  

Hz.  

Evolucion  de  las  Fundamentales  

  8  

En  el  último  audio  a  analizar  {Audio  5}  se  puede  comprobar  como  las  aves  son   capaces   de   crear  melodías   y   de   recrearlas   reiteradamente.   Este   fragmento  pertenece  a  un  canto  y  se  pueden  distinguir  los  elementos  descriptos  en  la    [Fig  2].  

 

         4.  CONCLUCIONES    De  los  fragmentos  analizados,  se  puede  concluir  lo  siguiente:  

a. Son  muy  diversos  los  sonidos  que  pueden  realizar  las  aves.  Desde  sonidos   puramente   sinusoidales,   sonidos   con   componentes  armónicos  y  con  componentes  no  del  todo  armónicos.    

b. En   los   cantos   de   las   aves,   las   notas   utilizadas   se   asemejan   a   las  notas  utilizadas  por  los  humanos  en  frecuencia.  En  un  caso  se  vio  que   las   notas   producidas   son   semejantes   a   las   de   la   escala  diatónica   (notas   Do,   Re,   Fa   y   Sol)   y   en   otro   caso   las   tres  fundamentales   superpuestas   eran   cercanas   a   las   notas   Mi,   Sol  sostenido  y  Si.  

c. Las   aves   son   capaces   de   generar   melodías,   recordarlas   y  repetirlas  fielmente.  

     5.  BIBLIOGRAFIA    Härmä,   A.   &   Somervuo,   P.   (2004),   “Classification   of   the   harmonic   structure   in  bird  vocalization”.    Fagerlun,   S.   (2004),   “Automatic   Recognition   of   Bird   Species   by   Their   Sounds”,  Master  Thesis,  HUT,  Laboratory  of  Acoustics  and  Audio  Signal  Processing.