ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron...

22
TRABAJO FINAL DE LA ASIGNATURA ANÁLISIS DE DATOS APLICACIÓN DEL ANÁLISIS DE COMPONENTES PRINCIPALES Y DE LOS MÉTODOS DE CLASIFICACIÓN AUTOMÁTICA AL ESTUDIO FINANCIERO DE LAS COMPAÑÍAS PRODUCTORAS DE GAS Y PETRÓLEO COTIZADAS EN LA BOLSA DE NUEVA YORK Autor JOSÉ ENRIQUE PUENTE DOMÍNGUEZ GRADO EN ESTADÍSTICA.UNIVERSIDAD DE VALLADOLID VALLADOLID,2 DE JUNIO DE 2013

Transcript of ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron...

Page 1: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

TRABAJO FINAL DE LA ASIGNATURA  

ANÁLISIS DE DATOS 

 

 

 

 

  

APLICACIÓN  DEL  ANÁLISIS  DE COMPONENTES PRINCIPALES Y DE LOS MÉTODOS DE CLASIFICACIÓN AUTOMÁTICA   AL 

   ESTUDIO  FINANCIERO DE LAS COMPAÑÍAS PRODUCTORAS DE GAS Y PETRÓLEO COTIZADAS EN LA BOLSA DE NUEVA YORK 

  

  

 

 

 

Autor 

JOSÉ ENRIQUE PUENTE DOMÍNGUEZ                

GRADO EN ESTADÍSTICA.  UNIVERSIDAD DE VALLADOLID 

 VALLADOLID, 2 DE JUNIO DE 2013 

Page 2: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

1

1. Introducción……………………………………………………………………………..   2 

 

2. Objetivos…………………………………………………………………………………..   3 

 

3. Datos y materiales…………………………………………………………………….   3 

 

4. Análisis de Componentes Principales………………………………………..   5 

 

5. Clasificación jerárquica ascendente…………………………………………..   11 

 

6. Caracterización de las clases……………………………………………………..   15 

 

7. Conclusiones……………………………………………………………………………..   21 

   

Page 3: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

2

1. Introducción 

Los informes trimestrales y anuales que presentan las compañías cotizadas ante el regulador 

del mercado de valores contienen datos que pueden ser analizados para investigar la situación 

financiera de una empresa y sus operaciones. Los estados financieros condensados incluidos en 

esos documentos proporcionan información acerca de los activos, pasivos, ingresos y gastos de 

cada empresa. 

A partir de estos datos se construyen indicadores y razones que dan idea de la rentabilidad, 

eficacia de la administración, solvencia, liquidez o grado de  apalancamiento del negocio. 

Un problema del análisis de estos estados financieros y razones es que existe una gran cantidad 

de ellos. Esto se deriva en una dificultad en el manejo de todos estos datos, además de que la 

información disponible resulta en muchos casos redundante. 

Se tratará en este estudio de analizar la estructura y situación financiera de cierto sector 

productivo utilizando los estados y razones financieras presentados.  

Para ello se limitará el análisis a las compañías petroleras denominadas “independientes”, que 

se dedican a la adquisición, exploración y producción de gas y petróleo. Esto excluye a las 

grandes petroleras que, además de a la explotación, se dedican a operaciones de refino de 

petróleo y comercialización de productos derivados. 

La gran mayoría de estas compañías independientes tiene su área de operaciones en Estados 

Unidos, donde adquieren terrenos y derechos de explotación para buscar y extraer 

hidrocarburos, de modo que su producción abunda en gas natural más que en petróleo. 

Muchas de estas compañías prosperaron en la pasada década cuando el sector vivió un boom 

debido a que las nuevas técnicas de fractura hidráulica (comúnmente conocida en inglés como 

fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía 

extraerse por métodos convencionales.  

Ahora el sector vive un momento difícil por los bajos precios del gas natural. Esto ha puesto al 

borde de la bancarrota a muchas de estas compañías que no son capaces de rentabilizar las 

inversiones hechas años atrás. 

 

   

Page 4: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

3

2. Objetivos 

Conocer a través del Análisis de Componentes Principales (ACP) y por métodos de clasificación 

automática la estructura y situación financiera de las compañías productoras de gas y petróleo.  

Se pretende además estudiar las interrelaciones entre los estados financieros y razones que 

habitualmente se utilizan en los análisis financieros de las empresas cotizadas y analizar 

someramente el comportamiento en bolsa de las acciones de estas compañías. 

 

3. Datos y materiales 

Todas las compañías estudiadas cotizan en la bolsa de Nueva York. Estas compañías están 

obligadas a presentar trimestralmente una contabilidad auditada ante el regulador. Estos datos 

se ponen al alcance del público a través de la página web de la SEC (Securities and Exchange 

Comission): 

http://www.sec.gov/edgar.shtml 

Dicha información es recogida y resumida por muchos sitios web de información bursátil: 

Reuters, Barron’s, Yahoo Finance!, etc. 

Para nuestro estudio se extrajeron los datos de la página web de Yahoo! Finance, en donde 

para cada compañía existe un apartado “Key Statistics” con gran cantidad de razones y estados 

financieros resumidos. Por ejemplo: 

http://finance.yahoo.com/q/ks?s=BRY+Key+Statistics 

El listado de compañías del sector se extrajo de la siguiente página web: 

http://biz.yahoo.com/p/121conameu.html 

donde se seleccionaron aquellas compañías que cotizaban en la bolsa de Nueva York y que 

además no presentaban información incompleta al 1 de Mayo de 2013. 

La muestra final fue de 77 compañías en las que se tomaron las siguientes 14 variables: 

‐ Profit Margin. Margen de beneficios. Se calcula dividiendo los beneficios netos entre las 

ventas. Un margen de beneficio alto indica que la empresa es rentable y que mantiene 

los costes bajos. 

 

‐ Operating Margin. Margen de operaciones. Se calcula dividiendo los beneficios antes 

del pago de intereses e impuestos divididos por las ventas. Mide la eficiencia operativa. 

 

 

 

Page 5: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

4

‐ Return on assets. Rendimiento en los activos. Se calcula dividiendo los beneficios 

anuales de la compañía entre los activos totales. Es un indicador de lo lucrativo que es el 

negocio en relación con sus activos totales. 

 

‐ Return on Equity. Rendimiento sobre el capital. Se calcula dividendo la ganancia neta 

entre el patrimonio de los accionistas. Indica cuanto beneficio es capaz de generar la 

empresa con el dinero que los accionistas invirtieron. 

 ‐ Revenue. Ingresos. Todo el dinero que la compañía recibe por la venta de bienes y 

servicios. 

 ‐ Qtrly Revenue Growth. Crecimiento de ingresos trimestrales. Es el incremento de las 

ventas respecto del anterior trimestre. 

 ‐ Gross Profit. Ganancia bruta. Se calcula restando de los ingresos el coste de producir y 

comercializar los bienes y servicios. 

 ‐ EBITDA (Earnings Before Interest, Taxes, Depreciation And Amortization). Ganancias 

antes de intereses, impuestos, depreciación y amortización. Es esencialmente el 

beneficio neto con los intereses, impuestos, depreciación y amortización añadidos de 

nuevo a él. Se utiliza para analizar y comparar la rentabilidad entre las empresas y las 

industrias, ya que elimina los efectos de financiación y decisiones contables. 

 ‐ Net Income Avl to Common. Beneficio neto disponible para el accionista común. Son las 

ganancias que quedan después de que la compañía pague a todos sus proveedores, 

empleados, acreedores y accionistas preferentes. 

 

‐ Total Cash. Caja. El efectivo en cuenta de la compañía. 

 ‐ Total Debt. Deuda total. La deuda que tiene la compañía con sus acreedores. 

 ‐ Current Ratio. Razón corriente. Es un coeficiente de liquidez que mide la capacidad de 

una empresa para pagar las obligaciones a corto plazo. Cuanto mayor es su valor, mayor 

capacidad para afrontar sus deudas. Se calcula dividiendo los activos corrientes entre los 

pasivos corrientes. 

 ‐ Operating Cash Flow. Flujo de fondos consolidado. En contabilidad, una medida de la 

cantidad de efectivo generado por las operaciones comerciales normales de la empresa. 

El flujo de caja es importante porque indica si una empresa es capaz de generar 

suficiente flujo de caja positivo para mantener y hacer crecer sus operaciones y así no 

tener que recurrir a financiación externa. 

 

Page 6: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

5

‐ Levered Free Cash Flow. Flujo de caja libre apalancado. Es la cantidad de dinero que 

queda para los accionistas después de pagar los intereses de la deuda de la compañía. 

Indica el efectivo disponible para pagar dividendos, invertir en la expansión del negocio 

o endeudarse en busca de más oportunidades de crecimiento. 

 Además de estas variables se obtuvieron otras 2 que serán incluidas en el estudio como 

variables ilustrativas. Estas variables no muestran información acerca del estado financiero de 

la compañía pero sí servirán para estudiar su comportamiento en bolsa: 

‐ Beta. Es un coeficiente que mide la volatilidad o el riesgo de una acción en comparación 

con el mercado en su conjunto.  

 

‐ 52‐Week Change. Es la rentabilidad de la acción en el último año (52 semanas). 

  

Para el tratamiento de los datos se utilizaron los paquetes de software MS Office Excel 2007, 

SPAD 5.5 y SAS 9.2. 

 

4. Análisis de componentes principales 

Para analizar los datos se hace necesario estandarizar las variables originales ya que trabajamos 

con razones, porcentajes y cantidades en dólares, todas ellas de muy distinta magnitud. 

Estadísticas descriptivas de las variables 

Variable  Moyenne  Desv. Estándar  Minimo  Máximo 

Profit Margin (ttm):  ‐0.163  0.652  ‐2.898  1.721 

Operating Margin (ttm):  0.048  0.457  ‐2.462  0.597 

Return on Assets (ttm):  0.027  0.060  ‐0.211  0.201 

Return on Equity (ttm):  ‐0.066  0.333  ‐1.632  0.517 

Revenue (ttm):  2037150000.000  5661520000.000  658480.000  42580000000.000 

Qtrly Revenue Growth (yoy):  0.235  0.764  ‐0.636  4.869 

Gross Profit (ttm):  1072360000.000  2379330000.000  468900.000  13810000000.000 

EBITDA (ttm)6:  874512000.000  1913680000.000  ‐19700000.000  12390000000.000 

Net Income Avl to Common (ttm):  74709000.000  540061000.000  ‐1390000000.000  2420000000.000 

Total Cash (mrq):  218409000.000  853496000.000  28540.000  7000000000.000 

Total Debt (mrq):  1845410000.000  3567610000.000  0.000  16390000000.000 

Current Ratio (mrq):  1.544  1.564  0.080  9.060 

Operating Cash Flow (ttm):  768086000.000  1624170000.000  ‐11600000.000  8500000000.000 

Levered Free Cash Flow (ttm):  ‐456109000.000  1185900000.000  ‐8650000000.000  1180000000.000 

              

Beta:  1.655  0.620  ‐0.350  3.180 

52‐Week Change3:  ‐0.007  0.387  ‐0.826  1.275 

Page 7: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

6

Se utilizará por tanto un ACP normado para eliminar el efecto de la escala de medida y 

conseguir de este modo que todas las variables contribuyan igualmente a la inercia. 

Se analizaron 77 empresas utilizando 14 variables activas y 2 ilustrativas. Los coeficientes de 

correlación entre variables se muestran en la siguiente tabla: 

Matriz de correlaciones 

 

Profit Margin 

(ttm

): 

Operating 

Margin (ttm): 

Return on 

Assets (ttm): 

Return on 

Equity (ttm

): 

Revenue (ttm): 

Qtrly Revenue 

Growth (yo

y): 

Gross Profit 

(ttm

): 

EBITDA (ttm)6: 

Net Income Avl 

to Common: 

Total Cash 

(mrq): 

Total D

ebt 

(mrq): 

Current Ratio 

(mrq): 

Operating Cash 

Flow (ttm): 

Levered Free 

Cash Flow: 

Profit Margin (ttm):  1.00        

Operating Margin (ttm):  0.13  1.00      

Return on Assets (ttm):  0.26  0.84  1.00    

Return on Equity (ttm):  0.86  0.18  0.37  1.00    

Revenue (ttm):  0.11  0.09  0.08  0.15  1.00    

Qtrly Revenue Growth (yoy): 

‐0.19  0.16  0.11  ‐0.19 ‐0.08 1.00                

Gross Profit (ttm):  0.15  0.15  0.10  0.15  0.61  ‐0.10 1.00    

EBITDA (ttm)6:  0.15  0.17  0.11  0.15  0.70  ‐0.09 0.96  1.00    

Net Income Avl to Common (ttm): 

0.33  0.14  0.19  0.42  0.65  ‐0.05 0.61  0.61  1.00          

Total Cash (mrq):  0.08  0.08  0.02  0.08  0.24  ‐0.07 0.48  0.44  0.16  1.00    

Total Debt (mrq):  0.12  0.14  0.07  0.13  0.84  ‐0.07 0.77  0.85  0.54  0.50  1.00  

Current Ratio (mrq):  0.30  0.14  0.28  0.25  ‐0.12 ‐0.10 ‐0.10 ‐0.12 0.00  0.01  ‐0.14  1.00 

Operating Cash Flow (ttm):  0.15  0.16  0.09  0.15  0.66  ‐0.10 0.98  0.97  0.61  0.54  0.84  ‐0.11  1.00 

Levered Free Cash Flow (ttm): 

‐0.12  ‐0.14  ‐0.09 ‐0.13 ‐0.43 0.01  ‐0.38 ‐0.45 ‐0.05 ‐0.37  ‐0.59  0.13  ‐0.47 1.00

 

Se observan fuertes correlaciones entre muchas de las variables, lo que indica que existe 

asociación entre ellas y a efectos prácticos están midiendo un mismo estado de distinta forma. 

Existe por tanto bastante redundancia en la información obtenida, hasta el punto de encontrar 

ocho pares de variables que presentan coeficientes de correlación superiores a 0.8. 

Más adelante se podrá observar de forma visual y más directamente este hecho mediante la 

proyección de las variables sobre el círculo de correlaciones. 

Antes se estudiará el histograma de valores propios para ver cuántos ejes factoriales pueden 

ser necesarios en el análisis. 

 

Page 8: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

7

HISTOGRAMME DES 14 PREMIERES VALEURS PROPRES

+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+ | NUMERO | VALEUR | POURCENTAGE | POURCENTAGE | | | | PROPRE | | CUMULE | | +--------+------------+-------------+-------------+----------------------------------------------------------------------------------+ | 1 | 5.4839 | 39.17 | 39.17 | ******************************************************************************** | | 2 | 2.4284 | 17.35 | 56.52 | ************************************ | | 3 | 1.6140 | 11.53 | 68.04 | ************************ | | 4 | 1.0869 | 7.76 | 75.81 | **************** | | 5 | 0.9016 | 6.44 | 82.25 | ************** | | 6 | 0.7801 | 5.57 | 87.82 | ************ | | 7 | 0.6698 | 4.78 | 92.60 | ********** | | 8 | 0.4582 | 3.27 | 95.88 | ******* | | 9 | 0.2159 | 1.54 | 97.42 | **** | | 10 | 0.1548 | 1.11 | 98.53 | *** | | 11 | 0.0947 | 0.68 | 99.20 | ** | | 12 | 0.0726 | 0.52 | 99.72 | ** | | 13 | 0.0305 | 0.22 | 99.94 | * | | 14 | 0.0085 | 0.06 | 100.00 | * | +--------+------------+-------------+-------------+----------------------------------------------------------------------------------+

 

Con los tres primeros ejes se consigue recoger el 68% de la información. El incremento de la  

información recogida a partir del cuarto eje en adelante resulta menos pronunciado. Los dos 

primeros ejes recogen el 57% de la información y se utilizarán estos para sintetizar los estados 

financieros del sector. 

En el círculo de correlaciones se observa que el primer eje es un factor tamaño, puesto que las 

variables relacionadas con las ventas, beneficios y deuda totales están bien representados en 

este eje. Es de esperar que las compañías grandes, con mayores  ingresos, activos y capacidad 

de endeudarse, se dispongan a la derecha en el gráfico de puntos proyectados. 

 

Page 9: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

8

En el segundo factor tienen mayor ponderación las variables relacionadas con la eficiencia, 

rentabilidad y rendimiento. Aquellas empresas más rentables aparecerán proyectadas en la 

parte superior del gráfico de puntos. 

Este gráfico también pone de manifiesto la fuerte correlación entre ciertas variables que se 

agrupan en dos clases: un grupo de variables relacionada con el tamaño de la empresa y otro 

relacionado con la rentabilidad. Ambos grupos son incorrelados de modo que podemos concluir 

que la rentabilidad y eficiencia de una empresa no están relacionadas con su tamaño. 

Se proyectaron también las variables continuas ilustrativas para establecer para cada una su 

posible asociación con las variables activas. En este caso la variable Beta apenas aparece 

representada en el plano factorial mientras que la variable de rentabilidad en bolsa el último 

año (52‐Week Change) sí pudiera tener cierta asociación con el tamaño y rentabilidad 

financiera de la compañía. La siguiente tabla apoya la lectura del gráfico de correlaciones. 

 

Coordenadas y correlaciones  Antiguos ejes 

Variable  Eje   1  Eje   2  Eje   3 Eje  4 Eje   5 Eje   1 Eje   2 Eje   3  Eje   4  Eje  5

Profit Margin (ttm): 

0.30  0.72  ‐0.46  ‐0.07  ‐0.27  0.13  0.46  ‐0.36  ‐0.07  ‐0.29 

Operating Margin (ttm): 

0.25  0.55  0.71  ‐0.02  0.08  0.11  0.36  0.56  ‐0.02  0.09 

Return on Assets (ttm): 

0.22  0.72  0.57  0.01  0.07  0.09  0.46  0.45  0.01  0.07 

Return on Equity (ttm): 

0.32  0.76  ‐0.40  0.00  ‐0.30  0.14  0.49  ‐0.32  0.00  ‐0.31 

Revenue (ttm):  0.80  ‐0.13  ‐0.03  0.23  ‐0.09  0.34  ‐0.09  ‐0.03  0.22  ‐0.10 

Qtrly Revenue Growth (yoy): 

‐0.12  ‐0.07  0.58  0.26  ‐0.37  ‐0.05  ‐0.05  0.46  0.25  ‐0.39 

Gross Profit (ttm): 

0.91  ‐0.15  0.01  0.06  0.18  0.39  ‐0.09  0.00  0.06  0.19 

EBITDA (ttm)6:  0.94  ‐0.15  0.02  0.07  0.11  0.40  ‐0.10  0.02  0.07  0.12 

Net Income Avl to Common: 

0.70  0.19  ‐0.17  0.54  0.06  0.30  0.12  ‐0.14  0.52  0.06 

Total Cash (mrq):  0.54  ‐0.13  0.03  ‐0.56  0.16  0.23  ‐0.08  0.03  ‐0.54  0.17 

Total Debt (mrq):  0.91  ‐0.20  0.04  ‐0.05  ‐0.07  0.39  ‐0.13  0.03  ‐0.05  ‐0.07 

Current Ratio (mrq): 

‐0.07  0.56  ‐0.11  ‐0.22  0.52  ‐0.03  0.36  ‐0.09  ‐0.21  0.55 

Operating Cash Flow (ttm): 

0.95  ‐0.16  0.02  0.00  0.13  0.41  ‐0.11  0.01  0.00  0.14 

Levered Free Cash Flow (ttm): 

‐0.55  0.11  ‐0.14  0.54  0.46  ‐0.24  0.07  ‐0.11  0.52  0.48 

Page 10: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

9

 Coordenadas y corrs. variables ilustrativas  Antiguos ejes 

Beta:  ‐0.04  0.01  0.01  0.07  ‐0.05          

52‐Week Change3: 

0.13  0.12  ‐0.05  0.00  ‐0.12          

 

Para el primer eje las correlaciones positivas de Gross Profit, EBITDA, Total Debt y Operating 

Cash Flow, todas mayores de 0.9, indican que el primer eje factorial y estas variables están 

dando una misma medida acerca del tamaño de la compañía. 

La variable Levered Free Cash Flow está negativamente correlada con el primer eje. Cabe 

recordar que esta variable indica el dinero que queda disponible después de pagar los intereses 

de la deuda de la compañía. Entonces resulta lógico que la correlación de esta variable con la 

variable Total Debt sea negativa y se proyecten en sentidos opuestos. 

Para el segundo eje las variables que presentan mayor correlación son Return on Equity, Profit 

Margin, Return on Assets y Current Ratio. Al ser además positivas esto implica que valores altos 

de este segundo factor indican que la compañía es rentable, eficiente y que puede afrontar sus 

pagos. Este segundo es por tanto un factor de rentabilidad. Valores bajos de este factor indican 

que la empresa sufre pérdidas. 

En el tercer eje vuelven a aparecer variables relacionadas con la eficiencia (Operating Margin) 

de modo que no resulta fácil darle una interpretación distinta al del segundo factor. Por tanto 

ceñiremos el análisis al primer plano factorial. 

 

Plano factorial 

Factor  Significado  Contrapone  %  % acu 

1  Tamaño de la empresa Ingresos y deuda 

Pequeños / Grandes 39.17  39.17 

2  Rentabilidad y eficiencia Rentabilidad 

Pérdidas / Ganancias 17.35  56.52 

 

Se representan a continuación los elementos proyectados sobre el plano factorial. El grosor de 

los puntos es proporcional a la contribución absoluta de cada elemento al primer eje. Destaca 

claramente un pequeño grupo de empresas (APA, APC, EPD, DVN,…) que es responsable de la 

aparición del primer eje. 

Page 11: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

10

 

Se observa que esta industria está formada por una pequeña cantidad de empresas muy 

grandes con valores positivos del primer factor y  por otra parte un gran número de empresas 

mucho más pequeñas con valores negativos de este factor y que toman valores amplios en el 

segundo factor. 

En este caso no tendría sentido pensar en las compañías grandes como individuos atípicos ya 

que su importancia y peso en el sector las hace imprescindibles en este análisis. Su omisión sólo 

tendría sentido en caso de que estuviésemos interesados únicamente en el análisis de las 

compañías pequeñas. 

En el siguiente gráfico se vuelve a representar la proyección de cada punto esta vez con 

grosores proporcionales a las contribuciones relativas, observándose que la calidad de la 

representación es alta para buena parte de las compañías. 

Page 12: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

11

 

A la vista de estos gráficos podemos concluir que existen al menos dos grupos de compañías 

dentro del sector: un grupo reducido de compañías grandes (valores positivos del segundo 

factor) y un grupo numeroso de compañías pequeñas (valores negativos).  

Entre ambos grupos existen diferencias en su estructura atendiendo a la dispersión que 

presentan sobre el segundo factor. El grupo de compañías grandes se extiende sobre un rango 

más reducido del segundo factor que el grupo de compañías pequeñas. 

En el grupo de compañías pequeñas encontramos empresas que consiguen ser rentables y 

eficientes (valores positivos del segundo factor) pero también se observan empresas con 

grandes problemas (valores negativos) que pronto estarán en bancarrota de no cambiar su 

situación. 

 

5. Clasificación jerárquica ascendente 

Con el fin de estudiar a fondo la estructura del sector de las compañías productoras de gas y 

petróleo se busca encontrar grupos homogéneos que se diferencien lo máximo entre sí para 

conocer las clases de empresas que podemos encontrar. 

La proyección en el plano vectorial ya nos permitió distinguir algunos de estos grupos a simple 

vista. A continuación realizaremos una clasificación jerárquica ascendente por el método de 

Ward. 

 

Page 13: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

12

DESCRIPTION DES 50 NOEUDS D'INDICES LES PLUS ELEVES NUM. AINE BENJ EFF. POIDS INDICE HISTOGRAMME DES INDICES DE NIVEAU 104 96 18 3 3.00 0.00705 * 105 86 94 5 5.00 0.00726 * 106 91 99 7 7.00 0.00727 * 107 26 21 2 2.00 0.00815 * 108 72 98 5 5.00 0.01098 * 109 102 64 3 3.00 0.01392 * 110 108 65 6 6.00 0.01432 * 111 13 7 2 2.00 0.01655 * 112 107 31 3 3.00 0.01724 * 113 100 101 6 6.00 0.01823 * 114 110 105 11 11.00 0.01828 * 115 51 39 2 2.00 0.01934 * 116 77 71 2 2.00 0.02019 * 117 113 103 8 8.00 0.02027 * 118 38 41 2 2.00 0.02031 * 119 92 104 5 5.00 0.02052 * 120 60 58 2 2.00 0.02399 * 121 47 45 2 2.00 0.02464 * 122 97 85 8 8.00 0.02599 * 123 109 43 4 4.00 0.02751 * 124 23 12 2 2.00 0.02862 * 125 15 6 2 2.00 0.02990 * 126 8 111 3 3.00 0.03216 * 127 122 95 10 10.00 0.03541 * 128 112 106 10 10.00 0.03652 * 129 119 55 6 6.00 0.03975 * 130 126 125 5 5.00 0.05124 ** 131 75 115 3 3.00 0.05312 ** 132 130 11 6 6.00 0.09184 ** 133 121 114 13 13.00 0.09501 ** 134 4 2 2 2.00 0.10542 *** 135 133 128 23 23.00 0.11473 *** 136 116 117 10 10.00 0.11837 *** 137 127 124 12 12.00 0.12222 *** 138 62 118 3 3.00 0.12517 *** 139 123 120 6 6.00 0.13132 *** 140 137 129 18 18.00 0.16825 **** 141 139 29 7 7.00 0.17169 **** 142 132 3 7 7.00 0.19799 **** 143 140 135 41 41.00 0.26693 ****** 144 70 136 11 11.00 0.49328 ********** 145 134 1 3 3.00 0.54180 *********** 146 10 5 2 2.00 0.57151 ************ 147 131 143 44 44.00 0.59799 ************ 148 141 138 10 10.00 0.62376 ************* 149 147 142 51 51.00 0.77033 **************** 150 148 144 21 21.00 0.84990 ***************** 151 146 145 5 5.00 1.11632 ********************** 152 150 149 72 72.00 1.70328 ********************************** 153 152 151 77 77.00 4.07570 ********************************************************************************* SOMME DES INDICES DE NIVEAU = 13.79364

 

El histograma de índice de nivel muestra saltos importantes en los primeros tres niveles. Una 

mirada al dendograma nos muestra que tres particiones resultarán adecuadas para nuestro 

propósito. 

Vistos los resultados ya se puede anticipar que hay dos grupos muy distantes entre sí, que 

serán los formados por compañías grandes uno y por compañías más pequeñas el otro. Dentro 

del grupo de compañías pequeñas aparecen dos subgrupos distantes: un gran grupo de 

compañías viables y otro más pequeño de compañías en pérdidas. 

Page 14: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

13

 

 

 

Page 15: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

14

Las siguientes tablas muestran información sobre la consolidación de la partición. 

+-----------+------------+------------+------------+ | ITERATION | I.TOTALE | I.INTER | QUOTIENT | +-----------+------------+------------+------------+ | 0 | 13.79364 | 5.77898 | 0.41896 | | 1 | 13.79364 | 6.24733 | 0.45291 | | 2 | 13.79364 | 6.27079 | 0.45461 | | 3 | 13.79364 | 6.27079 | 0.45461 | | 4 | 13.79364 | 6.27079 | 0.45461 | +-----------+------------+------------+------------+ DECOMPOSITION DE L'INERTIE CALCULEE SUR 10 AXES. +----------------+-----------------+-------------+-------------------+-----------------+ | | INERTIES | EFFECTIFS | POIDS | DISTANCES | | INERTIES | AVANT APRES | AVANT APRES | AVANT APRES | AVANT APRES | +----------------+-----------------+-------------+-------------------+-----------------+ | | | | | | | INTER-CLASSES | 5.7790 6.2708 | | | | | | | | | | | INTRA-CLASSE | | | | | | | | | | | | CLASSE 1 / 3 | 2.3351 2.4327 | 5 6 | 5.00 6.00 |58.6901 53.5035 | | CLASSE 2 / 3 | 2.9898 2.2885 | 51 47 | 51.00 47.00 | 0.7361 1.0371 | | CLASSE 3 / 3 | 2.6898 2.8017 | 21 24 | 21.00 24.00 | 5.4280 4.7119 | | | | | | | | TOTALE |13.7936 13.7936 | | | | +----------------+-----------------+-------------+-------------------+-----------------+

 

Tras la consolidación un elemento pasa de la clase 2 a la 1 y otros tres elementos pasan de la 

clase 2 a la 3. A partir de la segunda iteración los grupos ya no varían por lo que la partición 

original era bastante estable. 

A continuación se muestra la representación de puntos en el plano factorial asignando un color 

a cada grupo recién formado. 

 

Page 16: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

15

Se observan claramente las tres clases que veníamos apuntando desde un principio: 

‐ Un pequeño grupo de grandes compañías (clase 1) 

‐ Un grupo de compañías más pequeñas y rentables (clase 2) 

‐ Un grupo de compañías pequeñas y con problemas financieros (clase 3)  

 

6. Caracterización de las clases 

En esta última parte se comparan las medias de las clases con respecto a la media general para 

todas las variables incluidas las ilustrativas. 

 

CLASE  1 /  3        (Puntos  =      6.00 ) 

Variables Media de la 

clase Media general 

Desv. Est. Dentro de la 

clase

Desv. Est. general 

Valor r‐Test

Prob. 

Total Debt (mrq):  12433300000  1845410000  3130680000 3567610000  7.52  0.000 

Operating Cash Flow (ttm):  5570000000  768086000  2169780000 1624170000  7.49  0.000 

EBITDA (ttm)6:  6431670000  874512000  2892260000 1913680000  7.36  0.000 

Gross Profit (ttm):  7773330000  1072360000  4055870000 2379330000  7.14  0.000 

Revenue (ttm):  17658300000  2037150000 1140770000

05661520000  6.99  0.000 

Total Cash (mrq):  1762520000  218409000  2491920000 853496000  4.58  0.000 

Net Income Avl to Common: 1041380000  74709000  1277380000 540061000  4.54  0.000 

Return on Equity (ttm):  0.064  ‐0.066  0.074  0.333  0.99  0.160 

Profit Margin (ttm):  0.055  ‐0.163  0.079  0.652  0.85  0.198 

Operating Margin (ttm):  0.192  0.048  0.112  0.457  0.80  0.212 

Return on Assets (ttm):  0.041  0.027  0.019  0.060  0.62  0.268 

52‐Week Change3:  0.077  ‐0.007  0.149  0.387  0.55  0.292 

                    

Qtrly Revenue Growth (yoy): 

0.057  0.235  0.184  0.764  ‐0.59  0.277 

Beta:  1.487  1.655  0.496  0.620  ‐0.69  0.245 

Current Ratio (mrq):  1.095  1.544  0.419  1.564  ‐0.73  0.233 

Levered Free Cash Flow (ttm): 

‐3097230000  ‐456109000  2832650000 1185900000  ‐5.64  0.000 

 

La clase 1 se compone únicamente de seis elementos pero que tienen un gran peso en sector. 

En la clase 1 las variables Total Debt, Operating Cash Flow, EBITDA, Gross Profit, Revenue, Total 

Cash y Net income Avl to Common presentan medias significativamente superiores a las medias 

generales suponiendo que dichas variables se distribuyan de forma normal. 

La media de la variable Levered Free Cash Flow es significativamente menor. 

Page 17: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

16

CLASE  2 /  3        (Puntos =     47.00  ) 

Variables Media de la 

clase Media general 

Desv. Est. Dentro de la 

clase

Desv. Est. general 

Valor r‐Test

Prob. 

Return on Equity (ttm):  0.088  ‐0.066 0.116 0.333  5.04  0.000

Return on Assets (ttm):  0.053  0.027 0.048 0.060  4.73  0.000

Profit Margin (ttm):  0.112  ‐0.163 0.146 0.652  4.60  0.000

Operating Margin (ttm):  0.237  0.048 0.174 0.457  4.51  0.000

Current Ratio (mrq):  1.962  1.544 1.814 1.564  2.91  0.002

Levered Free Cash Flow (ttm): 

‐323590000  ‐456109000  493822000  1185900000  1.22  0.111 

52‐Week Change3:  0.035  ‐0.007 0.397 0.387  1.18  0.118

Beta:  1.691  1.655 0.609 0.620  0.62  0.266

Net Income Avl to Common: 95149000 74709000 200584000 540061000  0.41  0.340

                 

Qtrly Revenue Growth (yoy): 0.187  0.235 0.473 0.764  ‐0.68  0.247

Total Cash (mrq):  122603000 218409000 258207000 853496000  ‐1.22  0.110

Gross Profit (ttm):  641694000 1072360000 889939000 2379330000  ‐1.98  0.024

EBITDA (ttm)6:  525219000 874512000 746176000 1913680000  ‐1.99  0.023

Operating Cash Flow (ttm):  465965000 768086000 674198000 1624170000  ‐2.03  0.021

Revenue (ttm):  924516000 2037150000 1348820000 5661520000  ‐2.14  0.016

Total Debt (mrq):  1067790000  1845410000  1766980000 3567610000  ‐2.38  0.009 

 

La clase 2 es la más amplia de las tres. Incluye a 47 compañías pequeñas y medianas con 

razones financieras que indican que su negocio es rentable.  

En la clase 2 las variables Return on Equity, Return on Assets, Profit Margin, Operating Margin y 

Current Ratio presentan medias significativamente superiores a las medias generales. 

Las variables Total Debt, Operating Cash Flow, EBITDA, Gross Profit, Revenue, Total Cash 

presentan medias significativamente inferiores. 

 

 

 

 

 

 

 

 

Page 18: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

17

CLASE  3 /  3        (Puntos =     24.00) 

Variables Media de la 

clase Media general 

Desv. Est. Dentro de la 

clase

Desv. Est. general 

Valor r‐Test

Prob. 

Levered Free Cash Flow (ttm): 

‐55345000  ‐456109000  299419000  1185900000  1.98  0.024 

Qtrly Revenue Growth (yoy): 0.373  0.235 1.180 0.764  1.06  0.144

                 

Beta:  1.628  1.655 0.658 0.620  ‐0.26  0.398

Total Cash (mrq):  20001700 218409000 27015800 853496000  ‐1.36  0.086

52‐Week Change3:  ‐0.110  ‐0.007 0.389 0.387  ‐1.56  0.049

Revenue (ttm):  310772000 2037150000 573935000 5661520000  ‐1.79  0.037

Total Debt (mrq):  721254000 1845410000 1340360000 3567610000  ‐1.85  0.032

Gross Profit (ttm):  240501000 1072360000 467593000 2379330000  ‐2.05  0.020

EBITDA (ttm)6:  169255000 874512000 333135000 1913680000  ‐2.16  0.015

Operating Cash Flow (ttm):  159261000 768086000 286667000 1624170000  ‐2.20  0.014

Current Ratio (mrq):  0.838  1.544 0.683 1.564  ‐2.65  0.004

Net Income Avl to Common: ‐206987000 74709000 367775000 540061000  ‐3.06  0.001

Operating Margin (ttm):  ‐0.358  0.048 0.606 0.457  ‐5.21  0.000

Profit Margin (ttm):  ‐0.756  ‐0.163 0.900 0.652  ‐5.33  0.000

Return on Assets (ttm):  ‐0.028  0.027 0.050 0.060  ‐5.34  0.000

Return on Equity (ttm):  ‐0.400  ‐0.066  0.407  0.333  ‐5.88  0.000 

 

La clase 3 está compuesta por 24 compañías de tamaño pequeño y con problemas financieros. 

Posiblemente dentro de unos años muchas de las compañías de este grupo dejarán de existir. 

En la clase 3 la variable Levered Free Cash Flow presenta una media significativamente superior 

a las media general suponiendo que dicha variable se distribuya de forma normal. 

La media de las variables Return on Equity, Return on Assets, Profit Margin, Operating Margin, 

Net income Avl to Common, Current Ratio son significativamente menores a la media general. 

Los valores negativos de estas medias nos dicen que el grupo está pasando por graves 

dificultades económicas y muchas de estas empresas acabarán desapareciendo. 

También las variables Total Debt, Operating Cash Flow, EBITDA, Gross Profit, Revenue, Total 

Cash presentan medias significativamente inferiores. 

 

A continuación se realiza el estudio de las variables ilustrativas con el fin de obtener 

información acerca del comportamiento medio de las cotizaciones de las acciones de cada 

grupo en la bolsa de Nueva York.  

En primer lugar para la variable Beta se realiza un test de normalidad para comprobar si los test 

de diferencia de medias anteriores son aplicables. 

Page 19: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

18

Se realizaron tests de normalidad para la variable Beta en cada clase y no se rechazó en 

ninguna: 

Clase 1:  

N 6 Sum Weights 6 Mean 1.48666667 Sum Observations 8.92 Std Deviation 0.54283208 Variance 0.29466667 Skewness 0.32636819 Kurtosis 1.0340625 Uncorrected SS 14.7344 Corrected SS 1.47333333 Coeff Variation 36.5133686 Std Error Mean 0.22161027 Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.944777 Pr < W 0.6979 Kolmogorov-Smirnov D 0.237336 Pr > D >0.1500 Cramer-von Mises W-Sq 0.05845 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.311175 Pr > A-Sq >0.2500 

Clase 2: 

N 47 Sum Weights 47 Mean 1.6906383 Sum Observations 79.46

Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.978078 Pr < W 0.5153 Kolmogorov-Smirnov D 0.074601 Pr > D >0.1500 Cramer-von Mises W-Sq 0.028293 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.251846 Pr > A-Sq >0.2500 

Clase 3: 

 

N 24 Sum Weights 24 Mean 1.62791667 Sum Observations 39.07

Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.940261 Pr < W 0.1653 Kolmogorov-Smirnov D 0.104522 Pr > D >0.1500 Cramer-von Mises W-Sq 0.038441 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.357935 Pr > A-Sq >0.2500 

 

Para la variable ilustrativa Beta no se encontraron diferencias significativas para las medias de 

ninguna clase con la media general (p‐valores 0.245, 0.266, 0.398). 

Page 20: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

19

 

No puede afirmarse que exista relación entre la volatilidad esperada de la acción de una 

compañía y la clase a la que pertenece. 

Para la variable 52‐Week Change tampoco se rechazan los test de normalidad para cada clase: 

Clase 1:  

N 6 Sum Weights 6 Mean 0.07693333 Sum Observations 0.4616 Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.872236 Pr < W 0.2353 Kolmogorov-Smirnov D 0.239648 Pr > D >0.1500 Cramer-von Mises W-Sq 0.073934 Pr > W-Sq 0.2141 Anderson-Darling A-Sq 0.427048 Pr > A-Sq 0.2092

Clase 2: 

N 47 Sum Weights 47 Mean 0.03523617 Sum Observations 1.6561

Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.869462 Pr < W 0.2001 Kolmogorov-Smirnov D 0.182725 Pr > D 0.2100 Cramer-von Mises W-Sq 0.325813 Pr > W-Sq 0.2050 Anderson-Darling A-Sq 2.007678 Pr > A-Sq <0.2050 

Page 21: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

20

Clase 3: 

N 24 Sum Weights 24 Mean -0.1100292 Sum Observations -2.6407

Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.905518 Pr < W 0.2282 Kolmogorov-Smirnov D 0.189131 Pr > D 0.2245 Cramer-von Mises W-Sq 0.176005 Pr > W-Sq 0.2096 Anderson-Darling A-Sq 0.987622 Pr > A-Sq 0.2112 

 

La variable 52‐Week Change sí presenta diferencia de medias entre los grupos. 

La clase 1 no es significativamente distinta de la media general (p‐valor = 0.292). 

La clase 2 tampoco resulta significativamente distinta de la media general (p‐valor = 0.111) a no 

ser que estemos dispuestos a aceptar un nivel de confianza menor al 88,9%. 

La clase 3 sí resulta significativamente distinta de la media global (p‐valor = 0.049). 

 

Se puede concluir que existen diferencias en la rentabilidad esperada del último año en bolsa 

de las  acciones dependiendo de en qué grupo se encuentre la compañía. Las acciones de las 

compañías pequeñas y con problemas financieros se comportaron de media peor que sus 

competidoras en el último año. 

 

 

 

Page 22: ANÁLISIS DE DATOS - UVavalentin/ad3g/2013/TFA/JoseE_Puentes_energia.pdf · fracking) posibilitaron la extracción de gas y petróleo del subsuelo allí donde antes no podía extraerse

21

7. Conclusiones 

Mediante el Análisis de Componentes Principales se realizó un estudio exploratorio acerca de la 

situación financiera de las compañías independientes del sector del gas y del petróleo en 

Estados Unidos. 

El ACP mostró que gran cantidad de razones y estados financieros utilizados comúnmente para 

el análisis de compañías cotizadas en la bolsa son redundantes. Muchas de estas variables 

aportan la misma información y se puede prescindir de algunas de ellas. 

La mayor fuente de variabilidad de los datos financieros está asociada al tamaño del negocio de 

una empresa, que contrapone compañías con grandes ventas, recursos y capital con compañías 

con un volumen de ingresos y activos pequeño en comparación. 

La segunda fuente de variabilidad es la rentabilidad y eficiencia de las empresas, pudiéndose 

distinguir entre empresas que obtienen beneficios y rentabilizan sus activos con empresas 

cuyos ingresos no cubren los gastos y amortizaciones. 

El sector se compone de un grupo pequeño de grandes compañías con un negocio asentado, a 

las que hay que sumar una gran cantidad de compañías pequeñas que con más o menos éxito 

buscan y explotan yacimientos de gas y petróleo. 

Mediante clasificación automática se estudiaron las distintas clases de compañías de la 

industria atendiendo a los estados financieros de estas. Se generó una partición en tres clases 

bien definidas: 

‐ Compañías con un gran volumen de negocio 

‐ Compañías con un volumen de negocio mucho menor y que son rentables 

‐ Compañías con un pequeño volumen de negocio y que no son rentables 

Se estudio además el comportamiento de la cotización en bolsa de las compañías atendiendo al 

grupo al que pertenecían. Se concluyó que la volatilidad esperada de la acción era la misma 

para las tres clases. 

Se observó que la rentabilidad media del último año había resultado inferior para las compañías 

que habían presentado peores resultados (tercer grupo) que para el resto del sector.