La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos...

12
1 La minería de datos como factor potenciador de éxito de startups en Costa Rica Álvarez-Escobar, Rigoberto ULACIT San José, Costa Rica [email protected] Arias-Quirós, José ULACIT San José, Costa Rica [email protected] Córdoba-Retana, Julio ULACIT San José, Costa Rica [email protected] ResumenAproximadamente, 9 de cada 10 startups están destinadas a fracasar; son muchos los factores que pueden incidir en el éxito o el fracaso de estas. Este trabajo presenta la propuesta de un modelo de predicción de éxito de startups en el ecosistema costarricense; el cual, mediante la aplicación de técnicas de minería de datos, permitirá anticipar el éxito o el fracaso de estos emprendimientos, así como identificar los factores que influyen en esta predicción. Palabras clave; startup, big data, minería de datos. AbstractOn average, 9 of 10 startups fail, several factors can be directly influencing on this. This paper presents a startups success prediction model adapted to the ecosystem in Costa Rica. Using data mining techniques over this model will allow to foretell the eventual success or failure of the startups, as well as identifying the factors influencing on this prediction. Keywords-component; startup, big data, data mining. I. INTRODUCCIÓN Las compañías startups han venido en aumento en los últimos años en Costa Rica, gracias al mejoramiento continuo de la infraestructura del ecosistema, por ejemplo, creación de incubadoras, competencias gubernamentales para patrocinios, firmas e inversionistas especializados en capital de emprendimiento, cobertura mediática, entre otros [15]. Uno de los principales retos que enfrentan los emprendedores, los inversionistas o los interesados en lograr el éxito de una startup que busca incursionar en el mercado costarricense es el tener la certeza de que la idea, el producto o el negocio tendrá éxito a corto o mediano plazo [4]. Una de las principales diferencias entre una startup y una pyme es que la primera tiene un mayor grado de innovación y, por lo tanto, de incertidumbre [15]. Existe una serie de factores críticos que se pueden tomar en cuenta para saber si un emprendimiento de esta naturaleza tendrá altas probabilidades de éxito. Para ello es necesario contar con datos relevantes de otros emprendimientos similares que ayuden a mitigar este problema, los cuales son recolectados durante todo su ciclo de vida [16]. La cantidad de datos disponibles, ya sean estructurados -datos recolectados transaccionalmente- o no estructurados -correos electrónicos, posts o comentarios en redes sociales y otras fuentes-, así como su exploración y análisis representan una verdadera oportunidad para este tipo de compañías [1]. La minería de datos es una rama que encaja perfectamente en este escenario. Adquiere una enorme importancia dada la rapidez del crecimiento de datos en la actualidad y los avances tecnológicos en infraestructuras que permiten la captura, el análisis y la presentación de resultados en tiempo real. Todo esto habilita la automatización de decisiones que tradicionalmente han sido dependientes del factor humano. Si esto último no fuera posible debido a la complejidad del análisis, la minería de datos provee aproximaciones confiables gracias al análisis estadístico [2]. Muchas de las compañías exitosas a nivel mundial utilizan minería de datos para potenciar sus negocios actuales, descubrir oportunidades de mercado y mejorar procesos, además, les permite analizar el uso de los recursos actuales para poderlos optimizar y ganar terreno de sus competidores [2]. Gracias a la proliferación de Software as a Service (SaaS por sus siglas en inglés), se han abaratado los costos para acceder a una infraestructura que soporte el análisis de grandes volúmenes de datos como lo propone la minería de datos, factor que ha venido a beneficiar a empresas como los startups, las aceleradoras y las incubadoras, que no tienen el capital que posee una empresa ya establecida y que las pondría en una desventaja competitiva [3]. La incertidumbre generada en cuanto al éxito o el fracaso de la idea inicial y la puesta en marcha durante todo el ciclo de vida son áreas en las que la minería de datos puede servir de apoyo en la toma de decisiones y así ayudar a todos los involucrados, desde los ángeles inversores para decidir estadísticamente entre varias propuestas para seleccionar las mejores opciones, hasta las incubadoras para aprender en forma automatizada sobre los procesos de selección previos propios y de otras incubadoras, así como predecir los mejores pasos para los emprendimientos que han acogido. Ante esto, se plantea una serie de interrogantes que se pretenden abordar a lo largo del artículo. ¿Cuál es la información que puede generar un proceso de minería de datos cuyo fin es predecir el éxito o fracaso de una startup y por qué contribuye a su potenciación? Esta interrogante será el centro de esta investigación. Como se mencionó anteriormente, existen muchos factores críticos que juegan un papel muy importante en la puesta en

Transcript of La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos...

Page 1: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

1

La minería de datos como factor potenciador de éxito

de startups en Costa Rica

Álvarez-Escobar, Rigoberto

ULACIT

San José, Costa Rica

[email protected]

Arias-Quirós, José

ULACIT

San José, Costa Rica

[email protected]

Córdoba-Retana, Julio

ULACIT

San José, Costa Rica

[email protected]

Resumen—Aproximadamente, 9 de cada 10 startups están

destinadas a fracasar; son muchos los factores que pueden

incidir en el éxito o el fracaso de estas. Este trabajo presenta

la propuesta de un modelo de predicción de éxito de startups

en el ecosistema costarricense; el cual, mediante la

aplicación de técnicas de minería de datos, permitirá

anticipar el éxito o el fracaso de estos emprendimientos, así

como identificar los factores que influyen en esta

predicción.

Palabras clave; startup, big data, minería de datos.

Abstract—On average, 9 of 10 startups fail, several factors

can be directly influencing on this. This paper presents a

startups success prediction model adapted to the ecosystem

in Costa Rica. Using data mining techniques over this model

will allow to foretell the eventual success or failure of the

startups, as well as identifying the factors influencing on this

prediction.

Keywords-component; startup, big data, data mining.

I. INTRODUCCIÓN

Las compañías startups han venido en aumento en los

últimos años en Costa Rica, gracias al mejoramiento continuo

de la infraestructura del ecosistema, por ejemplo, creación de

incubadoras, competencias gubernamentales para patrocinios,

firmas e inversionistas especializados en capital de

emprendimiento, cobertura mediática, entre otros [15]. Uno de

los principales retos que enfrentan los emprendedores, los

inversionistas o los interesados en lograr el éxito de una startup

que busca incursionar en el mercado costarricense es el tener la

certeza de que la idea, el producto o el negocio tendrá éxito a

corto o mediano plazo [4].

Una de las principales diferencias entre una startup y una

pyme es que la primera tiene un mayor grado de innovación y,

por lo tanto, de incertidumbre [15]. Existe una serie de factores

críticos que se pueden tomar en cuenta para saber si un

emprendimiento de esta naturaleza tendrá altas probabilidades

de éxito. Para ello es necesario contar con datos relevantes de

otros emprendimientos similares que ayuden a mitigar este

problema, los cuales son recolectados durante todo su ciclo de

vida [16]. La cantidad de datos disponibles, ya sean

estructurados -datos recolectados transaccionalmente- o no

estructurados -correos electrónicos, posts o comentarios en

redes sociales y otras fuentes-, así como su exploración y

análisis representan una verdadera oportunidad para este tipo de

compañías [1].

La minería de datos es una rama que encaja perfectamente

en este escenario. Adquiere una enorme importancia dada la

rapidez del crecimiento de datos en la actualidad y los avances

tecnológicos en infraestructuras que permiten la captura, el

análisis y la presentación de resultados en tiempo real. Todo

esto habilita la automatización de decisiones que

tradicionalmente han sido dependientes del factor humano. Si

esto último no fuera posible debido a la complejidad del

análisis, la minería de datos provee aproximaciones confiables

gracias al análisis estadístico [2].

Muchas de las compañías exitosas a nivel mundial utilizan

minería de datos para potenciar sus negocios actuales, descubrir

oportunidades de mercado y mejorar procesos, además, les

permite analizar el uso de los recursos actuales para poderlos

optimizar y ganar terreno de sus competidores [2].

Gracias a la proliferación de Software as a Service (SaaS

por sus siglas en inglés), se han abaratado los costos para

acceder a una infraestructura que soporte el análisis de grandes

volúmenes de datos como lo propone la minería de datos, factor

que ha venido a beneficiar a empresas como los startups, las

aceleradoras y las incubadoras, que no tienen el capital que

posee una empresa ya establecida y que las pondría en una

desventaja competitiva [3].

La incertidumbre generada en cuanto al éxito o el fracaso de

la idea inicial y la puesta en marcha durante todo el ciclo de vida

son áreas en las que la minería de datos puede servir de apoyo

en la toma de decisiones y así ayudar a todos los involucrados,

desde los ángeles inversores para decidir estadísticamente entre

varias propuestas para seleccionar las mejores opciones, hasta

las incubadoras para aprender en forma automatizada sobre los

procesos de selección previos propios y de otras incubadoras,

así como predecir los mejores pasos para los emprendimientos

que han acogido.

Ante esto, se plantea una serie de interrogantes que se

pretenden abordar a lo largo del artículo.

¿Cuál es la información que puede generar un proceso de

minería de datos cuyo fin es predecir el éxito o fracaso de una

startup y por qué contribuye a su potenciación? Esta

interrogante será el centro de esta investigación.

Como se mencionó anteriormente, existen muchos factores

críticos que juegan un papel muy importante en la puesta en

Page 2: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

2

marcha de una startup y que contribuyen a su evolución de

forma positiva; sin embargo, no todos pueden ser cuantificados

con precisión y confiabilidad, por ende, no deberían ser

considerados desde la perspectiva de minería de datos. He aquí

la otra interrogante: ¿Cuáles factores críticos contribuyen al de

éxito de una startup y a la vez son los más comunes en varios

contextos -geográfico, social, económico-, y cuáles de estos

factores se pueden considerar para minería de datos?

En relación con el contexto geográfico, ¿cómo se construiría

un modelo de predicción de éxito o fracaso de startups adaptado

al ecosistema costarricense y potenciado por herramientas de

minería de datos, en donde estas puedan sacar provecho de las

predicciones resultantes en una etapa temprana y así potenciar

su éxito?

Ante esta problemática, se plantea la siguiente hipótesis: las

compañías startup, por su morfología y características

especiales que las hacen cambiantes e impredecibles, pueden

verse grandemente beneficiadas por medio de la creación de un

modelo de predicción de éxito ajustado al entorno costarricense

que pueda ser cuantificado y ejecutado por un proceso de

minería de datos, tomando como datos las experiencias de otras

startups -factores de éxito- nacionales.

El siguiente artículo está organizado de la siguiente manera:

la sección 2 representa el marco teórico; define los principales

conceptos utilizados en esta investigación, además, describe y

menciona los trabajos relacionados con la adopción del Big

Data y la minería de datos dentro del ecosistema de las startups.

La sección 3 describe la metodología utilizada en este trabajo

para poder realizar el análisis de resultados presentado en la

sección 4. Se muestran las conclusiones del análisis aplicado al

ecosistema de startups costarricense en la sección 5. Por último,

en la sección 6, se mencionan las limitaciones y el trabajo

futuro.

II. MARCO TEÓRICO

¿Qué es una startup? La palabra en sí se ha utilizado durante

los últimos tiempos con distintas definiciones. En ocasiones,

describen compañías de tecnología, negocios iniciales

comandados por jóvenes que no necesariamente tienen definido

un nicho o un mercado.

Neil Blumental, CEO de la compañía Wardy Paker dedicada

a la prescripción de anteojos -que nace producto de una startup-

, describe una startup como una compañía que trata de

solucionar un problema donde la solución no es obvia y el éxito

no está garantizado [5].

Se debe tener claro que existe una diferencia entre lo que

realmente es una startup y un pequeño negocio o pymes como

se le conoce en Costa Rica.

Paul Graham, cabeza de la incubadora de startups Y

Combinator, la más poderosa del mundo, cree que esta

diferencia debe marcarse principalmente por el crecimiento. La

principal característica es que una startup está directamente

relacionada con la habilidad de crecer año con año, una

compañía con hasta 5 años en el mercado puede considerarse

startup si continúa creciendo a un ritmo acelerado, comenta

Paul. En un ejemplo claro, el pequeño inversor que crea un

restaurante de comida tradicional en el pueblo, este tipo de

negocio no puede considerarse como un startup si el negocio no

mantiene un ritmo acelerado durante los primeros años. Para

crecer rápido, se necesita un producto innovador que pueda

venderse en el mercado, un restaurante no crece rápidamente si

este no representa una innovación [7].

Otra confusión común es utilizar el término

emprendimiento como sinónimo de startup; un cafetalero, un

artesano o incluso una empresa de diseño gráfico son

emprendimientos, pero no startups. Bajo este concepto, Eric

Ries, creador de la metodología Lean Startup, define una

startup como “una institución humana diseñada para crear un

nuevo producto o servicio bajo condiciones de extrema

incertidumbre”, de nuevo, haciendo alusión al potencial éxito o

bien fracaso de la idea [8].

Debido al gran auge que han tenido las startups en los

últimos años, más “jugadores” se han sumado al ecosistema de

estas. Entre ellos: las incubadoras, las aceleradoras y los

inversores ángel.

Según Susan Cohen, quien estudia de cerca las firmas

participantes en programas de aceleración de startups,

primeramente, se debe hacer una clara distinción entre ellos ya

que no todos tienen o comparten el mismo objetivo, aunque sí

tienen una meta clara: ayudar en las etapas tempranas de una

startup.

Las incubadoras tienen como principal objetivo proveer

ayuda en diferentes áreas para que las startups se pueden hacer

fuertes antes de ser independientes, la mayoría de estas

incubadoras se basan en el sustento económico y comúnmente

están asociadas o afiliadas a una universidad, como lo es el caso

de la Incubadora de Empresas del Instituto Tecnológico de

Costa Rica (CIE-TEC).

El CIE-TEC ofrece acompañamiento administrativo, y la

posibilidad para aquellas empresas que están empezando con

sus operaciones de contar con un espacio físico. A su vez, esta

incubadora brinda ciertos beneficios y servicios que de otra

manera implicaría gastos adicionales [27].

A pesar de que el CIE-TEC se ha mantenido durante varios

años siendo una impulsadora de startups y pymes en Costa

Rica, no todas las universidades nacionales han incursionado en

este tipo de organizaciones, ni todas cuentan con los recursos

necesarios. Dentro de estos recursos, se debe contar con centros

de investigación y desarrollo, laboratorios de cómputo, la

disponibilidad de expertos en diversos temas relacionados con

el tipo de negocios en que las potenciales startups van a

incursionar. Además de lo anterior, se debe establecer el rol de

la universidad en el proceso de crear compañías y hacerlas

competitivas. Dado estos aspectos, es difícil que, en Costa Rica,

en el corto plazo, existan universidades que quieran dar un paso

adelante en este tema, especialmente aquellas que no cuentan

con los suficientes recursos [28].

En términos generales, las incubadoras reciben dinero por

parte de las empresas arrendatarias, esto a cambio de oficinas y

algún soporte administrativo. Algunas de estas también proveen

servicios de consultoría en diferentes áreas como tecnología,

asesoría legal, contaduría, entre otras. Algunas de ellas al verse

conectadas con una universidad pueden beneficiarse de

aspectos como propiedad intelectual, y a su vez, la universidad

Page 3: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

3

se beneficia de la comercialización de sus servicios.

Un aspecto importante a considerar relacionado con las

incubadoras es el hecho de que estas pueden proveer recursos

que no son consistentes con lo que el mercado demanda; por

ejemplo, las startups pueden acostumbrarse a vivir en un

ecosistema de incubadoras, pero no necesariamente este refleja

la realidad que pueden afrontar en el mercado. De esta manera,

algunas startups pueden dirigirse hacia el fracaso si intentan

realizar una inmersión agresiva en el mercado. Por supuesto,

esto no es óptimo, y a largo plazo, puede convertirse en un

factor de fracaso. El problema de fondo es que se están gastando

recursos para mantener una compañía en fase de incubadora,

pero no preparándose para el mercado que debe ser el objetivo

principal, recursos que pueden ser aprovechados por otros

emprendimientos más atractivos.

Al aislar a una startup del mercado y sus fuerzas, estas están

perdiendo una importante retroalimentación que puede ser

necesaria para su posible adaptación. Una adaptación temprana

es un factor de éxito clave en cualquier empresa antes de

convertirse en una compañía estable y rígida, por lo tanto,

autosuficiente.

Los ángeles inversores, como individuos o grupos

inversores, tienen el objetivo de impulsar las startups,

principalmente proveyendo capital.

De acuerdo con el Center for Venture Research, más de

28,000 emprendimientos durante el primer trimestre del 2013,

recibieron alrededor de $9.7 billones de dólares. Esto,

claramente, convierte a los inversores ángeles en una parte

importante del ecosistema de las startups [11].

Según Susan, en muchas ocasiones, estos inversores son o

fueron emprendedores que buscan ayudar a una nueva

generación de emprendedores. Estos inversores pueden ser

también amigos o familiares que proveen apoyo económico.

TABLA 1. COMPARACIÓN DE INCUBADORAS, ÁNGELES

INVERSORES Y ACELERADORAS

Aspecto Tipo de organización

Incubadoras Ángeles inversores Aceleradoras

Duración

1 a 5 años Continua 3 meses

Grupos No No Sí

Modelo de

negocios

Renta, sin fines

de lucro Inversión

Inversión,

puede ser

también sin fines de lucro

Selección No

competitiva Competitiva Competitiva

Etapa Temprana o tardía

Temprana Temprana

Educación

Recursos

humanos, legal, etc.

No Seminarios

Mentoría Mínima Solo si es

necesario Intensa

Ubicación En sitio No en sitio En sitio

Los ángeles inversionistas ayudan a las firmas o las

compañías de una manera no estructurada, la falta de estructuras

muchas veces se convierte en un limitado envolvimiento y

mentoría que eventualmente puede ser un factor crítico, ya sea

de éxito o fracaso [11].

Las aceleradoras de startups tienen su entrada en las etapas

iniciales y su principal objetivo consiste, en como lo indica su

nombre, acelerar el crecimiento durante un corto periodo. Este

proceso es rápido, intenso, normalmente está dirigido a la

educación y procura acelerar el ciclo de vida de las compañías

innovadoras [9, 10].

Tanto Susan Cohen como Yael Hochberg de Rice University

subrayan cuatro factores que hacen a las aceleradoras

diferenciarse de sus otros conceptos hermanos: se dan por un

periodo de término establecido, se imparten en grupo, son

dirigidas por un mentor, y normalmente culminan con una

graduación [10].

La Tabla 1 muestra una breve comparación de lo que son

incubadoras, inversores ángel y aceleradoras de startups; todos

ellos actores importantes dentro de este ecosistema [11].

Es importante abordar por qué muchos negocios en general

pueden tener éxito o fallar en sus etapas tempranas. Estos

factores no solamente aplican a cualquier tipo de negocio, sino

también, y en mayor medida, a las startups.

En el artículo [12], el autor define y describe 2 factores

importantes que son clave en los primeros años de una startup.

Según se cita, de acuerdo con un estudio, el 53% de los fracasos

de una compañía en la década de los 80 ocurrió en menos de 5

años desde su fundación. El 80% de estos fracasos se dio,

también, en los 10 primeros años desde su creación.

Uno de los factores encontrados está relacionado

directamente con la tecnología, se establece que el alto número

de tecnologías emergentes que son utilizadas también por la

competencia incrementa la incertidumbre de cómo será

aceptado un producto o servicio por el mercado. Las compañías

que están en una etapa temprana no poseen los recursos

necesarios para hacer frente a los grandes cambios tecnológicos

dominantes, haciendo difícil su competencia con una compañía

que sí posee estos recursos.

Las startups, típicamente, poseen acceso limitado a recursos

financieros, materiales y mercados; los cuales deben suplir la

necesidad planteada. Pocos recursos significan que las startups

no pueden competir con condiciones normales de los mercados.

Ante esto, la innovación juega un papel clave en el crecimiento

de estas.

El estudio concluye que las compañías que tienen un

mercado especializado, lo que significa un mercado poco

explorado, tienen una probabilidad más alta de éxito sobre

aquellas que incursionan en mercados donde existe una

saturación. A pesar de esto, las que incursionan en estos

mercados pueden verse beneficiadas si la demanda aumenta.

No solo las startups deben tomar experiencias y vivencias

de grandes compañías como ejemplo para alcanzar su éxito,

sino también las grandes compañías pueden sacar gran

provecho de los factores de éxito de las startup. Eric Ries [13]

describe factores que han contribuido con el éxito de startups,

las cuales ha observado de cerca. Uno de estos factores, es poder

analizar y priorizar los riesgos que eventualmente pueden

afectar el negocio. Uno de los problemas de los

emprendimientos, señala Eric, es que invierten años tratando de

Page 4: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

4

crear un producto para al final decidir si este es de valor para

los clientes o el mercado, en su lugar, las startups deben poder

crear el llamado producto viable mínimo; la versión más

pequeña del producto para comenzar con el proceso de

experimentación y aprendizaje. Este no debe confundirse con

un prototipo, sino que debe ser capaz de permitir probar la

mayoría de hipótesis planteadas acerca del producto.

De acuerdo con las estadísticas, en los Estados Unidos, a

pesar de que las startups cuentan con algunos privilegios tales

como el estar exentos de impuestos en 39 de los 50 estados, solo

el 35% de estas produce ganancias y la mayoría fracasa.

Según las estadísticas, 9 de cada 10 startups fracasan; es por

esto que muchas empresas, no solo del sector tecnológico, han

estudiado este fenómeno estudiando diferentes factores de

fracaso y éxito en las etapas tempranas de la creación de la

startup [25].

Estos factores de fracaso incluyen el que la mayoría de

startups no son capaces de crear un producto que el mercado

encuentre valioso o que este no es realmente innovador o ya

existe. Es esta falta de innovación lo que hace difícil el

acercamiento de inversores o interesados. Otro reto es

convencer a los clientes o usuarios finales de comprar su

producto.

Una startup debe considerar dos aspectos importantes para

hacer crecer sus ventas, primero, convencerlos de que el

producto desarrollado es de buena calidad; este es un aspecto

difícil ya que pueden no existir suficientes referencias de

experiencias previas. Segundo, estrictamente relacionado, es

que se debe convencer a los clientes que se seguirá ofreciendo

productos de calidad. Estos dos aspectos son difíciles de

alcanzar ya que las startups no poseen una amplia reputación

desarrollada debido a su naturaleza [4].

Una de las compañías que han utilizado Machine Learning

como potenciador y creador de startups es Fros Data Capital.

Esta organización ha sido la creadora de compañías como

NarrativeWave, la cual crea software para compañías que les

permite administrar piezas industriales, deducir datos de ellas y

entregar conocimiento para la toma de decisiones que permitan

mejorar las operaciones de la compañía [14].

La gran cantidad de datos disponibles mediante distintas

fuentes hace de su análisis y administración una tarea compleja.

La minería de datos, también llamada Knowledge Discovery

in Databases (KDD) en inglés, es considerada el proceso de

descubrimiento de nuevos patrones en grandes cantidades de

datos, comúnmente conocido como Big Data, mediante

métodos que envuelven varias disciplinas, tales como:

inteligencia artificial, estadística, matemáticas, reconocimiento

de patrones, entre otras [19].

El uso de estos datos para la toma de decisiones requiere de

métodos apropiados para la extracción de conocimiento.

Las técnicas de minería de datos son utilizadas para extraer

y descubrir conocimiento valioso y significativo a partir estas

grandes cantidades de datos.

La minería de datos, utilizada como una herramienta

analítica, ayuda a mejorar los procesos de toma de decisiones.

Además, brinda a los investigadores la posibilidad de hacer

descubrimientos utilizando Big Data, lo cual es permite tomar

decisiones con base en estos descubrimientos. [17].

Para poder realizar estos análisis, diferentes métodos y

algoritmos son utilizados para extraer patrones de los datos

almacenados. Ejemplos de estos algoritmos son la clasificación,

la asociación, la regresión y los árboles de decisión. Algunos de

estos algoritmos requieren datos estructurados o normalizados,

otros necesitan que los datos estén categorizados o agrupados.

También, estos algoritmos pueden proveer recomendaciones,

análisis de datos históricos o bien predicciones [20]. En el caso

de estas últimas, las cuales son la piedra angular de esta

investigación, se utilizan técnicas estadísticas y algoritmos

como el modelado estadístico, redes bayesianas, métodos

basados en instancias y modelos lineares. Cada algoritmo de

predicción tiene sus particularidades y sus diferentes

aplicaciones, algunos se basan en categorías o atributos

cualitativos y otros en valores numéricos [36]. Para entender

mejor su funcionalidad, se presenta el siguiente ejemplo de una

afirmación:

Si el clima es soleado, la temperatura caliente, la humedad

alta, los vientos son fuertes, entonces no se recomienda realizar

una partida de golf.

Hay que notar varias características. Se indica que la

temperatura es caliente, no se habla de una medida numérica, lo

mismo para todas las variables. Esto puede servir para algunos

algoritmos, otros van a tener que ser ajustados a un valor

numérico. Por otra parte, se menciona si se puede jugar o no. Al

ser esta una afirmación, significa que es un evento que pasó y

se registró en un histórico. En un sistema de KDD, existen miles

o millones de estas afirmaciones. Cuantas más existan, las

predicciones son más exactas. Ahora bien, dada una solicitud

de predicción en condiciones específicas de una situación en el

presente -por ejemplo, si el clima es frío, la humedad alta,

etcétera ¿es lo mejor jugar?-, el algoritmo de minería de datos

se encarga de tomar los registros históricos y ejecutar un

análisis de correlación basado en el flujo particular de cada

algoritmo; para finalmente, generar uno o varios resultados que

le indiquen al usuario el detalle de la predicción -en el caso de

ejemplo, el resultado sería indicar si lo mejor es realizar el juego

de golf o no.

Dos de las técnicas más utilizadas dentro de minería de

datos son las de clasificación y regresión. Estas corresponden al

grupo de técnicas de aprendizaje supervisadas, esto es que

existe un conocimiento previo de datos. Estas técnicas han sido

ampliamente utilizadas con éxito en diferentes áreas como

ingeniería, redes sociales, salud y otras; ya que permiten la

construcción de modelos sobre una variable de salida, basados

en diferentes variables de entrada [25].

Distintas opciones de software en el mercado, Weka, por

ejemplo, permiten utilizar diferentes algoritmos de clasificación

sobre un conjunto de datos. Algunos de estos algoritmos son

Lazy lb1, Random Forest, el cual consiste en una serie de

árboles de decisión, Bayesian Network, entre otros [26].

La inteligencia de negocios (BI por sus siglas en inglés) es

la combinación de un sistema para la toma de decisiones y un

sistema de información. Esta disciplina viene a proveer

respuestas a diferentes preguntas que pueden hacerse a nivel

gerencial, por ejemplo ¿cómo afectará a la compañía la caída de

Page 5: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

5

un 6% de la producción de un producto específico en un

determinado mes? [29].

La combinación de estas disciplinas, tanto Big Data como

minería de datos e inteligencia de negocios, ha demostrado que

puede traer grandes beneficios a las compañías en materia de

oportunidades de mercado, medición de efectividad de

actividades y toma de decisiones [30].

III. METODOLOGÍA

Para dar respuesta a las preguntas de investigación, primero,

se deben estudiar factores críticos de éxito de las startup a nivel

mundial. Se buscarán artículos y otras fuentes en donde se

detallen los factores y la razón del porqué se consideran críticos.

Luego, se procederá a comparar las múltiples listas para

encontrar factores en común y así contar con una lista definitiva.

Una vez identificados los factores, se deberá tomar en

cuenta el ecosistema de las startups en Costa Rica. Para esto, se

buscan estudios formales que revelen el ambiente actual -

aspecto socioeconómico, idiosincrasia, apoyo estatal, mercado,

educación- y cómo este afecta en el éxito o fracaso de las

startup. Inmediatamente, la lista de factores deberá ser

actualizada para reflejar dicho contexto.

Seguidamente, se analizará la posible adaptación de los

factores a la minería de datos. Se tomará cada factor y se

buscará en distintas fuentes su posible cuantificación, con el fin

de tener variables que puedan ser medidas. Por ejemplo, se sabe

que la edad de los emprendedores es un factor crítico para el

éxito de una startup [18]. En Costa Rica, un rango deseable

oscila entre 20 y 45 años [15]. Lo que sigue es buscar la manera

de cuantificar esta cifra de forma tal que se le asigne un peso

numérico. Para ello se estudiará la mejor manera de asignar

dicho peso, investigando sobre qué tanto afecta el factor de la

edad si se compara con otros factores y cómo esta interacción

influiría en el resultado final.

El siguiente paso consiste en investigar sobre algunos

algoritmos predictivos de minería de datos que puedan ser

aplicados producto del tipo de variables recolectadas. Para

apoyar todo lo anterior, se van a investigar implementaciones

similares a nivel global y validar de una mejor manera la

respuesta a las interrogantes.

Finalmente, una vez que se ha seleccionado los mejores

algoritmos y las variables a utilizar, y se ha considerado el

contexto de Costa Rica en la propuesta, se tiene el modelo final.

IV. ANÁLISIS

La creación de startups es un proceso riesgoso que a su vez

tiende a consumir mucho dinero, tiempo y esfuerzo entre los

emprendedores y todo el ecosistema en general. La realidad

actual es que, producto de tal esfuerzo, aproximadamente el

90% de los nuevos emprendimientos falla [21]. De ahí la

importancia de un estudio detallado de los factores críticos de

éxito del restante 10%.

Yankov analizó 42 modelos de predicción del éxito de

startup, desde 1974 a 2010. Una de las características

evolutivas es que se pasó de simples listados de factores críticos

de éxito a agrupaciones en categorías más genéricas [22].

Uno de los modelos más estudiados es el de Sandberg, del

cual se derivaron múltiples variables: equipo emprendedor,

factores ambientales, estrategia, estructura de la industria y la

interacción de la estrategia con la estructura.

Otro modelo, de 1999, condiciona la supervivencia de una

startup con el éxito en las siguientes variables: estabilidad,

tiempo de entrada al mercado, tiempo de espera de salida del

producto o servicio, rivalidad competitiva, capacidad

educacional (en temas de mercadeo), conocimiento de la

industria.

Existen otros dos modelos derivados interesantes que

difieren de los enfoques anteriores en estructura. Entre sus

variables se pueden enumerar el capital humano, relacionado

directamente con las personas y sus años de experiencia en la

industria, años de estudios, experiencia en emprendedurismo y

liderazgo). Otra variable se refiere a las características

organizacionales, por ejemplo, qué tan nueva es la startup, el

tamaño inicial y las estrategias organizacionales. También se

hace énfasis en las condiciones ambientales como la locación

geográfica, rama de la industria y condiciones del mercado. El

siguiente aspecto es el momento de salida del producto o

servicio, en otras palabras, si son muy nuevos para el mercado

actual (o muy viejos), hay un mayor chance de fracaso. Una de

las variables más importantes tomadas en cuenta es el

planeamiento; si una startup no cuentan con planes de negocio,

tiene grandes probabilidades de fracaso. En cuanto a asesoría

profesional, existe más posibilidad de éxito si se utiliza en áreas

donde haya deficiencias de conocimiento o no se tenga un

criterio experto (especialmente en etapas tempranas). Por

último, el nivel educativo de los emprendedores es una variable

importante; se sabe que tienen más probabilidades de fracaso si

no cuentan con estudios universitarios.

Tomando en cuenta los factores anteriores, Yankov propone

un modelo unificado que reúne las diferentes variables en

categorías. El modelo se presenta mediante la siguiente

fórmula:

NVP = f (E, IS, BS, R) (1)

Dónde, NVP (New Venture Performance) es el rendimiento

positivo o negativo del éxito de la startup, mientras que “E”

(Entrepreneur) es el emprendedor, “IS” (Industry Structure) es

la estructura de la industria, “BS” (Business Strategy) es la

estrategia del negocio y “R” (Resources) representa a los

recursos disponibles (humanos, económicos, etc.). Cada una de

las cuatro variables principales cuenta con subcategorías para

mayor claridad sobre los enfoques de cada una, las cuales se

despliegan en la Figura 1.

Si bien es cierto la mayoría de los factores presentados

anteriormente están relacionados con el producto, el mercado y

sus cambios, en Costa Rica, los factores más estudiados son los

que caracterizan al emprendedor; dando énfasis en

características tales como la educación, el acceso a capital

inicial o la edad.

Según una encuesta de la Coalición Costarricense de

Iniciativas de Desarrollo (CINDE), durante el 2013 más de

85,000 costarricenses trabajaban para alrededor de 250

multinacionales, el equivalente al 5,8% del producto interno

bruto (PIB). Los factores por los cuales estas empresas se

Page 6: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

6

interesan en el capital humano costarricense son,

principalmente, el alto grado de educación, el manejo de

segundos idiomas (en especial el inglés) y la gran cercanía con

los Estados Unidos.

Estos datos permiten identificar que el grado de educación

y conocimiento de idiomas favorece el éxito de los empleados;

sin embargo, el gran problema es que, a su vez, estas compañías

están abarcando gran parte del personal potencialmente

preparado para el emprendimiento [15].

Según la misma fuente, uno de los reportes del Banco

Mundial en el 2014 expone a Costa Rica dentro de los países

con porcentajes más bajo de ahorros. Según las predicciones del

Fondo Monetario Internacional (FMI), esto no cambiará en los

próximos años. Las anteriores afirmaciones ponen a los futuros

emprendedores en una situación difícil al no contar, muy

probablemente, con capital suficiente para el arranque de un

emprendimiento [23]. Si esto es así, existen una gran

posibilidad de que sus inversores por parte de los familiares y

casuales estén en una situación muy similar. Tal situación,

coloca al capital inicial como un factor importante a considerar

y que, además, puede influir en otros factores [15].

En Costa Rica, según entrevistas realizadas a una serie de

jóvenes emprendedores, la mayoría indica que no se les

complicó el decidirse por emprender, en parte debido a que un

gran número de ellos aún eran dependientes de sus padres y con

pocas responsabilidades. A las personas entre 30 y 45 años, a

pesar de ser condicionadas por presiones sociales como el

matrimonio, el tener hijos o la compra de vivienda, identifican

ventajas como el fácil acceso al crédito, experiencia laboral,

ahorro, entre otros, las cuales les permitió una mayor

probabilidad de éxito. Para las personas de más de 45 años, la

experiencia adquirida, la estabilidad económica, los contactos y

para muchos de ellos el no ser primerizos en cuanto a

emprendimientos, les permitió manejar mejor el riesgo,

aumentando las posibilidades de éxito [15].

Figura 1. Modelo de predicción de éxito de las startup.

Como se mencionó anteriormente, según estudios a nivel

mundial, el fracaso en las startups y los emprendimientos son

mayores en las personas más jóvenes; en Costa Rica, el factor

de la edad del emprendedor es uno de los más influyentes para

el éxito de las startups, debido a su relación directa con aspectos

como la energía, el apoyo de organizaciones, la experiencia, los

contactos, el costo de oportunidad y lo relacionado con la

situación actual del emprendedor en términos de estado civil,

situación laboral actual, si posee o no hijos o deudas

hipotecarias [15]. Por ejemplo, un emprendedor de más de 40

años tiene más posibilidades de fracaso que un joven por

responsabilidades como las mencionadas anteriormente.

Asimismo, un emprendedor del rango de los 20 años tiene más

probabilidades de fracaso por su falta de experiencia,

conexiones y acceso a financiamiento que una persona mayor

[15].

Dentro del ecosistema de las startups, en Costa Rica, el

factor asociado al emprendedor, tomando en cuenta variables

antes mencionadas como la edad, la educación, el acceso al

dinero y la experiencia laboral, adquieren una gran importancia

para establecer una clara relación directa con el modelo

propuesto.

El modelo de predicción de éxito de las startup propuesto

tiene cuatro categorías principales, de las cuales, se detalla su

aplicabilidad en el ecosistema costarricense. La primera está

relacionada con el equipo emprendedor.

Según el estudio “Mapeo del ecosistema del

emprendimiento en Costa Rica” conducido por Randall Trejos

y la Fundación startup Costa Rica, en el país, existen varios

problemas que conducen a la falta de colaboración con otras

personas y equipos [15], lo cual aumenta las probabilidades de

fracaso.

Entre los problemas, se encuentran la falta de necesidad de

otros miembros en el equipo; en otras palabras, se trata de llevar

el emprendimiento de forma solitaria, producto de la

desconfianza con personas ajenas a su círculo de amigos o

familiar. Si fuera el caso de que se seleccionan miembros del

equipo que sí se encuentren dentro del círculo de confianza,

existe el riesgo latente de equipos desbalanceados a nivel

intelectual y de experiencia en algún área específica. Esta

misma falta de confianza hace que los emprendedores tengan

temor de compartir en detalle sus ideas y por lo consiguiente,

mantienen un bajo perfil, lo que conduce a una falta de

aprendizaje colectivo. Aquí se puede ver claramente la

aplicabilidad al modelo en las áreas de personalidad y valores,

habilidades, experiencia y trabajo en equipo.

La siguiente categoría es la de la estrategia de negocio. Con

base en el mismo estudio, se determinó que parte de las

prácticas recomendadas incluyen el desarrollo de un plan y

proyecciones financieras -es casi imperativo hacerlo en etapas

tempranas-, así como establecer una visión a largo plazo para

permitir una mejor toma de decisiones en un marco de

referencia pensado a futuro, definir una estrategia que tome

aspectos como las finanzas y, la capacitación del personal en

áreas que tengan falencias y de crecimiento. También hace

hincapié en la necesidad de una estrategia de colaboración -para

lo cual, las incubadoras y las aceleradoras incluyen espacios de

Page 7: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

7

coworking- con otras startups u otro tipo de empresas, mentores

o consultores para aumentar las probabilidades del éxito al

fortalecer áreas en las que existan posibles amenazas.

En el caso de la categoría de la estructura de la industria,

hay varios aspectos que un nuevo emprendimiento necesita

estudiar, uno de ellos es la competencia. En Costa Rica, durante

2016, organizaciones como aceleradores, inversionistas y

bancos, recibieron más de 800 proyectos y para 2017, se prevé

un alza en la cantidad de programas de apoyo, tanto en el ámbito

privado como iniciativas gubernamentales [32]. A esto hay que

añadirle la competencia de empresas ya establecidas a nivel

nacional e internacional.

En el apartado de la estructura, según el estudio de Trejos,

se recomienda pensar en un mercado local, pero de forma

escalable, ya que se tiende a no diseñar en la etapa de planeación

pensando en expandirse a otros mercados y esto aumenta las

probabilidades de fracaso, debido a que se sabe de antemano

que el proceso de expansión internacional o a un mercado más

grande conlleva grandes dificultades. Las barreras de entrada

son otro punto importante en la estructura de la industria que

tiene que ser estudiado para asegurar el éxito de una startup.

Una de las principales es la dificultad en el proceso de

financiamiento de un sector bancario costarricense que no es

capaz de servir a las startups, para lo cual hay que recurrir a

fuentes alternativas -y como tales, con sus riesgos particulares

en comparación con los bancos-, como inversionistas ángeles,

capital familiar, capital semilla del gobierno, clubes de

inversionistas y aceleración, etc. [15]. Otra variable que no se

enfatiza en el modelo de Yankov y en Costa Rica es de suma

importancia, es la relación de la startup con el ecosistema. Una

mayor densidad de las conexiones que tenga una compañía con

otras partes del ecosistema -entiéndase incubadoras, mentores,

otros startups, consultores- aumenta las posibilidades de éxito.

Producto de lo anterior, la visibilidad aumenta y se contribuye

a la evolución y el fortalecimiento del ecosistema costarricense

[15].

Hay un aspecto muy interesante que vale la pena mencionar:

Costa Rica es un país pequeño, tanto en habitantes como en

infraestructura industrial, esto se traslada también al ecosistema

de startups. Debido a esta particularidad, si un componente de

la conexión falla, todo el ecosistema se ve afectado

rápidamente. Por ejemplo, a menor visibilidad, menor el

número de startups que aplican a una aceleradora; si esto

sucede, sus estándares de calidad y aceptación deben bajar para

atraer a más startups y asegurar su sostenibilidad, lo que hace

que las probabilidades de fracaso de las futuras startups

aumente.

Producto de lo anterior, la cantidad de inversores ángeles y

demás fuentes de financiamiento va a oponer más resistencia

para minimizar el riesgo y se generará una mayor dependencia

de capital gubernamental -con todos los obstáculos que la

burocracia representa para el dinamismo de las startup. La falta

de visibilidad también hace que no se aproveche el

conocimiento experto de otros emprendimientos o mentores,

añadiendo más barreras al éxito de la empresa. Como se puede

apreciar en este escenario, la densidad de conexiones y

visibilidad no solamente afecta a una startup individualmente,

sino que genera una reacción en cadena perjudicial para la

estructura de la industria nacional.

Para finalizar con la asociación del modelo de predicción

con el ambiente costarricense, se tiene la categoría de recursos.

En Costa Rica, se ha reconocido paulatinamente [32] la

necesidad de contar con estructuras e iniciativas capaces de

tomar a las startup y apoyarlas. Estas no solo se gestan para la

etapa de validación de la idea, sino también para así obtener los

recursos necesarios -financiamiento, asesoría, equipo- en cada

etapa de su ciclo. Un ejemplo claro son las competencias de

emprendimiento, en donde hay toda una serie de recursos

disponibles (inversionistas, expertos en varios campos, otros

equipos de múltiples disciplinas con los que se podrían

establecer vínculos) y las partes involucradas se benefician

mutuamente [15].

El crecimiento del ecosistema de startups, que ha

evolucionado a lo largo de los años en el país, así como el hecho

de que las empresas que pasan por una incubadora -por poner

un ejemplo de una estructura específica- tienen un mayor

porcentaje de éxito de sobrevivencia sobre las que nunca lo

hicieron [33], es una prueba de que el tema de los recursos es

un factor crítico de éxito que debe ser tomado en cuenta en el

modelo, independientemente del área geográfica de estudio.

En la Figura 2, se observa el modelo de predicción de éxito

de las startups ajustado al ambiente costarricense. Se agregó la

variable de la edad y la situación de los emprendedores, lo que

se refiere al promedio de edad de los emprendedores y la

relación directa con su situación personal actual -casados o

solteros, con o sin hijos, con o sin hipotecas-. La otra variable

ajustada corresponde a las relaciones de la startups con el

ecosistema, con el fin de medir qué tanto está sumergida en

dicho ambiente, en términos de conexiones, visibilidad en la

industria, así como el nivel de aislamiento y cooperación con

sus pares.

Figura 2. Modelo de predicción de éxito de las startup

ajustado al ecosistema costarricense.

Page 8: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

8

Una vez establecidos los enlaces entre el ecosistema de

startups costarricense y el modelo de predicción en estudio, se

procede a analizar los modelos y cómo trasladarlos a un

esquema cuantitativo para ejecutar las predicciones. Para lograr

este objetivo, Miettinen y Littunen proponen en su estudio

“Factors Contributing to the Success of Start-Up Firms Using

Two-Point or Multiple-Point Scale Models” la creación de

categorías como método de medición. Cada categoría va a

contar con una serie de valores que son asignados a dicha

categoría para cada objeto de estudio.

Siguiendo esta metodología, la primera categoría sería la del

éxito o fracaso de la startup, lo cual se detalla en la Tabla 2.

Como se puede apreciar, se tomó cada una de las variables

del modelo ajustado y se logró categorizar de tal manera que

pueda ser trasladado a una herramienta de minería de datos,

luego del proceso de recolección de datos. Para ello, se

recomienda la creación de formularios que apoyen este fin,

utilizando redes de contactos, redes sociales, comunidades de

startups, correos electrónicos, entre otros [31].

Un ejemplo de lo anterior es el estudio de Yankov, en donde

se utiliza este tipo de cuestionarios con una serie de 107

variables identificadas dentro de las cuatro categorías de su

modelo de predicción. Estos datos contienen información de

105 compañías de Bulgaria de diferentes tamaños y años en el

mercado [31]. Una vez que se realizaron las preguntas, se

categorizó la información y luego fue analizada por diferentes

algoritmos de predicción.

Para el análisis de los datos expuestos en el modelo, se

propone la creación de un proyecto de minería de datos con sus

fases conocidas: entendimiento del negocio, entendimiento de

los datos, preparación de los datos, modelado, evaluación y su

puesta en producción [24].

TABLA 2. CATEGORIZACIÓN DE LAS VARIABLES DEL MODELO

DE PREDICCIÓN PROPUESTO

Categoría Subcategoría Atributos

Éxito de la startup

N/A

6 = startup ha podido sostenerse por

algunos años, 5 = startup ha logrado

sostenerse, 4 = dificultad en balancear fluctuaciones, cambios en la

rentabilidad, 3 = dificultades a nivel

operacional y de finanzas, necesidad de reorganización, 2 = amenaza de

bancarrota, 1 = sin capacidad de cubrir

sus obligaciones financieras

Equipo Emprendedor

Personalidad y valores

Nivel de confianza: 1 = alto, 2 =

medio, 3 = bajo

Tolerancia al riesgo: 1 = alta, 2 =

media, 3 = baja

Nivel de liderazgo: 1 = alto, 2 = medio,

3 = bajo.

Locus de control: 1 = interno, 2 =

externo

Habilidades y experiencia

Experiencia en manejo de equipos: 1 =

mucha, 2 = alguna, 3 = carente

Experiencia en la rama del producto o

servicio: 1 = mucha, 2 = alguna, 3 = carente

Experiencia gerencial (finanzas,

RRHH, gestión de empresas): 1 = mucha, 2 = alguna, 3 = carente

Nivel de escolaridad de fundadores: 1

= sin educación profesional, 2 = colegio, 3 = educación técnica o

parauniversitaria, 4 = universidad

Experiencia en emprendedurismo: 1 =

mucha, 2 = alguna, 3 = carente

Tiempo de operaciones del negocio: 1

= 1 año, 2 = 2 años, 3 = 3 años, 4 = 4

años, 5 = 5 años o más

Trabajo en

equipo

Grado de trabajo en equipo en las operaciones diarias: 1 = mucho, 2 =

medio, 3 = poco, 4 = nada

Iniciativas gerenciales para trabajo en equipo: 1 = sí hay, 2 = no hay

¿Trabajo en equipo genera valor?: 1 =

mucho, 2 = poco, 3 = nada

Edad y

situación

Estado civil: 1 = casado(a), 2 = soltero(a), 3 = divorciado(a), 4 =

viudo(a), 5 = unión libre

Género: 1 = hombre, 2 = mujer

Edad promedio: 1 = menos de 20 años,

2 = entre 20 y 34 años, 3 = entre 35 y

44 años, 4 = entre 45 y 54 años, 5 = entre 55 y 64 años, 6 = 65 años o más

Posee préstamos hipotecarios: 1 = sí, 2

= no

Tiempo dedicado al startup: 1 = tiempo completo, 2 = medio tiempo, 3 =

menos de medio tiempo

Estrategia de

negocio

Planeamiento

¿Existe un plan de negocio?: 1 = sí, 2 = no

Seguimiento y control del plan según

fundadores: 1 = estricto, 2 = parcial, 3

= inexistente

Metas

Definición de las metas: 1 = se tienen

bien definidas y se respetan, 2 = se

tienen definidas, pero se respetan parcialmente 3 = no se tienen metas

definidas formalmente

Dirección

estratégica

Nivel de agresividad de la estrategia

empresarial: 1 = se persiguen agresivamente nuevos nichos de

mercado, 2 = estrategia defensiva que

busca un lugar seguro en el mercado, 3 = no se tiene clara

Estrategia de entrada

Tipo de estrategia de entrada: 1 =

producto o servicio pionero en el campo, 2 = entrada tardía al mercado, 3

= no se tiene estrategia de entrada

Ventaja

competitiva

Tipo de estrategia de ventaja: 1 =

diferenciación de costo, 2 = diferenciación de producto o servicio, 3

= enfoque en nicho de mercado específico

Asociación

estratégica

Existe algún tipo de asociación o apoyo

a otras organizaciones: 1 = Sí, 2 = No

Existe algún tipo de asociación o apoyo de otras organizaciones: 1 = Sí, 2 = No

Estructura de

la industria

Características estructurales

Barreras a nivel financiero: 1 =

Muchas, 2 = Algunas, 3 = Pocas

Barreras a nivel de ecosistema de startups: 1 = Muchas, 2 = Algunas, 3 =

Pocas

Barreras a nivel tecnológico: 1 =

Muchas, 2 = Algunas, 3 = Pocas

Barreras a nivel gubernamental: 1 =

Muchas, 2 = Algunas, 3 = Pocas

Rivalidad

Análisis de la competencia: 1 = existe

un análisis formal del mercado meta, 2 = existe un análisis informal del

Page 9: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

9

mercado meta, 3 = no existe un análisis

del mercado meta

Naturaleza de

los compradores

Claridad del mercado meta (género,

edades, clase social, localización

geográfica): 1 = mucha, 2 = alguna, 3 =

poca

Relaciones con

el ecosistema

Relaciones con incubadoras: 1 = sí, 2 =

no

Relaciones con startups de la misma

industria: 1 = sí, 2 = no

Relaciones con startups de otras

industrias: 1 = sí, 2 = no

Relaciones con aceleradores: 1 = sí, 2 =

no

Relaciones con inversores ángeles: 1 =

sí, 2 = no

Relaciones con eventos privados o

gubernamentales de startups: 1 = sí, 2 = no

Relaciones con mentores: 1 = sí, 2 = no

Relaciones con asesores profesionales: 1 = sí, 2 = no

Recursos

Activos

tangibles

Lugar físico: 1 = sí se tiene, 2 =

alquiler o equivalente, 3= casa de habitación, 4 = no se tiene o no es fijo

Financiamiento (millones de colones):

1 = menos de 1.000.000, 2 = entre 1.000.000 y 10.000.000, 3 = entre

10.000.000 y 50.000.000, 4 = entre

50.000.000 y 100.000.000, 5 = más de 100.000.000

Inventario (mobiliario, equipo de

cómputo, etc.): 1 = no existen

problemas de abastecimiento, 2 = pocos problemas de abastecimiento, 3

= muchos problemas de abastecimiento

Activos

intangibles

Patentes: 1 = sí existen, 2 = en trámite, 3 = no existen o no aplica

Presencia en línea (redes sociales, sitio

web): 1 = mucha, 2 = alguna, 3 = poca

Financiamiento

Banco como fuente de financiamiento: 1 = sí, 2 = parcialmente, 3 = no

Ángeles inversores como fuente de

financiamiento: 1 = sí, 2 =

parcialmente, 3 = no

Capital propio como fuente de

financiamiento: 1 = sí, 2 =

parcialmente, 3 = no

Gobierno como fuente de financiamiento: 1 = sí, 2 =

parcialmente, 3 = no

Premios en competiciones como fuente de financiamiento: 1 = sí, 2 =

parcialmente, 3 = no

Aceleradoras como fuente de financiamiento: 1 = sí, 2 =

parcialmente, 3 = no

Amigos, familiares o conocidos como

fuente de financiamiento: 1 = sí, 2 = parcialmente, 3 = no

Dentro de este concepto de proyecto, el ciclo es repetitivo,

es decir, el proyecto no termina cuando se llega a la fase de

puesta en producción, sino que esta fase desata una serie de

interrogantes que vendrán a enriquecer una próxima ejecución.

En otras palabras, la primera corrida de los algoritmos no va a

arrojar un resultado definitivo. Se tienen que revisar el proceso

de abajo para arriba: los resultados, los algoritmos, las

preguntas del cuestionario, las categorías y de ser necesario,

cambiar las variables del modelo.

Para esta investigación, con base en el modelo propuesto por

Yankov, se considera prudente primeramente analizar uno a

uno los algoritmos sugeridos por la herramienta de análisis a

utilizar; sin embargo, según los resultados obtenidos por

Yankov, los métodos que generan árboles de decisión muestran

ser el tipo adecuado para este tipo de análisis.

V. CONCLUSIONES

Con base en el análisis de la sección 4, se han presentado

diferentes modelos que se intentan predecir el éxito de las

startups mediante la utilización de diferentes variables críticas

que pueden influir sobre este. En este análisis, utilizando como

base el modelo de predicción de éxito de startups propuesto por

Yankov, se evidencia que estos factores son comunes en

diferentes contextos y a los que fielmente se les puede aplicar

alguna técnica de minería de datos para predecir el eventual

éxito de una startup.

Dado lo anterior, se considera que las variables utilizadas en

este modelo, junto con las adhesiones hechas en esta

investigación, pueden ser empleadas por la minería de datos

para predecir el éxito de una startup en Costa Rica.

Se han estudiado, mediante la revisión y el análisis de la

literatura existente y disponible, diferentes aspectos

socioeconómicos de los emprendedores y el ecosistema de las

startups en Costa Rica. Dentro de estos, se han identificado

algunos aspectos que evidentemente tienen influencia directa en

el éxito de las startups. Algunos mencionados corresponden al

capital inicial que poseen los emprendedores, el nivel

educativo, la edad, la situación personal y la experiencia laboral

adquirida. Tomando como base el modelo de Yankov, se han

relacionado cada una de las categorías presentes en este modelo;

equipo emprendedor, estrategia de negocio, estructura de la

industria y recursos, con la situación actual del entorno y la

incursión de ciertas dimensiones particulares: área

socioeconómica, cultural y estructural de la industria en Costa

Rica; lo anterior tomando como referencia, entre otros, el

estudio realizado por Trejos en [15].

Con base en esta relación, se propuso un modelo de

predicción de éxito adaptado a la situación actual de Costa Rica,

tomando en cuenta características del emprendedor local y su

relación con el ecosistema. Para la aplicación de técnicas de

minería de datos sobre este modelo, sea ha asignado a cada una

de las subcategorías identificadas en la Figura 2, atributos que

poseen diferentes valores y describen el nivel actual de la

startup en cada aspecto particular. Se mencionó, además, que la

técnica de minería de datos de clasificación por árboles de

decisión mostraría los mejores resultados dada la naturaleza de

los datos. Diferentes opciones de software en el mercado están

disponibles para este análisis. Weka, es una alternativa de

código abierto que permite aplicar este tipo de técnicas de

minería de datos.

Tomando en cuenta lo analizado en esta investigación, se

concluye que las startups en Costa Rica pueden sacar provecho

de las predicciones resultantes del proceso de minería de datos

utilizando el modelo de predicción de éxito de startups

Page 10: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

10

propuesto y aplicar este conocimiento en una etapa temprana

como medida preventiva ante las principales eventualidades

que puedan surgir según sus características propias -edad y

número de emprendedores, capital disponible, relación con el

entorno de startups, visibilidad, fortaleza del plan de negocio,

competencia de la industria específica, entre muchas otras.

Esta información permitirá a los emprendedores y a todos

aquellos interesados, entre ellos inversores y organizaciones

como las incubadoras y aceleradoras, saber de antemano con un

alto porcentaje de certeza -gracias a la utilización de métodos

matemáticos y estadísticos- si la startup será o no exitosa y a su

vez, conocer los factores que puedan estar influyendo

negativamente en su éxito futuro para crear estrategias de

crecimiento y mejora, de tal manera que se asegure la mayor

probabilidad de éxito.

VI. LIMITACIONES Y TRABAJO FUTURO

Para la presente investigación, se propuso un modelo de

predicción ajustado a la realidad costarricense en la actualidad.

Se creó una serie de escalas que pueden ser utilizadas para crear

cuestionarios, encuestas u otro tipo de herramientas de

recolección de datos, las cuales no son parte de este trabajo y se

recomienda altamente su aplicación periódica para asegurar un

panorama actualizado.

Siguiendo esta premisa, es importante entender que un

proceso de minería de datos requiere una revisión de abajo hacia

arriba, en el sentido de que tanto el modelo, como las variables,

los algoritmos y las escalas utilizadas pueden y deben ser

cambiadas en cada iteración para mejorar la calidad de las

predicciones, realizando correcciones y descubriendo nuevos

patrones y variables. Aun así, se considera que el presente

trabajo es un sólido inicio para realizar los cálculos.

Como trabajo futuro, se recomienda la recolección de los

datos como se mencionó en el apartado anterior, para luego

ejecutar el análisis de la información con base en el modelo de

predicción propuesto mediante los algoritmos de minería de

datos mencionados en el marco teórico de esta investigación,

así como el análisis de resultados de dicha ejecución.

Solamente, con el estudio de los resultados y el refinamiento del

proceso, se podrá validar cuantitativamente la utilidad del

modelo propuesto y su aplicabilidad en el ecosistema de

startups costarricense.

REFERENCIAS

[1] ŢĂRANU, I. i. (2015). Big Data Analytics Platforms analyze from

startups to traditional database players. Database Systems Journal, 6(1), 23-32.

[2] Chen, D. Q., Preston, D. S., & Swink, M. (2015). How the Use of Big

Data Analytics Affects Value Creation in Supply Chain Management.

Journal Of Management Information Systems, 32(4), 4-39.

[3] Ng, A. s., Wong, A. s., & Tai Ming Wut1, s. (2016). Second-movers'

advantage of utilizing Big Data to enhance sustainability performance: the case of elevator industry. Proceedings Of The International

Conference On Industrial Engineering & Operations Management,

2569-2579.

[4] DeKinder, J. S., & Kohli, A. K. (2008). Flow Signals: How Patterns over Time Affect the Acceptance of Start-Up Firms. Journal Of Marketing,

72(5), 84-97. doi:10.1509/jmkg.72.5.84

[5] Robehmed, N. (2015, May 15). What Is A Startup? Retrieved February

19, 2017, from

http://www.forbes.com/sites/natalierobehmed/2013/12/16/what-is-a-

startup

[6] Mora, Ó., Rojas, K., Arias, M., Jiménez, G., Jiménez, J., & González, L.

(2016). Estado de situación de las PYMES en Costa Rica 2015. San José: Ministerio de Economía, Industria y Comercio. Retrieved from

http://reventazon.meic.go.cr/informacion/estudios/2016/pymes/informe

.pdf

[7] Graham, P. (2012, September). startup = Growth. Retrieved February

19, 2017, from http://www.paulgraham.com/growth.html

[8] Ries, E. (2011). The lean startup: How today's entrepreneurs use continuous innovation to create radically successful businesses.

[9] Hathaway, I. (2016). What startup Accelerators Really Do. Harvard Business Review Digital Articles, 2-7.

[10] Hathaway, I. (2016, February 17). Accelerating growth: startup

accelerator programs in the United States. Retrieved February 19, 2017,

from https://www.brookings.edu/research/accelerating-growth-startup-accelerator-programs-in-the-united-states/

[11] Cohen, Susan (2013), “What Do Accelerators Do? Insights from

Incubators and Angels,” Innovations, 8:3/4, pp. 19-25.

[12] Romanelli, E. (1989). Environments and Strategies of Organization

Start-up: Effects on Early Survival. Administrative Science Quarterly,

34(3), 369-387.

[13] Euchner, J. (2013). What Large Companies Can Learn from Start-ups. Research Technology Management, 56(4), 12-16.

[14] NEWMAN, D. (2016). Big Data as startup Material. (cover story). Orange County Business Journal, 39(26), 1.

[15] Emprendimiento.cr. (2016). Mapeo del ecosistema de emprendimiento

en Costa Rica: actores, conexiones y buenas prácticas (p. 8, 28). San

José, Costa Rica. Recuperado a partir de http://www.emprendimiento.cr/formulario-reporte

[16] G. Selig, "Critical success factors for winning entrepreneurs and the role of an incubator in accelerating the growth of start-ups and early stage

companies," Proceedings of the 2014 Zone 1 Conference of the

American Society for Engineering Education, Bridgeport, CT, 2014, pp. 1-6.

[17] Mueen, A. m., Zafar, B. b., & Manzoor, U. u. (2016). Modeling and

Predicting Students' Academic Performance Using Data Mining

Techniques. International Journal Of Modern Education & Computer Science, 8(11), 36-42.

[18] Yankov, B., 2013, A Model for Predicting the Success of New Ventures,

Vth International Scientific Conference e-Governance, ISSN 1313-

8774, pp. 128-135.

[19] IONIŢĂ, I. i. (2016). Data mining techniques for e-learning. Journal Of

Applied Computer Science & Mathematics, 10(22), 26-31.

[20] Liao, S., & Lee, I. (2002). Appropriate medical data categorization for data mining classification techniques. Medical Informatics & The

Internet In Medicine, 27(1), 59-67.

[21] Patel, N. (2017). Forbes Welcome. Forbes.com. Recuperado a partir de

https://www.forbes.com/sites/neilpatel/2015/01/16/90-of-startups-will-

fail-heres-what-you-need-to-know-about-the-10/#66c0bf4b6679

[22] Yankov, B. (2012). Overview of success prediction models for new ventures, pp. 2-4. Department of Software Engineering at Sofia

University.

[23] IFM. (2016, Oct 6). Costa Rica Gross National Savings, % of GDP

Retrieved February 25, 2017, from

https://www.quandl.com/data/ODA/CRI_NGSD_NGDP-Costa-Rica-Gross-National-Savings-of-GDP

[24] Witten, I. H., Frank, E.,, Hall, M. A. (2011). Data Mining: Practical

Machine Learning Tools and Techniques. Amsterdam: Morgan

Kaufmann. ISBN: 978-0-12-374856-0.

[25] A. Krishna, A. Agrawal and A. Choudhary, "Predicting the Outcome of

Startups: Less Failure, More Success," 2016 IEEE 16th International Conference on Data Mining Workshops (ICDMW), Barcelona, Spain,

2016, pp. 798-805.

[26] G. Holmes, A. Donkin, I. H. Witten, "Weka: A machine learning

workbench", Intelligent Information Systems 1994. Proceedings of the 1994 Second Australian and New Zealand Conference on, pp. 357-361,

1994.

Page 11: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

11

[27] CIE-TEC. (2014). Incubadora de Empresas del Instituto Tecnológico de

Costa Rica. Retrieved March 02, 2017, from http://www.cietec.org/

[28] Fernández de la Garza, G. (1993). The Importance of University

Incubators in Latin America. European Journal Of Education, 28(1), 31

[29] Wang, H. (2014). Distinguishing the adoption of business intelligence

systems from their implementation: the role of managers’ personality profiles. Behaviour & Information Technology, 33(10), 1082-1092.

[30] Lamont, J. (2012). Big data has big implications for knowledge

management. KM World, 21(4), 8-11.

[31] Yankov, B., Haralampiev, K., Ruskov P.: Start-up Companies Predictive

Models Analysis, Vanguard Scientific Instruments in Management

‘2013 (VSIM:13), ISSN 1314-0582, pp. 275-285 (2013)

[32] Emprendimientos en el país aumentan y se diversifican. (2017). nacion.com. Recuperado a partir de

http://www.nacion.com/economia/empresarial/Emprendimientos-pais-

aumentan-diversifican_0_1606239375.html

[33] Betting on Incubators to Create Jobs. (2010). Bloomberg.com. Recuperado a partir de

https://www.bloomberg.com/news/articles/2010-08-12/betting-on-

incubators-to-create-jobs.

[34] Miettinen, M. & Littunen, H. (2013). Factors Contributing to the

Success of Start-Up Firms Using Two-Point or Multiple-Point Scale Models. Entrepreneurship Research Journal, 3(4). doi:10.1515/erj-

2012-0012

[35] Locus of Control. Changingminds.org. Recuperado a partir de

http://changingminds.org/explanations/preferences/locus_control.htm

[36] Markov, Z. (2017). Data mining algorithms: Prediction. Central

Connecticut State University. Recuperado a partir de http://www.cs.ccsu.edu/~markov/ccsu_courses/DataMining-8.html

Page 12: La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos para los ... ecosistema de startups costarricense en la sección 5. Por ... solucionar

12

Rigoberto Álvarez Escobar es ingeniero en Sistemas

Informáticos de la Universidad Latina de Costa Rica. Ha

laborado en la industria del desarrollo de software alrededor de

13 años, desempeñándose en el ámbito público y privado, en

instituciones como el Poder Judicial de Costa Rica, PRIDES

S.A, GPS Satélite, Excel SoftSources y Blue Calypso of Latin

America, principalmente en análisis y desarrollo de software,

así como líder técnico. Ha estado involucrado en proyectos

informáticos del área de banca y finanzas, geolocalización,

entretenimiento, administrativa, entre otros. Posee varias

certificaciones de Microsoft en el área de desarrollo web.

José Arias Quirós es Ingeniero en Sistemas de la

Universidad de Costa Rica. Con más de 5 años de experiencia

trabajando en proyectos de tecnologías de información como

analista y programador en diferentes industrias como la

bancaria y la enterprise, se desempeña como consultor de

búsquedas de contenido en el sector enterprise en la compañía

Search Technologies. Actualmente, está cursando una Maestría

en Tecnologías de Información y formándose en diferentes

áreas como Scrum Master y Administrador de Proyectos.

Julio Córdoba Retana es profesor universitario desde el año

2001. Ingeniero en Computación con énfasis en Sistemas de

Información, graduado del TEC; máster en Ingeniería del

Software de la Universidad Politécnica de Madrid; y candidato

a doctor en Aplicaciones de la Informática (Diploma de

Estudios Avanzados) por la Universidad de Alicante. Ha sido

profesor en prestigiosas universidades nacionales (UCR, TEC,

ULACIT, Cenfotec) e internacionales (Ecuador, Bogotá); y

cuenta con amplia experiencia laboral como analista

programador y consultor internacional en TIC. Lidera la

implementación de Software Quality Assurance e IT Service

Management en BAC-CREDOMATIC a nivel regional.

Actualmente, es el decano del Centro de Innovación y

Transferencia Tecnológica de ULACIT.