La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos...
-
Upload
phamkhuong -
Category
Documents
-
view
237 -
download
0
Transcript of La minería de datos como factor potenciador de éxito … · así como predecir los mejores pasos...
1
La minería de datos como factor potenciador de éxito
de startups en Costa Rica
Álvarez-Escobar, Rigoberto
ULACIT
San José, Costa Rica
Arias-Quirós, José
ULACIT
San José, Costa Rica
Córdoba-Retana, Julio
ULACIT
San José, Costa Rica
Resumen—Aproximadamente, 9 de cada 10 startups están
destinadas a fracasar; son muchos los factores que pueden
incidir en el éxito o el fracaso de estas. Este trabajo presenta
la propuesta de un modelo de predicción de éxito de startups
en el ecosistema costarricense; el cual, mediante la
aplicación de técnicas de minería de datos, permitirá
anticipar el éxito o el fracaso de estos emprendimientos, así
como identificar los factores que influyen en esta
predicción.
Palabras clave; startup, big data, minería de datos.
Abstract—On average, 9 of 10 startups fail, several factors
can be directly influencing on this. This paper presents a
startups success prediction model adapted to the ecosystem
in Costa Rica. Using data mining techniques over this model
will allow to foretell the eventual success or failure of the
startups, as well as identifying the factors influencing on this
prediction.
Keywords-component; startup, big data, data mining.
I. INTRODUCCIÓN
Las compañías startups han venido en aumento en los
últimos años en Costa Rica, gracias al mejoramiento continuo
de la infraestructura del ecosistema, por ejemplo, creación de
incubadoras, competencias gubernamentales para patrocinios,
firmas e inversionistas especializados en capital de
emprendimiento, cobertura mediática, entre otros [15]. Uno de
los principales retos que enfrentan los emprendedores, los
inversionistas o los interesados en lograr el éxito de una startup
que busca incursionar en el mercado costarricense es el tener la
certeza de que la idea, el producto o el negocio tendrá éxito a
corto o mediano plazo [4].
Una de las principales diferencias entre una startup y una
pyme es que la primera tiene un mayor grado de innovación y,
por lo tanto, de incertidumbre [15]. Existe una serie de factores
críticos que se pueden tomar en cuenta para saber si un
emprendimiento de esta naturaleza tendrá altas probabilidades
de éxito. Para ello es necesario contar con datos relevantes de
otros emprendimientos similares que ayuden a mitigar este
problema, los cuales son recolectados durante todo su ciclo de
vida [16]. La cantidad de datos disponibles, ya sean
estructurados -datos recolectados transaccionalmente- o no
estructurados -correos electrónicos, posts o comentarios en
redes sociales y otras fuentes-, así como su exploración y
análisis representan una verdadera oportunidad para este tipo de
compañías [1].
La minería de datos es una rama que encaja perfectamente
en este escenario. Adquiere una enorme importancia dada la
rapidez del crecimiento de datos en la actualidad y los avances
tecnológicos en infraestructuras que permiten la captura, el
análisis y la presentación de resultados en tiempo real. Todo
esto habilita la automatización de decisiones que
tradicionalmente han sido dependientes del factor humano. Si
esto último no fuera posible debido a la complejidad del
análisis, la minería de datos provee aproximaciones confiables
gracias al análisis estadístico [2].
Muchas de las compañías exitosas a nivel mundial utilizan
minería de datos para potenciar sus negocios actuales, descubrir
oportunidades de mercado y mejorar procesos, además, les
permite analizar el uso de los recursos actuales para poderlos
optimizar y ganar terreno de sus competidores [2].
Gracias a la proliferación de Software as a Service (SaaS
por sus siglas en inglés), se han abaratado los costos para
acceder a una infraestructura que soporte el análisis de grandes
volúmenes de datos como lo propone la minería de datos, factor
que ha venido a beneficiar a empresas como los startups, las
aceleradoras y las incubadoras, que no tienen el capital que
posee una empresa ya establecida y que las pondría en una
desventaja competitiva [3].
La incertidumbre generada en cuanto al éxito o el fracaso de
la idea inicial y la puesta en marcha durante todo el ciclo de vida
son áreas en las que la minería de datos puede servir de apoyo
en la toma de decisiones y así ayudar a todos los involucrados,
desde los ángeles inversores para decidir estadísticamente entre
varias propuestas para seleccionar las mejores opciones, hasta
las incubadoras para aprender en forma automatizada sobre los
procesos de selección previos propios y de otras incubadoras,
así como predecir los mejores pasos para los emprendimientos
que han acogido.
Ante esto, se plantea una serie de interrogantes que se
pretenden abordar a lo largo del artículo.
¿Cuál es la información que puede generar un proceso de
minería de datos cuyo fin es predecir el éxito o fracaso de una
startup y por qué contribuye a su potenciación? Esta
interrogante será el centro de esta investigación.
Como se mencionó anteriormente, existen muchos factores
críticos que juegan un papel muy importante en la puesta en
2
marcha de una startup y que contribuyen a su evolución de
forma positiva; sin embargo, no todos pueden ser cuantificados
con precisión y confiabilidad, por ende, no deberían ser
considerados desde la perspectiva de minería de datos. He aquí
la otra interrogante: ¿Cuáles factores críticos contribuyen al de
éxito de una startup y a la vez son los más comunes en varios
contextos -geográfico, social, económico-, y cuáles de estos
factores se pueden considerar para minería de datos?
En relación con el contexto geográfico, ¿cómo se construiría
un modelo de predicción de éxito o fracaso de startups adaptado
al ecosistema costarricense y potenciado por herramientas de
minería de datos, en donde estas puedan sacar provecho de las
predicciones resultantes en una etapa temprana y así potenciar
su éxito?
Ante esta problemática, se plantea la siguiente hipótesis: las
compañías startup, por su morfología y características
especiales que las hacen cambiantes e impredecibles, pueden
verse grandemente beneficiadas por medio de la creación de un
modelo de predicción de éxito ajustado al entorno costarricense
que pueda ser cuantificado y ejecutado por un proceso de
minería de datos, tomando como datos las experiencias de otras
startups -factores de éxito- nacionales.
El siguiente artículo está organizado de la siguiente manera:
la sección 2 representa el marco teórico; define los principales
conceptos utilizados en esta investigación, además, describe y
menciona los trabajos relacionados con la adopción del Big
Data y la minería de datos dentro del ecosistema de las startups.
La sección 3 describe la metodología utilizada en este trabajo
para poder realizar el análisis de resultados presentado en la
sección 4. Se muestran las conclusiones del análisis aplicado al
ecosistema de startups costarricense en la sección 5. Por último,
en la sección 6, se mencionan las limitaciones y el trabajo
futuro.
II. MARCO TEÓRICO
¿Qué es una startup? La palabra en sí se ha utilizado durante
los últimos tiempos con distintas definiciones. En ocasiones,
describen compañías de tecnología, negocios iniciales
comandados por jóvenes que no necesariamente tienen definido
un nicho o un mercado.
Neil Blumental, CEO de la compañía Wardy Paker dedicada
a la prescripción de anteojos -que nace producto de una startup-
, describe una startup como una compañía que trata de
solucionar un problema donde la solución no es obvia y el éxito
no está garantizado [5].
Se debe tener claro que existe una diferencia entre lo que
realmente es una startup y un pequeño negocio o pymes como
se le conoce en Costa Rica.
Paul Graham, cabeza de la incubadora de startups Y
Combinator, la más poderosa del mundo, cree que esta
diferencia debe marcarse principalmente por el crecimiento. La
principal característica es que una startup está directamente
relacionada con la habilidad de crecer año con año, una
compañía con hasta 5 años en el mercado puede considerarse
startup si continúa creciendo a un ritmo acelerado, comenta
Paul. En un ejemplo claro, el pequeño inversor que crea un
restaurante de comida tradicional en el pueblo, este tipo de
negocio no puede considerarse como un startup si el negocio no
mantiene un ritmo acelerado durante los primeros años. Para
crecer rápido, se necesita un producto innovador que pueda
venderse en el mercado, un restaurante no crece rápidamente si
este no representa una innovación [7].
Otra confusión común es utilizar el término
emprendimiento como sinónimo de startup; un cafetalero, un
artesano o incluso una empresa de diseño gráfico son
emprendimientos, pero no startups. Bajo este concepto, Eric
Ries, creador de la metodología Lean Startup, define una
startup como “una institución humana diseñada para crear un
nuevo producto o servicio bajo condiciones de extrema
incertidumbre”, de nuevo, haciendo alusión al potencial éxito o
bien fracaso de la idea [8].
Debido al gran auge que han tenido las startups en los
últimos años, más “jugadores” se han sumado al ecosistema de
estas. Entre ellos: las incubadoras, las aceleradoras y los
inversores ángel.
Según Susan Cohen, quien estudia de cerca las firmas
participantes en programas de aceleración de startups,
primeramente, se debe hacer una clara distinción entre ellos ya
que no todos tienen o comparten el mismo objetivo, aunque sí
tienen una meta clara: ayudar en las etapas tempranas de una
startup.
Las incubadoras tienen como principal objetivo proveer
ayuda en diferentes áreas para que las startups se pueden hacer
fuertes antes de ser independientes, la mayoría de estas
incubadoras se basan en el sustento económico y comúnmente
están asociadas o afiliadas a una universidad, como lo es el caso
de la Incubadora de Empresas del Instituto Tecnológico de
Costa Rica (CIE-TEC).
El CIE-TEC ofrece acompañamiento administrativo, y la
posibilidad para aquellas empresas que están empezando con
sus operaciones de contar con un espacio físico. A su vez, esta
incubadora brinda ciertos beneficios y servicios que de otra
manera implicaría gastos adicionales [27].
A pesar de que el CIE-TEC se ha mantenido durante varios
años siendo una impulsadora de startups y pymes en Costa
Rica, no todas las universidades nacionales han incursionado en
este tipo de organizaciones, ni todas cuentan con los recursos
necesarios. Dentro de estos recursos, se debe contar con centros
de investigación y desarrollo, laboratorios de cómputo, la
disponibilidad de expertos en diversos temas relacionados con
el tipo de negocios en que las potenciales startups van a
incursionar. Además de lo anterior, se debe establecer el rol de
la universidad en el proceso de crear compañías y hacerlas
competitivas. Dado estos aspectos, es difícil que, en Costa Rica,
en el corto plazo, existan universidades que quieran dar un paso
adelante en este tema, especialmente aquellas que no cuentan
con los suficientes recursos [28].
En términos generales, las incubadoras reciben dinero por
parte de las empresas arrendatarias, esto a cambio de oficinas y
algún soporte administrativo. Algunas de estas también proveen
servicios de consultoría en diferentes áreas como tecnología,
asesoría legal, contaduría, entre otras. Algunas de ellas al verse
conectadas con una universidad pueden beneficiarse de
aspectos como propiedad intelectual, y a su vez, la universidad
3
se beneficia de la comercialización de sus servicios.
Un aspecto importante a considerar relacionado con las
incubadoras es el hecho de que estas pueden proveer recursos
que no son consistentes con lo que el mercado demanda; por
ejemplo, las startups pueden acostumbrarse a vivir en un
ecosistema de incubadoras, pero no necesariamente este refleja
la realidad que pueden afrontar en el mercado. De esta manera,
algunas startups pueden dirigirse hacia el fracaso si intentan
realizar una inmersión agresiva en el mercado. Por supuesto,
esto no es óptimo, y a largo plazo, puede convertirse en un
factor de fracaso. El problema de fondo es que se están gastando
recursos para mantener una compañía en fase de incubadora,
pero no preparándose para el mercado que debe ser el objetivo
principal, recursos que pueden ser aprovechados por otros
emprendimientos más atractivos.
Al aislar a una startup del mercado y sus fuerzas, estas están
perdiendo una importante retroalimentación que puede ser
necesaria para su posible adaptación. Una adaptación temprana
es un factor de éxito clave en cualquier empresa antes de
convertirse en una compañía estable y rígida, por lo tanto,
autosuficiente.
Los ángeles inversores, como individuos o grupos
inversores, tienen el objetivo de impulsar las startups,
principalmente proveyendo capital.
De acuerdo con el Center for Venture Research, más de
28,000 emprendimientos durante el primer trimestre del 2013,
recibieron alrededor de $9.7 billones de dólares. Esto,
claramente, convierte a los inversores ángeles en una parte
importante del ecosistema de las startups [11].
Según Susan, en muchas ocasiones, estos inversores son o
fueron emprendedores que buscan ayudar a una nueva
generación de emprendedores. Estos inversores pueden ser
también amigos o familiares que proveen apoyo económico.
TABLA 1. COMPARACIÓN DE INCUBADORAS, ÁNGELES
INVERSORES Y ACELERADORAS
Aspecto Tipo de organización
Incubadoras Ángeles inversores Aceleradoras
Duración
1 a 5 años Continua 3 meses
Grupos No No Sí
Modelo de
negocios
Renta, sin fines
de lucro Inversión
Inversión,
puede ser
también sin fines de lucro
Selección No
competitiva Competitiva Competitiva
Etapa Temprana o tardía
Temprana Temprana
Educación
Recursos
humanos, legal, etc.
No Seminarios
Mentoría Mínima Solo si es
necesario Intensa
Ubicación En sitio No en sitio En sitio
Los ángeles inversionistas ayudan a las firmas o las
compañías de una manera no estructurada, la falta de estructuras
muchas veces se convierte en un limitado envolvimiento y
mentoría que eventualmente puede ser un factor crítico, ya sea
de éxito o fracaso [11].
Las aceleradoras de startups tienen su entrada en las etapas
iniciales y su principal objetivo consiste, en como lo indica su
nombre, acelerar el crecimiento durante un corto periodo. Este
proceso es rápido, intenso, normalmente está dirigido a la
educación y procura acelerar el ciclo de vida de las compañías
innovadoras [9, 10].
Tanto Susan Cohen como Yael Hochberg de Rice University
subrayan cuatro factores que hacen a las aceleradoras
diferenciarse de sus otros conceptos hermanos: se dan por un
periodo de término establecido, se imparten en grupo, son
dirigidas por un mentor, y normalmente culminan con una
graduación [10].
La Tabla 1 muestra una breve comparación de lo que son
incubadoras, inversores ángel y aceleradoras de startups; todos
ellos actores importantes dentro de este ecosistema [11].
Es importante abordar por qué muchos negocios en general
pueden tener éxito o fallar en sus etapas tempranas. Estos
factores no solamente aplican a cualquier tipo de negocio, sino
también, y en mayor medida, a las startups.
En el artículo [12], el autor define y describe 2 factores
importantes que son clave en los primeros años de una startup.
Según se cita, de acuerdo con un estudio, el 53% de los fracasos
de una compañía en la década de los 80 ocurrió en menos de 5
años desde su fundación. El 80% de estos fracasos se dio,
también, en los 10 primeros años desde su creación.
Uno de los factores encontrados está relacionado
directamente con la tecnología, se establece que el alto número
de tecnologías emergentes que son utilizadas también por la
competencia incrementa la incertidumbre de cómo será
aceptado un producto o servicio por el mercado. Las compañías
que están en una etapa temprana no poseen los recursos
necesarios para hacer frente a los grandes cambios tecnológicos
dominantes, haciendo difícil su competencia con una compañía
que sí posee estos recursos.
Las startups, típicamente, poseen acceso limitado a recursos
financieros, materiales y mercados; los cuales deben suplir la
necesidad planteada. Pocos recursos significan que las startups
no pueden competir con condiciones normales de los mercados.
Ante esto, la innovación juega un papel clave en el crecimiento
de estas.
El estudio concluye que las compañías que tienen un
mercado especializado, lo que significa un mercado poco
explorado, tienen una probabilidad más alta de éxito sobre
aquellas que incursionan en mercados donde existe una
saturación. A pesar de esto, las que incursionan en estos
mercados pueden verse beneficiadas si la demanda aumenta.
No solo las startups deben tomar experiencias y vivencias
de grandes compañías como ejemplo para alcanzar su éxito,
sino también las grandes compañías pueden sacar gran
provecho de los factores de éxito de las startup. Eric Ries [13]
describe factores que han contribuido con el éxito de startups,
las cuales ha observado de cerca. Uno de estos factores, es poder
analizar y priorizar los riesgos que eventualmente pueden
afectar el negocio. Uno de los problemas de los
emprendimientos, señala Eric, es que invierten años tratando de
4
crear un producto para al final decidir si este es de valor para
los clientes o el mercado, en su lugar, las startups deben poder
crear el llamado producto viable mínimo; la versión más
pequeña del producto para comenzar con el proceso de
experimentación y aprendizaje. Este no debe confundirse con
un prototipo, sino que debe ser capaz de permitir probar la
mayoría de hipótesis planteadas acerca del producto.
De acuerdo con las estadísticas, en los Estados Unidos, a
pesar de que las startups cuentan con algunos privilegios tales
como el estar exentos de impuestos en 39 de los 50 estados, solo
el 35% de estas produce ganancias y la mayoría fracasa.
Según las estadísticas, 9 de cada 10 startups fracasan; es por
esto que muchas empresas, no solo del sector tecnológico, han
estudiado este fenómeno estudiando diferentes factores de
fracaso y éxito en las etapas tempranas de la creación de la
startup [25].
Estos factores de fracaso incluyen el que la mayoría de
startups no son capaces de crear un producto que el mercado
encuentre valioso o que este no es realmente innovador o ya
existe. Es esta falta de innovación lo que hace difícil el
acercamiento de inversores o interesados. Otro reto es
convencer a los clientes o usuarios finales de comprar su
producto.
Una startup debe considerar dos aspectos importantes para
hacer crecer sus ventas, primero, convencerlos de que el
producto desarrollado es de buena calidad; este es un aspecto
difícil ya que pueden no existir suficientes referencias de
experiencias previas. Segundo, estrictamente relacionado, es
que se debe convencer a los clientes que se seguirá ofreciendo
productos de calidad. Estos dos aspectos son difíciles de
alcanzar ya que las startups no poseen una amplia reputación
desarrollada debido a su naturaleza [4].
Una de las compañías que han utilizado Machine Learning
como potenciador y creador de startups es Fros Data Capital.
Esta organización ha sido la creadora de compañías como
NarrativeWave, la cual crea software para compañías que les
permite administrar piezas industriales, deducir datos de ellas y
entregar conocimiento para la toma de decisiones que permitan
mejorar las operaciones de la compañía [14].
La gran cantidad de datos disponibles mediante distintas
fuentes hace de su análisis y administración una tarea compleja.
La minería de datos, también llamada Knowledge Discovery
in Databases (KDD) en inglés, es considerada el proceso de
descubrimiento de nuevos patrones en grandes cantidades de
datos, comúnmente conocido como Big Data, mediante
métodos que envuelven varias disciplinas, tales como:
inteligencia artificial, estadística, matemáticas, reconocimiento
de patrones, entre otras [19].
El uso de estos datos para la toma de decisiones requiere de
métodos apropiados para la extracción de conocimiento.
Las técnicas de minería de datos son utilizadas para extraer
y descubrir conocimiento valioso y significativo a partir estas
grandes cantidades de datos.
La minería de datos, utilizada como una herramienta
analítica, ayuda a mejorar los procesos de toma de decisiones.
Además, brinda a los investigadores la posibilidad de hacer
descubrimientos utilizando Big Data, lo cual es permite tomar
decisiones con base en estos descubrimientos. [17].
Para poder realizar estos análisis, diferentes métodos y
algoritmos son utilizados para extraer patrones de los datos
almacenados. Ejemplos de estos algoritmos son la clasificación,
la asociación, la regresión y los árboles de decisión. Algunos de
estos algoritmos requieren datos estructurados o normalizados,
otros necesitan que los datos estén categorizados o agrupados.
También, estos algoritmos pueden proveer recomendaciones,
análisis de datos históricos o bien predicciones [20]. En el caso
de estas últimas, las cuales son la piedra angular de esta
investigación, se utilizan técnicas estadísticas y algoritmos
como el modelado estadístico, redes bayesianas, métodos
basados en instancias y modelos lineares. Cada algoritmo de
predicción tiene sus particularidades y sus diferentes
aplicaciones, algunos se basan en categorías o atributos
cualitativos y otros en valores numéricos [36]. Para entender
mejor su funcionalidad, se presenta el siguiente ejemplo de una
afirmación:
Si el clima es soleado, la temperatura caliente, la humedad
alta, los vientos son fuertes, entonces no se recomienda realizar
una partida de golf.
Hay que notar varias características. Se indica que la
temperatura es caliente, no se habla de una medida numérica, lo
mismo para todas las variables. Esto puede servir para algunos
algoritmos, otros van a tener que ser ajustados a un valor
numérico. Por otra parte, se menciona si se puede jugar o no. Al
ser esta una afirmación, significa que es un evento que pasó y
se registró en un histórico. En un sistema de KDD, existen miles
o millones de estas afirmaciones. Cuantas más existan, las
predicciones son más exactas. Ahora bien, dada una solicitud
de predicción en condiciones específicas de una situación en el
presente -por ejemplo, si el clima es frío, la humedad alta,
etcétera ¿es lo mejor jugar?-, el algoritmo de minería de datos
se encarga de tomar los registros históricos y ejecutar un
análisis de correlación basado en el flujo particular de cada
algoritmo; para finalmente, generar uno o varios resultados que
le indiquen al usuario el detalle de la predicción -en el caso de
ejemplo, el resultado sería indicar si lo mejor es realizar el juego
de golf o no.
Dos de las técnicas más utilizadas dentro de minería de
datos son las de clasificación y regresión. Estas corresponden al
grupo de técnicas de aprendizaje supervisadas, esto es que
existe un conocimiento previo de datos. Estas técnicas han sido
ampliamente utilizadas con éxito en diferentes áreas como
ingeniería, redes sociales, salud y otras; ya que permiten la
construcción de modelos sobre una variable de salida, basados
en diferentes variables de entrada [25].
Distintas opciones de software en el mercado, Weka, por
ejemplo, permiten utilizar diferentes algoritmos de clasificación
sobre un conjunto de datos. Algunos de estos algoritmos son
Lazy lb1, Random Forest, el cual consiste en una serie de
árboles de decisión, Bayesian Network, entre otros [26].
La inteligencia de negocios (BI por sus siglas en inglés) es
la combinación de un sistema para la toma de decisiones y un
sistema de información. Esta disciplina viene a proveer
respuestas a diferentes preguntas que pueden hacerse a nivel
gerencial, por ejemplo ¿cómo afectará a la compañía la caída de
5
un 6% de la producción de un producto específico en un
determinado mes? [29].
La combinación de estas disciplinas, tanto Big Data como
minería de datos e inteligencia de negocios, ha demostrado que
puede traer grandes beneficios a las compañías en materia de
oportunidades de mercado, medición de efectividad de
actividades y toma de decisiones [30].
III. METODOLOGÍA
Para dar respuesta a las preguntas de investigación, primero,
se deben estudiar factores críticos de éxito de las startup a nivel
mundial. Se buscarán artículos y otras fuentes en donde se
detallen los factores y la razón del porqué se consideran críticos.
Luego, se procederá a comparar las múltiples listas para
encontrar factores en común y así contar con una lista definitiva.
Una vez identificados los factores, se deberá tomar en
cuenta el ecosistema de las startups en Costa Rica. Para esto, se
buscan estudios formales que revelen el ambiente actual -
aspecto socioeconómico, idiosincrasia, apoyo estatal, mercado,
educación- y cómo este afecta en el éxito o fracaso de las
startup. Inmediatamente, la lista de factores deberá ser
actualizada para reflejar dicho contexto.
Seguidamente, se analizará la posible adaptación de los
factores a la minería de datos. Se tomará cada factor y se
buscará en distintas fuentes su posible cuantificación, con el fin
de tener variables que puedan ser medidas. Por ejemplo, se sabe
que la edad de los emprendedores es un factor crítico para el
éxito de una startup [18]. En Costa Rica, un rango deseable
oscila entre 20 y 45 años [15]. Lo que sigue es buscar la manera
de cuantificar esta cifra de forma tal que se le asigne un peso
numérico. Para ello se estudiará la mejor manera de asignar
dicho peso, investigando sobre qué tanto afecta el factor de la
edad si se compara con otros factores y cómo esta interacción
influiría en el resultado final.
El siguiente paso consiste en investigar sobre algunos
algoritmos predictivos de minería de datos que puedan ser
aplicados producto del tipo de variables recolectadas. Para
apoyar todo lo anterior, se van a investigar implementaciones
similares a nivel global y validar de una mejor manera la
respuesta a las interrogantes.
Finalmente, una vez que se ha seleccionado los mejores
algoritmos y las variables a utilizar, y se ha considerado el
contexto de Costa Rica en la propuesta, se tiene el modelo final.
IV. ANÁLISIS
La creación de startups es un proceso riesgoso que a su vez
tiende a consumir mucho dinero, tiempo y esfuerzo entre los
emprendedores y todo el ecosistema en general. La realidad
actual es que, producto de tal esfuerzo, aproximadamente el
90% de los nuevos emprendimientos falla [21]. De ahí la
importancia de un estudio detallado de los factores críticos de
éxito del restante 10%.
Yankov analizó 42 modelos de predicción del éxito de
startup, desde 1974 a 2010. Una de las características
evolutivas es que se pasó de simples listados de factores críticos
de éxito a agrupaciones en categorías más genéricas [22].
Uno de los modelos más estudiados es el de Sandberg, del
cual se derivaron múltiples variables: equipo emprendedor,
factores ambientales, estrategia, estructura de la industria y la
interacción de la estrategia con la estructura.
Otro modelo, de 1999, condiciona la supervivencia de una
startup con el éxito en las siguientes variables: estabilidad,
tiempo de entrada al mercado, tiempo de espera de salida del
producto o servicio, rivalidad competitiva, capacidad
educacional (en temas de mercadeo), conocimiento de la
industria.
Existen otros dos modelos derivados interesantes que
difieren de los enfoques anteriores en estructura. Entre sus
variables se pueden enumerar el capital humano, relacionado
directamente con las personas y sus años de experiencia en la
industria, años de estudios, experiencia en emprendedurismo y
liderazgo). Otra variable se refiere a las características
organizacionales, por ejemplo, qué tan nueva es la startup, el
tamaño inicial y las estrategias organizacionales. También se
hace énfasis en las condiciones ambientales como la locación
geográfica, rama de la industria y condiciones del mercado. El
siguiente aspecto es el momento de salida del producto o
servicio, en otras palabras, si son muy nuevos para el mercado
actual (o muy viejos), hay un mayor chance de fracaso. Una de
las variables más importantes tomadas en cuenta es el
planeamiento; si una startup no cuentan con planes de negocio,
tiene grandes probabilidades de fracaso. En cuanto a asesoría
profesional, existe más posibilidad de éxito si se utiliza en áreas
donde haya deficiencias de conocimiento o no se tenga un
criterio experto (especialmente en etapas tempranas). Por
último, el nivel educativo de los emprendedores es una variable
importante; se sabe que tienen más probabilidades de fracaso si
no cuentan con estudios universitarios.
Tomando en cuenta los factores anteriores, Yankov propone
un modelo unificado que reúne las diferentes variables en
categorías. El modelo se presenta mediante la siguiente
fórmula:
NVP = f (E, IS, BS, R) (1)
Dónde, NVP (New Venture Performance) es el rendimiento
positivo o negativo del éxito de la startup, mientras que “E”
(Entrepreneur) es el emprendedor, “IS” (Industry Structure) es
la estructura de la industria, “BS” (Business Strategy) es la
estrategia del negocio y “R” (Resources) representa a los
recursos disponibles (humanos, económicos, etc.). Cada una de
las cuatro variables principales cuenta con subcategorías para
mayor claridad sobre los enfoques de cada una, las cuales se
despliegan en la Figura 1.
Si bien es cierto la mayoría de los factores presentados
anteriormente están relacionados con el producto, el mercado y
sus cambios, en Costa Rica, los factores más estudiados son los
que caracterizan al emprendedor; dando énfasis en
características tales como la educación, el acceso a capital
inicial o la edad.
Según una encuesta de la Coalición Costarricense de
Iniciativas de Desarrollo (CINDE), durante el 2013 más de
85,000 costarricenses trabajaban para alrededor de 250
multinacionales, el equivalente al 5,8% del producto interno
bruto (PIB). Los factores por los cuales estas empresas se
6
interesan en el capital humano costarricense son,
principalmente, el alto grado de educación, el manejo de
segundos idiomas (en especial el inglés) y la gran cercanía con
los Estados Unidos.
Estos datos permiten identificar que el grado de educación
y conocimiento de idiomas favorece el éxito de los empleados;
sin embargo, el gran problema es que, a su vez, estas compañías
están abarcando gran parte del personal potencialmente
preparado para el emprendimiento [15].
Según la misma fuente, uno de los reportes del Banco
Mundial en el 2014 expone a Costa Rica dentro de los países
con porcentajes más bajo de ahorros. Según las predicciones del
Fondo Monetario Internacional (FMI), esto no cambiará en los
próximos años. Las anteriores afirmaciones ponen a los futuros
emprendedores en una situación difícil al no contar, muy
probablemente, con capital suficiente para el arranque de un
emprendimiento [23]. Si esto es así, existen una gran
posibilidad de que sus inversores por parte de los familiares y
casuales estén en una situación muy similar. Tal situación,
coloca al capital inicial como un factor importante a considerar
y que, además, puede influir en otros factores [15].
En Costa Rica, según entrevistas realizadas a una serie de
jóvenes emprendedores, la mayoría indica que no se les
complicó el decidirse por emprender, en parte debido a que un
gran número de ellos aún eran dependientes de sus padres y con
pocas responsabilidades. A las personas entre 30 y 45 años, a
pesar de ser condicionadas por presiones sociales como el
matrimonio, el tener hijos o la compra de vivienda, identifican
ventajas como el fácil acceso al crédito, experiencia laboral,
ahorro, entre otros, las cuales les permitió una mayor
probabilidad de éxito. Para las personas de más de 45 años, la
experiencia adquirida, la estabilidad económica, los contactos y
para muchos de ellos el no ser primerizos en cuanto a
emprendimientos, les permitió manejar mejor el riesgo,
aumentando las posibilidades de éxito [15].
Figura 1. Modelo de predicción de éxito de las startup.
Como se mencionó anteriormente, según estudios a nivel
mundial, el fracaso en las startups y los emprendimientos son
mayores en las personas más jóvenes; en Costa Rica, el factor
de la edad del emprendedor es uno de los más influyentes para
el éxito de las startups, debido a su relación directa con aspectos
como la energía, el apoyo de organizaciones, la experiencia, los
contactos, el costo de oportunidad y lo relacionado con la
situación actual del emprendedor en términos de estado civil,
situación laboral actual, si posee o no hijos o deudas
hipotecarias [15]. Por ejemplo, un emprendedor de más de 40
años tiene más posibilidades de fracaso que un joven por
responsabilidades como las mencionadas anteriormente.
Asimismo, un emprendedor del rango de los 20 años tiene más
probabilidades de fracaso por su falta de experiencia,
conexiones y acceso a financiamiento que una persona mayor
[15].
Dentro del ecosistema de las startups, en Costa Rica, el
factor asociado al emprendedor, tomando en cuenta variables
antes mencionadas como la edad, la educación, el acceso al
dinero y la experiencia laboral, adquieren una gran importancia
para establecer una clara relación directa con el modelo
propuesto.
El modelo de predicción de éxito de las startup propuesto
tiene cuatro categorías principales, de las cuales, se detalla su
aplicabilidad en el ecosistema costarricense. La primera está
relacionada con el equipo emprendedor.
Según el estudio “Mapeo del ecosistema del
emprendimiento en Costa Rica” conducido por Randall Trejos
y la Fundación startup Costa Rica, en el país, existen varios
problemas que conducen a la falta de colaboración con otras
personas y equipos [15], lo cual aumenta las probabilidades de
fracaso.
Entre los problemas, se encuentran la falta de necesidad de
otros miembros en el equipo; en otras palabras, se trata de llevar
el emprendimiento de forma solitaria, producto de la
desconfianza con personas ajenas a su círculo de amigos o
familiar. Si fuera el caso de que se seleccionan miembros del
equipo que sí se encuentren dentro del círculo de confianza,
existe el riesgo latente de equipos desbalanceados a nivel
intelectual y de experiencia en algún área específica. Esta
misma falta de confianza hace que los emprendedores tengan
temor de compartir en detalle sus ideas y por lo consiguiente,
mantienen un bajo perfil, lo que conduce a una falta de
aprendizaje colectivo. Aquí se puede ver claramente la
aplicabilidad al modelo en las áreas de personalidad y valores,
habilidades, experiencia y trabajo en equipo.
La siguiente categoría es la de la estrategia de negocio. Con
base en el mismo estudio, se determinó que parte de las
prácticas recomendadas incluyen el desarrollo de un plan y
proyecciones financieras -es casi imperativo hacerlo en etapas
tempranas-, así como establecer una visión a largo plazo para
permitir una mejor toma de decisiones en un marco de
referencia pensado a futuro, definir una estrategia que tome
aspectos como las finanzas y, la capacitación del personal en
áreas que tengan falencias y de crecimiento. También hace
hincapié en la necesidad de una estrategia de colaboración -para
lo cual, las incubadoras y las aceleradoras incluyen espacios de
7
coworking- con otras startups u otro tipo de empresas, mentores
o consultores para aumentar las probabilidades del éxito al
fortalecer áreas en las que existan posibles amenazas.
En el caso de la categoría de la estructura de la industria,
hay varios aspectos que un nuevo emprendimiento necesita
estudiar, uno de ellos es la competencia. En Costa Rica, durante
2016, organizaciones como aceleradores, inversionistas y
bancos, recibieron más de 800 proyectos y para 2017, se prevé
un alza en la cantidad de programas de apoyo, tanto en el ámbito
privado como iniciativas gubernamentales [32]. A esto hay que
añadirle la competencia de empresas ya establecidas a nivel
nacional e internacional.
En el apartado de la estructura, según el estudio de Trejos,
se recomienda pensar en un mercado local, pero de forma
escalable, ya que se tiende a no diseñar en la etapa de planeación
pensando en expandirse a otros mercados y esto aumenta las
probabilidades de fracaso, debido a que se sabe de antemano
que el proceso de expansión internacional o a un mercado más
grande conlleva grandes dificultades. Las barreras de entrada
son otro punto importante en la estructura de la industria que
tiene que ser estudiado para asegurar el éxito de una startup.
Una de las principales es la dificultad en el proceso de
financiamiento de un sector bancario costarricense que no es
capaz de servir a las startups, para lo cual hay que recurrir a
fuentes alternativas -y como tales, con sus riesgos particulares
en comparación con los bancos-, como inversionistas ángeles,
capital familiar, capital semilla del gobierno, clubes de
inversionistas y aceleración, etc. [15]. Otra variable que no se
enfatiza en el modelo de Yankov y en Costa Rica es de suma
importancia, es la relación de la startup con el ecosistema. Una
mayor densidad de las conexiones que tenga una compañía con
otras partes del ecosistema -entiéndase incubadoras, mentores,
otros startups, consultores- aumenta las posibilidades de éxito.
Producto de lo anterior, la visibilidad aumenta y se contribuye
a la evolución y el fortalecimiento del ecosistema costarricense
[15].
Hay un aspecto muy interesante que vale la pena mencionar:
Costa Rica es un país pequeño, tanto en habitantes como en
infraestructura industrial, esto se traslada también al ecosistema
de startups. Debido a esta particularidad, si un componente de
la conexión falla, todo el ecosistema se ve afectado
rápidamente. Por ejemplo, a menor visibilidad, menor el
número de startups que aplican a una aceleradora; si esto
sucede, sus estándares de calidad y aceptación deben bajar para
atraer a más startups y asegurar su sostenibilidad, lo que hace
que las probabilidades de fracaso de las futuras startups
aumente.
Producto de lo anterior, la cantidad de inversores ángeles y
demás fuentes de financiamiento va a oponer más resistencia
para minimizar el riesgo y se generará una mayor dependencia
de capital gubernamental -con todos los obstáculos que la
burocracia representa para el dinamismo de las startup. La falta
de visibilidad también hace que no se aproveche el
conocimiento experto de otros emprendimientos o mentores,
añadiendo más barreras al éxito de la empresa. Como se puede
apreciar en este escenario, la densidad de conexiones y
visibilidad no solamente afecta a una startup individualmente,
sino que genera una reacción en cadena perjudicial para la
estructura de la industria nacional.
Para finalizar con la asociación del modelo de predicción
con el ambiente costarricense, se tiene la categoría de recursos.
En Costa Rica, se ha reconocido paulatinamente [32] la
necesidad de contar con estructuras e iniciativas capaces de
tomar a las startup y apoyarlas. Estas no solo se gestan para la
etapa de validación de la idea, sino también para así obtener los
recursos necesarios -financiamiento, asesoría, equipo- en cada
etapa de su ciclo. Un ejemplo claro son las competencias de
emprendimiento, en donde hay toda una serie de recursos
disponibles (inversionistas, expertos en varios campos, otros
equipos de múltiples disciplinas con los que se podrían
establecer vínculos) y las partes involucradas se benefician
mutuamente [15].
El crecimiento del ecosistema de startups, que ha
evolucionado a lo largo de los años en el país, así como el hecho
de que las empresas que pasan por una incubadora -por poner
un ejemplo de una estructura específica- tienen un mayor
porcentaje de éxito de sobrevivencia sobre las que nunca lo
hicieron [33], es una prueba de que el tema de los recursos es
un factor crítico de éxito que debe ser tomado en cuenta en el
modelo, independientemente del área geográfica de estudio.
En la Figura 2, se observa el modelo de predicción de éxito
de las startups ajustado al ambiente costarricense. Se agregó la
variable de la edad y la situación de los emprendedores, lo que
se refiere al promedio de edad de los emprendedores y la
relación directa con su situación personal actual -casados o
solteros, con o sin hijos, con o sin hipotecas-. La otra variable
ajustada corresponde a las relaciones de la startups con el
ecosistema, con el fin de medir qué tanto está sumergida en
dicho ambiente, en términos de conexiones, visibilidad en la
industria, así como el nivel de aislamiento y cooperación con
sus pares.
Figura 2. Modelo de predicción de éxito de las startup
ajustado al ecosistema costarricense.
8
Una vez establecidos los enlaces entre el ecosistema de
startups costarricense y el modelo de predicción en estudio, se
procede a analizar los modelos y cómo trasladarlos a un
esquema cuantitativo para ejecutar las predicciones. Para lograr
este objetivo, Miettinen y Littunen proponen en su estudio
“Factors Contributing to the Success of Start-Up Firms Using
Two-Point or Multiple-Point Scale Models” la creación de
categorías como método de medición. Cada categoría va a
contar con una serie de valores que son asignados a dicha
categoría para cada objeto de estudio.
Siguiendo esta metodología, la primera categoría sería la del
éxito o fracaso de la startup, lo cual se detalla en la Tabla 2.
Como se puede apreciar, se tomó cada una de las variables
del modelo ajustado y se logró categorizar de tal manera que
pueda ser trasladado a una herramienta de minería de datos,
luego del proceso de recolección de datos. Para ello, se
recomienda la creación de formularios que apoyen este fin,
utilizando redes de contactos, redes sociales, comunidades de
startups, correos electrónicos, entre otros [31].
Un ejemplo de lo anterior es el estudio de Yankov, en donde
se utiliza este tipo de cuestionarios con una serie de 107
variables identificadas dentro de las cuatro categorías de su
modelo de predicción. Estos datos contienen información de
105 compañías de Bulgaria de diferentes tamaños y años en el
mercado [31]. Una vez que se realizaron las preguntas, se
categorizó la información y luego fue analizada por diferentes
algoritmos de predicción.
Para el análisis de los datos expuestos en el modelo, se
propone la creación de un proyecto de minería de datos con sus
fases conocidas: entendimiento del negocio, entendimiento de
los datos, preparación de los datos, modelado, evaluación y su
puesta en producción [24].
TABLA 2. CATEGORIZACIÓN DE LAS VARIABLES DEL MODELO
DE PREDICCIÓN PROPUESTO
Categoría Subcategoría Atributos
Éxito de la startup
N/A
6 = startup ha podido sostenerse por
algunos años, 5 = startup ha logrado
sostenerse, 4 = dificultad en balancear fluctuaciones, cambios en la
rentabilidad, 3 = dificultades a nivel
operacional y de finanzas, necesidad de reorganización, 2 = amenaza de
bancarrota, 1 = sin capacidad de cubrir
sus obligaciones financieras
Equipo Emprendedor
Personalidad y valores
Nivel de confianza: 1 = alto, 2 =
medio, 3 = bajo
Tolerancia al riesgo: 1 = alta, 2 =
media, 3 = baja
Nivel de liderazgo: 1 = alto, 2 = medio,
3 = bajo.
Locus de control: 1 = interno, 2 =
externo
Habilidades y experiencia
Experiencia en manejo de equipos: 1 =
mucha, 2 = alguna, 3 = carente
Experiencia en la rama del producto o
servicio: 1 = mucha, 2 = alguna, 3 = carente
Experiencia gerencial (finanzas,
RRHH, gestión de empresas): 1 = mucha, 2 = alguna, 3 = carente
Nivel de escolaridad de fundadores: 1
= sin educación profesional, 2 = colegio, 3 = educación técnica o
parauniversitaria, 4 = universidad
Experiencia en emprendedurismo: 1 =
mucha, 2 = alguna, 3 = carente
Tiempo de operaciones del negocio: 1
= 1 año, 2 = 2 años, 3 = 3 años, 4 = 4
años, 5 = 5 años o más
Trabajo en
equipo
Grado de trabajo en equipo en las operaciones diarias: 1 = mucho, 2 =
medio, 3 = poco, 4 = nada
Iniciativas gerenciales para trabajo en equipo: 1 = sí hay, 2 = no hay
¿Trabajo en equipo genera valor?: 1 =
mucho, 2 = poco, 3 = nada
Edad y
situación
Estado civil: 1 = casado(a), 2 = soltero(a), 3 = divorciado(a), 4 =
viudo(a), 5 = unión libre
Género: 1 = hombre, 2 = mujer
Edad promedio: 1 = menos de 20 años,
2 = entre 20 y 34 años, 3 = entre 35 y
44 años, 4 = entre 45 y 54 años, 5 = entre 55 y 64 años, 6 = 65 años o más
Posee préstamos hipotecarios: 1 = sí, 2
= no
Tiempo dedicado al startup: 1 = tiempo completo, 2 = medio tiempo, 3 =
menos de medio tiempo
Estrategia de
negocio
Planeamiento
¿Existe un plan de negocio?: 1 = sí, 2 = no
Seguimiento y control del plan según
fundadores: 1 = estricto, 2 = parcial, 3
= inexistente
Metas
Definición de las metas: 1 = se tienen
bien definidas y se respetan, 2 = se
tienen definidas, pero se respetan parcialmente 3 = no se tienen metas
definidas formalmente
Dirección
estratégica
Nivel de agresividad de la estrategia
empresarial: 1 = se persiguen agresivamente nuevos nichos de
mercado, 2 = estrategia defensiva que
busca un lugar seguro en el mercado, 3 = no se tiene clara
Estrategia de entrada
Tipo de estrategia de entrada: 1 =
producto o servicio pionero en el campo, 2 = entrada tardía al mercado, 3
= no se tiene estrategia de entrada
Ventaja
competitiva
Tipo de estrategia de ventaja: 1 =
diferenciación de costo, 2 = diferenciación de producto o servicio, 3
= enfoque en nicho de mercado específico
Asociación
estratégica
Existe algún tipo de asociación o apoyo
a otras organizaciones: 1 = Sí, 2 = No
Existe algún tipo de asociación o apoyo de otras organizaciones: 1 = Sí, 2 = No
Estructura de
la industria
Características estructurales
Barreras a nivel financiero: 1 =
Muchas, 2 = Algunas, 3 = Pocas
Barreras a nivel de ecosistema de startups: 1 = Muchas, 2 = Algunas, 3 =
Pocas
Barreras a nivel tecnológico: 1 =
Muchas, 2 = Algunas, 3 = Pocas
Barreras a nivel gubernamental: 1 =
Muchas, 2 = Algunas, 3 = Pocas
Rivalidad
Análisis de la competencia: 1 = existe
un análisis formal del mercado meta, 2 = existe un análisis informal del
9
mercado meta, 3 = no existe un análisis
del mercado meta
Naturaleza de
los compradores
Claridad del mercado meta (género,
edades, clase social, localización
geográfica): 1 = mucha, 2 = alguna, 3 =
poca
Relaciones con
el ecosistema
Relaciones con incubadoras: 1 = sí, 2 =
no
Relaciones con startups de la misma
industria: 1 = sí, 2 = no
Relaciones con startups de otras
industrias: 1 = sí, 2 = no
Relaciones con aceleradores: 1 = sí, 2 =
no
Relaciones con inversores ángeles: 1 =
sí, 2 = no
Relaciones con eventos privados o
gubernamentales de startups: 1 = sí, 2 = no
Relaciones con mentores: 1 = sí, 2 = no
Relaciones con asesores profesionales: 1 = sí, 2 = no
Recursos
Activos
tangibles
Lugar físico: 1 = sí se tiene, 2 =
alquiler o equivalente, 3= casa de habitación, 4 = no se tiene o no es fijo
Financiamiento (millones de colones):
1 = menos de 1.000.000, 2 = entre 1.000.000 y 10.000.000, 3 = entre
10.000.000 y 50.000.000, 4 = entre
50.000.000 y 100.000.000, 5 = más de 100.000.000
Inventario (mobiliario, equipo de
cómputo, etc.): 1 = no existen
problemas de abastecimiento, 2 = pocos problemas de abastecimiento, 3
= muchos problemas de abastecimiento
Activos
intangibles
Patentes: 1 = sí existen, 2 = en trámite, 3 = no existen o no aplica
Presencia en línea (redes sociales, sitio
web): 1 = mucha, 2 = alguna, 3 = poca
Financiamiento
Banco como fuente de financiamiento: 1 = sí, 2 = parcialmente, 3 = no
Ángeles inversores como fuente de
financiamiento: 1 = sí, 2 =
parcialmente, 3 = no
Capital propio como fuente de
financiamiento: 1 = sí, 2 =
parcialmente, 3 = no
Gobierno como fuente de financiamiento: 1 = sí, 2 =
parcialmente, 3 = no
Premios en competiciones como fuente de financiamiento: 1 = sí, 2 =
parcialmente, 3 = no
Aceleradoras como fuente de financiamiento: 1 = sí, 2 =
parcialmente, 3 = no
Amigos, familiares o conocidos como
fuente de financiamiento: 1 = sí, 2 = parcialmente, 3 = no
Dentro de este concepto de proyecto, el ciclo es repetitivo,
es decir, el proyecto no termina cuando se llega a la fase de
puesta en producción, sino que esta fase desata una serie de
interrogantes que vendrán a enriquecer una próxima ejecución.
En otras palabras, la primera corrida de los algoritmos no va a
arrojar un resultado definitivo. Se tienen que revisar el proceso
de abajo para arriba: los resultados, los algoritmos, las
preguntas del cuestionario, las categorías y de ser necesario,
cambiar las variables del modelo.
Para esta investigación, con base en el modelo propuesto por
Yankov, se considera prudente primeramente analizar uno a
uno los algoritmos sugeridos por la herramienta de análisis a
utilizar; sin embargo, según los resultados obtenidos por
Yankov, los métodos que generan árboles de decisión muestran
ser el tipo adecuado para este tipo de análisis.
V. CONCLUSIONES
Con base en el análisis de la sección 4, se han presentado
diferentes modelos que se intentan predecir el éxito de las
startups mediante la utilización de diferentes variables críticas
que pueden influir sobre este. En este análisis, utilizando como
base el modelo de predicción de éxito de startups propuesto por
Yankov, se evidencia que estos factores son comunes en
diferentes contextos y a los que fielmente se les puede aplicar
alguna técnica de minería de datos para predecir el eventual
éxito de una startup.
Dado lo anterior, se considera que las variables utilizadas en
este modelo, junto con las adhesiones hechas en esta
investigación, pueden ser empleadas por la minería de datos
para predecir el éxito de una startup en Costa Rica.
Se han estudiado, mediante la revisión y el análisis de la
literatura existente y disponible, diferentes aspectos
socioeconómicos de los emprendedores y el ecosistema de las
startups en Costa Rica. Dentro de estos, se han identificado
algunos aspectos que evidentemente tienen influencia directa en
el éxito de las startups. Algunos mencionados corresponden al
capital inicial que poseen los emprendedores, el nivel
educativo, la edad, la situación personal y la experiencia laboral
adquirida. Tomando como base el modelo de Yankov, se han
relacionado cada una de las categorías presentes en este modelo;
equipo emprendedor, estrategia de negocio, estructura de la
industria y recursos, con la situación actual del entorno y la
incursión de ciertas dimensiones particulares: área
socioeconómica, cultural y estructural de la industria en Costa
Rica; lo anterior tomando como referencia, entre otros, el
estudio realizado por Trejos en [15].
Con base en esta relación, se propuso un modelo de
predicción de éxito adaptado a la situación actual de Costa Rica,
tomando en cuenta características del emprendedor local y su
relación con el ecosistema. Para la aplicación de técnicas de
minería de datos sobre este modelo, sea ha asignado a cada una
de las subcategorías identificadas en la Figura 2, atributos que
poseen diferentes valores y describen el nivel actual de la
startup en cada aspecto particular. Se mencionó, además, que la
técnica de minería de datos de clasificación por árboles de
decisión mostraría los mejores resultados dada la naturaleza de
los datos. Diferentes opciones de software en el mercado están
disponibles para este análisis. Weka, es una alternativa de
código abierto que permite aplicar este tipo de técnicas de
minería de datos.
Tomando en cuenta lo analizado en esta investigación, se
concluye que las startups en Costa Rica pueden sacar provecho
de las predicciones resultantes del proceso de minería de datos
utilizando el modelo de predicción de éxito de startups
10
propuesto y aplicar este conocimiento en una etapa temprana
como medida preventiva ante las principales eventualidades
que puedan surgir según sus características propias -edad y
número de emprendedores, capital disponible, relación con el
entorno de startups, visibilidad, fortaleza del plan de negocio,
competencia de la industria específica, entre muchas otras.
Esta información permitirá a los emprendedores y a todos
aquellos interesados, entre ellos inversores y organizaciones
como las incubadoras y aceleradoras, saber de antemano con un
alto porcentaje de certeza -gracias a la utilización de métodos
matemáticos y estadísticos- si la startup será o no exitosa y a su
vez, conocer los factores que puedan estar influyendo
negativamente en su éxito futuro para crear estrategias de
crecimiento y mejora, de tal manera que se asegure la mayor
probabilidad de éxito.
VI. LIMITACIONES Y TRABAJO FUTURO
Para la presente investigación, se propuso un modelo de
predicción ajustado a la realidad costarricense en la actualidad.
Se creó una serie de escalas que pueden ser utilizadas para crear
cuestionarios, encuestas u otro tipo de herramientas de
recolección de datos, las cuales no son parte de este trabajo y se
recomienda altamente su aplicación periódica para asegurar un
panorama actualizado.
Siguiendo esta premisa, es importante entender que un
proceso de minería de datos requiere una revisión de abajo hacia
arriba, en el sentido de que tanto el modelo, como las variables,
los algoritmos y las escalas utilizadas pueden y deben ser
cambiadas en cada iteración para mejorar la calidad de las
predicciones, realizando correcciones y descubriendo nuevos
patrones y variables. Aun así, se considera que el presente
trabajo es un sólido inicio para realizar los cálculos.
Como trabajo futuro, se recomienda la recolección de los
datos como se mencionó en el apartado anterior, para luego
ejecutar el análisis de la información con base en el modelo de
predicción propuesto mediante los algoritmos de minería de
datos mencionados en el marco teórico de esta investigación,
así como el análisis de resultados de dicha ejecución.
Solamente, con el estudio de los resultados y el refinamiento del
proceso, se podrá validar cuantitativamente la utilidad del
modelo propuesto y su aplicabilidad en el ecosistema de
startups costarricense.
REFERENCIAS
[1] ŢĂRANU, I. i. (2015). Big Data Analytics Platforms analyze from
startups to traditional database players. Database Systems Journal, 6(1), 23-32.
[2] Chen, D. Q., Preston, D. S., & Swink, M. (2015). How the Use of Big
Data Analytics Affects Value Creation in Supply Chain Management.
Journal Of Management Information Systems, 32(4), 4-39.
[3] Ng, A. s., Wong, A. s., & Tai Ming Wut1, s. (2016). Second-movers'
advantage of utilizing Big Data to enhance sustainability performance: the case of elevator industry. Proceedings Of The International
Conference On Industrial Engineering & Operations Management,
2569-2579.
[4] DeKinder, J. S., & Kohli, A. K. (2008). Flow Signals: How Patterns over Time Affect the Acceptance of Start-Up Firms. Journal Of Marketing,
72(5), 84-97. doi:10.1509/jmkg.72.5.84
[5] Robehmed, N. (2015, May 15). What Is A Startup? Retrieved February
19, 2017, from
http://www.forbes.com/sites/natalierobehmed/2013/12/16/what-is-a-
startup
[6] Mora, Ó., Rojas, K., Arias, M., Jiménez, G., Jiménez, J., & González, L.
(2016). Estado de situación de las PYMES en Costa Rica 2015. San José: Ministerio de Economía, Industria y Comercio. Retrieved from
http://reventazon.meic.go.cr/informacion/estudios/2016/pymes/informe
[7] Graham, P. (2012, September). startup = Growth. Retrieved February
19, 2017, from http://www.paulgraham.com/growth.html
[8] Ries, E. (2011). The lean startup: How today's entrepreneurs use continuous innovation to create radically successful businesses.
[9] Hathaway, I. (2016). What startup Accelerators Really Do. Harvard Business Review Digital Articles, 2-7.
[10] Hathaway, I. (2016, February 17). Accelerating growth: startup
accelerator programs in the United States. Retrieved February 19, 2017,
from https://www.brookings.edu/research/accelerating-growth-startup-accelerator-programs-in-the-united-states/
[11] Cohen, Susan (2013), “What Do Accelerators Do? Insights from
Incubators and Angels,” Innovations, 8:3/4, pp. 19-25.
[12] Romanelli, E. (1989). Environments and Strategies of Organization
Start-up: Effects on Early Survival. Administrative Science Quarterly,
34(3), 369-387.
[13] Euchner, J. (2013). What Large Companies Can Learn from Start-ups. Research Technology Management, 56(4), 12-16.
[14] NEWMAN, D. (2016). Big Data as startup Material. (cover story). Orange County Business Journal, 39(26), 1.
[15] Emprendimiento.cr. (2016). Mapeo del ecosistema de emprendimiento
en Costa Rica: actores, conexiones y buenas prácticas (p. 8, 28). San
José, Costa Rica. Recuperado a partir de http://www.emprendimiento.cr/formulario-reporte
[16] G. Selig, "Critical success factors for winning entrepreneurs and the role of an incubator in accelerating the growth of start-ups and early stage
companies," Proceedings of the 2014 Zone 1 Conference of the
American Society for Engineering Education, Bridgeport, CT, 2014, pp. 1-6.
[17] Mueen, A. m., Zafar, B. b., & Manzoor, U. u. (2016). Modeling and
Predicting Students' Academic Performance Using Data Mining
Techniques. International Journal Of Modern Education & Computer Science, 8(11), 36-42.
[18] Yankov, B., 2013, A Model for Predicting the Success of New Ventures,
Vth International Scientific Conference e-Governance, ISSN 1313-
8774, pp. 128-135.
[19] IONIŢĂ, I. i. (2016). Data mining techniques for e-learning. Journal Of
Applied Computer Science & Mathematics, 10(22), 26-31.
[20] Liao, S., & Lee, I. (2002). Appropriate medical data categorization for data mining classification techniques. Medical Informatics & The
Internet In Medicine, 27(1), 59-67.
[21] Patel, N. (2017). Forbes Welcome. Forbes.com. Recuperado a partir de
https://www.forbes.com/sites/neilpatel/2015/01/16/90-of-startups-will-
fail-heres-what-you-need-to-know-about-the-10/#66c0bf4b6679
[22] Yankov, B. (2012). Overview of success prediction models for new ventures, pp. 2-4. Department of Software Engineering at Sofia
University.
[23] IFM. (2016, Oct 6). Costa Rica Gross National Savings, % of GDP
Retrieved February 25, 2017, from
https://www.quandl.com/data/ODA/CRI_NGSD_NGDP-Costa-Rica-Gross-National-Savings-of-GDP
[24] Witten, I. H., Frank, E.,, Hall, M. A. (2011). Data Mining: Practical
Machine Learning Tools and Techniques. Amsterdam: Morgan
Kaufmann. ISBN: 978-0-12-374856-0.
[25] A. Krishna, A. Agrawal and A. Choudhary, "Predicting the Outcome of
Startups: Less Failure, More Success," 2016 IEEE 16th International Conference on Data Mining Workshops (ICDMW), Barcelona, Spain,
2016, pp. 798-805.
[26] G. Holmes, A. Donkin, I. H. Witten, "Weka: A machine learning
workbench", Intelligent Information Systems 1994. Proceedings of the 1994 Second Australian and New Zealand Conference on, pp. 357-361,
1994.
11
[27] CIE-TEC. (2014). Incubadora de Empresas del Instituto Tecnológico de
Costa Rica. Retrieved March 02, 2017, from http://www.cietec.org/
[28] Fernández de la Garza, G. (1993). The Importance of University
Incubators in Latin America. European Journal Of Education, 28(1), 31
[29] Wang, H. (2014). Distinguishing the adoption of business intelligence
systems from their implementation: the role of managers’ personality profiles. Behaviour & Information Technology, 33(10), 1082-1092.
[30] Lamont, J. (2012). Big data has big implications for knowledge
management. KM World, 21(4), 8-11.
[31] Yankov, B., Haralampiev, K., Ruskov P.: Start-up Companies Predictive
Models Analysis, Vanguard Scientific Instruments in Management
‘2013 (VSIM:13), ISSN 1314-0582, pp. 275-285 (2013)
[32] Emprendimientos en el país aumentan y se diversifican. (2017). nacion.com. Recuperado a partir de
http://www.nacion.com/economia/empresarial/Emprendimientos-pais-
aumentan-diversifican_0_1606239375.html
[33] Betting on Incubators to Create Jobs. (2010). Bloomberg.com. Recuperado a partir de
https://www.bloomberg.com/news/articles/2010-08-12/betting-on-
incubators-to-create-jobs.
[34] Miettinen, M. & Littunen, H. (2013). Factors Contributing to the
Success of Start-Up Firms Using Two-Point or Multiple-Point Scale Models. Entrepreneurship Research Journal, 3(4). doi:10.1515/erj-
2012-0012
[35] Locus of Control. Changingminds.org. Recuperado a partir de
http://changingminds.org/explanations/preferences/locus_control.htm
[36] Markov, Z. (2017). Data mining algorithms: Prediction. Central
Connecticut State University. Recuperado a partir de http://www.cs.ccsu.edu/~markov/ccsu_courses/DataMining-8.html
12
Rigoberto Álvarez Escobar es ingeniero en Sistemas
Informáticos de la Universidad Latina de Costa Rica. Ha
laborado en la industria del desarrollo de software alrededor de
13 años, desempeñándose en el ámbito público y privado, en
instituciones como el Poder Judicial de Costa Rica, PRIDES
S.A, GPS Satélite, Excel SoftSources y Blue Calypso of Latin
America, principalmente en análisis y desarrollo de software,
así como líder técnico. Ha estado involucrado en proyectos
informáticos del área de banca y finanzas, geolocalización,
entretenimiento, administrativa, entre otros. Posee varias
certificaciones de Microsoft en el área de desarrollo web.
José Arias Quirós es Ingeniero en Sistemas de la
Universidad de Costa Rica. Con más de 5 años de experiencia
trabajando en proyectos de tecnologías de información como
analista y programador en diferentes industrias como la
bancaria y la enterprise, se desempeña como consultor de
búsquedas de contenido en el sector enterprise en la compañía
Search Technologies. Actualmente, está cursando una Maestría
en Tecnologías de Información y formándose en diferentes
áreas como Scrum Master y Administrador de Proyectos.
Julio Córdoba Retana es profesor universitario desde el año
2001. Ingeniero en Computación con énfasis en Sistemas de
Información, graduado del TEC; máster en Ingeniería del
Software de la Universidad Politécnica de Madrid; y candidato
a doctor en Aplicaciones de la Informática (Diploma de
Estudios Avanzados) por la Universidad de Alicante. Ha sido
profesor en prestigiosas universidades nacionales (UCR, TEC,
ULACIT, Cenfotec) e internacionales (Ecuador, Bogotá); y
cuenta con amplia experiencia laboral como analista
programador y consultor internacional en TIC. Lidera la
implementación de Software Quality Assurance e IT Service
Management en BAC-CREDOMATIC a nivel regional.
Actualmente, es el decano del Centro de Innovación y
Transferencia Tecnológica de ULACIT.