📃 Marco de Trabajo del VC para Evaluar la Pila Tecnológica de una Startup de IA
🎪 Además: Marco de toma de decisiones de Coinbase y dos leyes de la física de las empresas emergentes: «El capital compone fórmulas tanto positivas como negativas».
📬 HALLAZGOS DE VENTURE CURATORS
Mis hallazgos favoritos de la semana:
AI agent hype por CB Insights.
Ser humano en la era de las máquinas inteligentes: el físico y novelista Alan Lightman sobre la conciencia, la maravilla y las emociones.
¿Qué significan los aranceles para las startups?
Guía para fundadores: consejos de ventas esenciales para startups.
Base de datos verificada de más de 2700 inversores ángeles estadounidenses y empresas de capital riesgo (correo electrónico + enlace de LinkedIn).
¿Estás creando una empresa de tecnología profunda? La mayoría de los consejos para startups no son aplicables; lee esto en su lugar.
Plantilla de Excel: Modelo financiero de startups en fase inicial para la recaudación de fondos.
El mínimo efectivo de tecnología de ventas: 5 piezas de tecnología de ventas que necesitas.
La guía definitiva de la estructura de precios de SaaS (con puntos de referencia)
La financiación de capital riesgo de la tecnología espacial se desplaza hacia modelos escalables y listos para generar ingresos.
Paquete de documentos legales para startups: documentos legales esenciales para fundadores.
Naval Ravikant: «La inspiración es perecedera: actúa mientras la chispa está fresca».
Marco de Trabajo del Capital Riesgo para Evaluar la Pila Tecnológica de una Empresa Emergente de IA
Por: Sahil S
Desde la detección de fraudes hasta la supervisión de cultivos agrícolas, ha surgido una nueva ola de empresas tecnológicas emergentes, todas ellas armadas con la convicción de que su uso de la IA abordará los desafíos que presenta el mundo moderno.
Sin embargo, a medida que el panorama de la IA madura, sale a la luz una preocupación creciente: el corazón de muchas empresas de IA, sus modelos, se están convirtiendo rápidamente en productos básicos. La notable falta de diferenciación sustancial entre estos modelos está empezando a plantear dudas sobre la sostenibilidad de su ventaja competitiva.
En cambio, aunque los modelos de IA siguen siendo componentes fundamentales de estas empresas, se está produciendo un cambio de paradigma. La verdadera propuesta de valor de las empresas de IA no reside solo en los modelos, sino también, y sobre todo, en los conjuntos de datos subyacentes. La calidad, amplitud y profundidad de estos conjuntos de datos es lo que permite a los modelos eclipsar a sus competidores.
Muchos fundadores quieren entender el marco que utilizan los capitalistas de riesgo para evaluar la pila tecnológica de las empresas emergentes de IA. Voy a compartir un marco que un socio general compartió conmigo.
Desde conjuntos de datos inconsistentes hasta entradas ruidosas, ¿qué podría salir mal?
Antes de entrar en los marcos, evaluemos primero los factores básicos que entran en juego a la hora de evaluar la calidad de los datos. Y, lo que es más importante, ¿qué podría salir mal si los datos no están a la altura?
Relevancia
En primer lugar, consideremos la relevancia de los conjuntos de datos. Los datos deben estar intrínsecamente alineados con el problema que un modelo de IA está tratando de resolver. Por ejemplo, un modelo de IA desarrollado para predecir los precios de la vivienda necesita datos que abarquen indicadores económicos, tipos de interés, ingresos reales y cambios demográficos.
Del mismo modo, en el contexto del descubrimiento de fármacos, los datos experimentales deben mostrar la mayor capacidad predictiva posible de los efectos en los pacientes, lo que requiere el pensamiento de expertos sobre los ensayos, las líneas celulares y los organismos modelo más relevantes, entre otros.
Precisión
En segundo lugar, los datos deben ser precisos. Incluso una pequeña cantidad de datos inexactos puede tener un impacto significativo en el rendimiento de un modelo de IA. Esto es especialmente importante en los diagnósticos médicos, donde un pequeño error en los datos podría conducir a un diagnóstico erróneo y afectar potencialmente a vidas.
Cobertura
En tercer lugar, la cobertura de los datos también es esencial. Si a los datos les falta información importante, el modelo de IA no podrá aprender con la misma eficacia. Por ejemplo, si se utiliza un modelo de IA para traducir un idioma concreto, los datos deben incluir una variedad de dialectos diferentes.
En el caso de los modelos lingüísticos, esto se denomina conjunto de datos lingüísticos de «bajos recursos» frente a «altos recursos». Esto también requiere tener una comprensión completa de los factores de confusión que afectan al resultado, lo que normalmente requiere la recopilación de metadatos.
Sesgo
Por último, el sesgo de los datos también merece una consideración rigurosa. Los datos deben capturarse de forma imparcial para evitar prejuicios humanos o sesgos en el modelo. Por ejemplo, los datos de reconocimiento de imágenes deben minimizar los estereotipos. En el descubrimiento de fármacos, los conjuntos de datos deben abarcar tanto moléculas exitosas como no exitosas para evitar resultados sesgados. En ambos casos, los datos se considerarían sesgados y probablemente perderían su capacidad para hacer predicciones novedosas.
No deben subestimarse las repercusiones de los datos de calidad inferior. En el mejor de los casos, dan lugar a un modelo que rinde por debajo de lo esperado y, en el peor, hacen que el modelo sea totalmente ineficaz. Esto puede provocar pérdidas económicas, oportunidades perdidas e incluso daños físicos.
Del mismo modo, si los datos están sesgados, los modelos producirán resultados sesgados, lo que puede fomentar la discriminación y las prácticas injustas. Esto ha sido una preocupación particular con los grandes modelos de lenguaje, que han sido objeto de un reciente escrutinio por perpetuar estereotipos.
La calidad de los datos comprometidos también puede erosionar la toma de decisiones efectiva, lo que en última instancia puede resultar en un bajo rendimiento empresarial.
Marco 1: Pirámide de la pila tecnológica para la generación de datos
Para evitar invertir en empresas emergentes de IA ineficaces, es necesario evaluar primero los procesos que hay detrás de los datos. Imaginar la pila tecnológica de una empresa como una pirámide es un buen punto de partida, donde los niveles fundamentales tienden a tener el mayor impacto en el resultado predictivo. Sin esta base sólida, incluso los mejores modelos de análisis de datos y aprendizaje automático se enfrentan a limitaciones significativas.
Crédito: Google Images
Estas son algunas preguntas básicas que un capitalista de riesgo podría hacer inicialmente para averiguar si el proceso de generación de datos de una empresa emergente puede crear resultados utilizables para la IA:
¿Está automatizada la captura de datos para permitir la ampliación?
¿Se almacenan los datos en entornos de nube seguros con copias de seguridad automatizadas?
¿Cómo se gestiona y garantiza el acceso a la infraestructura y a los recursos informáticos pertinentes?
¿Están los procesos de procesamiento de datos totalmente automatizados, con rigurosos controles de calidad de datos implementados para limitar la contaminación de puntos de datos contaminados?
¿Son los datos fácilmente accesibles en toda la empresa para potenciar la creación de modelos de aprendizaje automático y las decisiones basadas en datos?
¿Cómo se implementa la gobernanza de datos?
¿Existe una estrategia de gestión de datos?
¿Se realiza un seguimiento de las versiones de los datos y los modelos de aprendizaje automático y se puede acceder a ellos, garantizando que los modelos de aprendizaje automático siempre funcionan con la última versión de los datos?
Recibir respuestas sólidas a estas preguntas puede ayudar a determinar la comprensión de una empresa de los principios subyacentes de sus canales de datos. Esta comprensión, a su vez, ayudará a medir la calidad de los resultados del modelo.
Marco 2: Las cinco V de la calidad de los datos
Una vez que se ha considerado que la pila tecnológica de una empresa es adecuada para la IA, también es necesario considerar cuidadosamente la calidad de los datos resultantes que se utilizan para entrenar sus modelos. Un marco común utilizado para capturar la clasificación de la calidad de los datos son las cinco V de la calidad de los datos. Representan cinco dimensiones clave de la calidad de los datos que los capitalistas de riesgo deben considerar al evaluar las empresas emergentes de IA:
Veracidad: los datos deben ser precisos y veraces.
Variedad: los datos deben ser diversos y representativos del mundo real.
Volumen: los datos deben ser lo suficientemente grandes como para entrenar el modelo de IA de manera efectiva.
Velocidad: los datos deben actualizarse con frecuencia para reflejar los cambios en el mundo.
Valor: los datos deben ser útiles para que el modelo de IA aprenda de ellos.
Aquí hay algunas preguntas introductorias para ayudar a evaluar los datos de una empresa en cuanto a las cinco V:
¿Tiene la empresa emergente una buena hipótesis sobre qué datos necesitan crear para construir una capacidad diferenciada o un modelo útil?
¿Qué datos recopilan?
¿También recopilan metadatos relevantes?
¿Cómo garantizan la exactitud y coherencia de los datos que recopilan?
¿Cómo planea la empresa emergente hacer frente al sesgo de los datos?
¿Recopilan múltiples ejemplos para la misma pregunta o experimento?
¿Qué utilidad tienen estos datos para el producto que están creando?
¿Cuál es la razón de ser de la recopilación de estos datos?
¿Tienen pruebas de que sus predicciones mejoran al recopilar y utilizar estos datos? En caso afirmativo, ¿cómo se correlaciona la cantidad de datos con la mejora de la predicción?
¿Qué tan fácil es para un competidor recopilar los mismos datos? ¿Cuánto tiempo les tomaría y cuánto les costaría hacerlo?
Específicamente para una empresa de biotecnología, ¿qué tan bien se correlaciona el indicador que están prediciendo con un criterio de valoración clínicamente relevante? ¿Hay evidencia de esto?
¿Cuál es el plan de la empresa emergente para garantizar la calidad de sus datos a lo largo del tiempo?
¿Cómo planea la empresa emergente proteger sus datos del acceso no autorizado?
¿Cómo planea la startup cumplir con las regulaciones de privacidad de datos?
Al considerar cuidadosamente las cinco V de la calidad de los datos, los VC pueden asegurarse de que están invirtiendo en startups de IA que tienen los datos que necesitan para tener éxito. Si la startup puede responder a las preguntas anteriores de manera convincente y sus datos obtienen una puntuación alta en las cinco dimensiones, es una buena señal de que se toman en serio la calidad de los datos y están debidamente equipados para aplicar sus modelos de IA.
Por último, los capitalistas de riesgo deben evaluar el compromiso de la empresa emergente con la seguridad de los datos. Esto incluye aspectos como sus políticas de gestión de datos, sus procedimientos de garantía de calidad de los datos y sus planes de respuesta a las violaciones de datos.
Interroga el bombo publicitario para encontrar a los ganadores
En medio del estruendoso revuelo que ha rodeado a la IA en los últimos meses, el atractivo de las inversiones sustanciales ha atraído a fundadores de startups dispuestos a exagerar su infraestructura e inflar sus capacidades en la búsqueda de capital.
Los capitalistas de riesgo de éxito están haciendo las preguntas adecuadas para interrogar a fondo a estas empresas y filtrar a los posibles ganadores construidos sobre una base sólida de aquellos con una cáscara hueca que están destinados a fracasar.
También puede interesar:
📃 Negociar la Ronda de Financiación de Capital Riesgo: ¿Qué Esperar y Cómo Responder?
Negociar la Ronda de Financiación de Capital Riesgo: ¿Qué Esperar y Cómo Responder?
📃 RESÚMENES RÁPIDOS
1. Marco de toma de decisiones de Coinbase.
Las decisiones de bajo riesgo deben tomarse con bastante rapidez. Para las decisiones de alto riesgo, un marco de toma de decisiones puede ser útil.
He visto muchos marcos de toma de decisiones. Pero me gusta este de Brian Armstrong, el fundador de Coinbase, porque funciona tanto para reuniones rápidas de 15 minutos en vivo como para decisiones estratégicas de varias semanas.
Este marco puede utilizarse para decidir:
Si contratar a un candidato
Qué priorizar a continuación en una hoja de ruta de producto
Si comprar o vender una empresa
Un nuevo nombre para un producto o equipo
Y más...
Aquí está la plantilla para implementar este marco y aquí está cómo usarla.
Puede que pienses que esta plantilla parece demasiado simplista, pero lo que me gusta de ella es que solo pretende registrar el contexto en torno a la decisión y proporcionar un marco de votación claro.
Obliga a que el proceso real de toma de decisiones se lleve a cabo a través de una conversación en vivo. Y, sea cual sea el resultado, obtendrás una puntuación numérica clara para la opción que prefieras colectivamente.
2. Las dos leyes de la física de las startups Por Eric Paley
Con 15 años de experiencia como inversor de capital riesgo, Eric Paley, socio de Founder Collective, ha identificado dos «leyes de la física de las startups» fundamentales e inviolables que todos los fundadores deben interiorizar para crear una empresa exitosa y sostenible.
El capital combina fórmulas tanto positivas como negativas. Todas las fórmulas positivas se combinan con tasas de rendimiento decrecientes.
El capital combina fórmulas positivas y negativas
Nos gusta decir que «el capital no tiene ideas». No tiene las respuestas a tus problemas y solo puede financiar dos cosas para una startup:
A) Experimentación, que rara vez es cara.
B) Escala, que compone lo que ya está sucediendo en la startup, ya sea componiendo hacia un mayor valor intrínseco o componiendo el valor de la startup a cero.
El capital puede aumentar rápidamente el valor intrínseco si tienes un motor que te permite convertir 1 $ en 5 $ de valor. Si tiene un motor que convierte 5 $ en 1 $ (o incluso 1 $ en 0,99 $), el capital acabará por componer la fórmula de valor negativo a cero.
Todos los sistemas positivos se componen a tasas de rendimiento decrecientes
Tarde o temprano, el rendimiento de cada dólar invertido pasará a ser negativo. Si no eres consciente del punto en el que la capitalización entra en números rojos, empiezas a capitalizar un valor negativo.
Paradójicamente, el deseo de crecimiento a menudo lleva prematuramente a las empresas emergentes a una capitalización negativa, lo que en última instancia conduce al fracaso.
En mi experiencia, las empresas emergentes que internalizan estas reglas han tenido un éxito increíble.
El incumplimiento de las reglas de la física de las startups (el capital se acumula de forma positiva y negativa, y toda acumulación positiva acaba disminuyendo) ha sido la causa de casi todos los fracasos de startups que he visto y que, de manera simplista, no pueden descartarse como «nadie quería el producto».
Otras cosas a tener en cuenta de este tuit
Las startups deben experimentar con pequeñas cantidades de capital hasta que encuentren una fórmula que genere un valor intrínseco positivo por cada dólar invertido, antes de intentar escalar.
Muchas empresas emergentes se saltan esta fase crucial de experimentación e intentan escalar prematuramente, lo que conduce a pérdidas compuestas con el tiempo.
A medida que las empresas emergentes intentan crecer, varias palancas como añadir funciones, perseguir clientes de baja calidad y escalar las ventas/marketing se ven sometidas a tasas de rendimiento decrecientes.
Los capitalistas de riesgo suelen dar prioridad al crecimiento a corto plazo frente a la creación de valor intrínseco a largo plazo, lo que incentiva a las empresas emergentes a gastar mal en métricas de vanidad.
Los fundadores deben resistir esta presión y centrarse en experimentos de bajo coste hasta que descubran cómo crear fórmulas de valor positivo que justifiquen un aumento del gasto.
La disciplina es fundamental: cuando algo deja de funcionar, las empresas emergentes deben dejar de ampliar inmediatamente esa área.
Los enfoques exitosos incluyen no saltarse la etapa de experimentación, mantener los experimentos pequeños, realizar solo unos pocos a la vez y hacer mejores preguntas sobre el retorno de la inversión frente al crecimiento.
3. Jerarquía de compromiso Por Sarah Tavel.
Sarah Tavel, socia general de Benchmark, desarrolló una forma de entender la participación de los usuarios llamada Jerarquía de participación.
Nivel 1: Desarrolla una «acción principal» que quieras que los usuarios realicen. La mayoría de las veces, la acción principal es la acción más relacionada con la retención. Facebook fue hacer crecer tu lista de amigos.
Nivel 2: Habilitar efectos de red. Asegúrate de que cuanta más gente haya, más valor tendrá la red. Usando nuestro ejemplo de FB, cuantos más amigos tengas en FB, más difícil será irse.
Nivel 3: Volantes de inercia y más volantes de inercia. Una vez que hayas captado a los usuarios, asegúrate de que el tiempo que estén captados cree más captación de otros usuarios: crea un fallo de captación infinito en la matriz. Para Facebook, tener más amigos en la plataforma significaba que invitarías a más amigos a unirse a la plataforma. (Enlace)
4. El método CUP: un marco de priorización de la idea al PMF.
El método CUP es un marco de priorización que te ayuda a pasar de la idea al encaje del producto en el mercado. Es más útil en la etapa 0 a 1, antes de considerar algo como «tareas por hacer».
El método CUP está diseñado para:
Ayudar a los emprendedores a abordar las dificultades de los usuarios, no a crear funciones vanidosas.
Ayudar a los emprendedores a crear una solución única, no a crear otra imitación.
Ayudar a los emprendedores a establecer y alcanzar objetivos a corto plazo para lograr su visión final, no a perderse soñando con lo que sucederá dentro de 3, 5 o 10 años.
Se divide en tres pasos:
Objetivo principal a corto plazo → Establece un único objetivo que puedas alcanzar a corto plazo (piensa en unas pocas semanas o meses).
Propuesta de valor única → ¿Qué te diferencia de todas las alternativas?
Puntos débiles → ¿Qué problemas importantes experimentan tus usuarios?
Un marco de trabajo de lectura obligada para los fundadores.
TUIT DE LA SEMANA
Mejor tuit que he visto esta semana
«Si alguien del equipo afirma que toda la aplicación necesita pulirse y ser más ágil, yo lo rechazaría, a menos que estés entrando en un mercado muy competitivo con sustitutos existentes.
Incluso entonces, probablemente haya áreas de incertidumbre que deban eliminarse primero y que no requieran la construcción de un Porsche como V1». - Nikita Bier.
Nota: Agradecemos a Sahil S su colaboración en este artículo, que es una adaptación del suyo en inglés: