El año pasado, Salesforce, la empresa más conocida por su software de soporte de ventas en la nube (y Slack), encabezó un proyecto llamado ProGen para diseñar proteínas utilizando IA generativa. ProGen, un proyecto de investigación a la luna, podría, si se lanza al mercado, ayudar a descubrir tratamientos médicos de manera más rentable que los métodos tradicionales, afirmaron los investigadores detrás de él en una publicación de blog de enero de 2023.
ProGen culminó con una investigación publicada en la revista Nature Biotech que muestra que la IA podría crear con éxito estructuras 3D de proteínas artificiales. Pero, más allá del documento, el proyecto no significó mucho en Salesforce ni en ningún otro lugar, al menos no en el sentido comercial.
Es decir, hasta hace poco.
Uno de los investigadores responsables de ProGen, Ali Madani, ha lanzado una empresa, Profluent, que espera que saque tecnología similar de generación de proteínas del laboratorio a manos de las empresas farmacéuticas. En una entrevista con TechCrunch, Madani describe la misión de Profluent como “revertir el paradigma de desarrollo de fármacos”, comenzando con las necesidades terapéuticas y del paciente y trabajando hacia atrás para crear una solución de tratamiento “adaptada a la medida”.
“Muchos fármacos (enzimas y anticuerpos, por ejemplo) están compuestos de proteínas”, dijo Madani. “En última instancia, esto es para pacientes que recibirían una proteína diseñada por IA como medicamento”.
Mientras estaba en la división de investigación de Salesforce, Madani se sintió atraído por los paralelismos entre el lenguaje natural (por ejemplo, el inglés) y el “lenguaje” de las proteínas. Las proteínas (cadenas de aminoácidos unidos que el cuerpo utiliza para diversos fines, desde producir hormonas hasta reparar tejido óseo y muscular) pueden tratarse como palabras de un párrafo, descubrió Madani. Introducidos en un modelo de IA generativa, los datos sobre proteínas se pueden utilizar para predecir proteínas completamente nuevas con funciones novedosas.
Con Profluent, Madani y el cofundador Alexander Meeske, profesor asistente de microbiología en la Universidad de Washington, pretenden llevar el concepto un paso más allá aplicándolo a la edición de genes.
“Muchas enfermedades genéticas no pueden solucionarse [proteins or enzymes] extraído directamente de la naturaleza”, dijo Madani. “Además, los sistemas de edición de genes combinados y adaptados para nuevas capacidades sufren de compensaciones funcionales que limitan significativamente su alcance. Por el contrario, Profluent puede optimizar múltiples atributos simultáneamente para lograr un diseño personalizado. [gene] editor que se adapta perfectamente a cada paciente”.
No está fuera de lugar. Otras empresas y grupos de investigación han demostrado formas viables en las que se puede utilizar la IA generativa para predecir proteínas.
En 2022, Nvidia lanzó un modelo de IA generativa, MegaMolBART, que se entrenó en un conjunto de datos de millones de moléculas para buscar posibles objetivos farmacológicos y pronosticar reacciones químicas. Meta entrenó un modelo llamado ESM-2 en secuencias de proteínas, un enfoque que, según la compañía, le permitió predecir secuencias de más de 600 millones de proteínas en solo dos semanas. Y DeepMind, el laboratorio de investigación de inteligencia artificial de Google, tiene un sistema llamado AlphaFold que predice estructuras proteicas completas, logrando una velocidad y precisión que superan con creces los métodos algorítmicos más antiguos y menos complejos.
Profluent está entrenando modelos de IA en conjuntos de datos masivos (conjuntos de datos con más de 40 mil millones de secuencias de proteínas) para crear sistemas de producción de proteínas y edición de genes nuevos y perfeccionar los existentes. En lugar de desarrollar tratamientos por sí misma, la startup planea colaborar con socios externos para producir “medicamentos genéticos” con los caminos más prometedores hacia la aprobación.
Madani afirma que este enfoque podría reducir drásticamente la cantidad de tiempo (y capital) que normalmente se requiere para desarrollar un tratamiento. Según el grupo industrial PhRMA, se necesitan entre 10 y 15 años en promedio para desarrollar un nuevo medicamento desde el descubrimiento inicial hasta la aprobación regulatoria. Mientras tanto, estimaciones recientes cifran el coste de desarrollar un nuevo fármaco entre varios cientos de millones y 2.800 millones de dólares.
“De hecho, muchos medicamentos impactantes se descubrieron accidentalmente, en lugar de diseñarse intencionalmente”, dijo Madani. “[Profluent’s] La capacidad ofrece a la humanidad la oportunidad de pasar del descubrimiento accidental al diseño intencional de nuestras soluciones más necesarias en biología”.
Profluent, con sede en Berkeley y 20 empleados, está respaldado por grandes pesos pesados de capital de riesgo, incluidos Spark Capital (que lideró la reciente ronda de financiación de 35 millones de dólares de la empresa), Insight Partners, Air Street Capital, AIX Ventures y Convergent Ventures. El científico jefe de Google, Jeff Dean, también contribuyó, dando credibilidad adicional a la plataforma.
El enfoque de Profluent en los próximos meses será actualizar sus modelos de IA, en parte ampliando los conjuntos de datos de entrenamiento, dice Madani, y la adquisición de clientes y socios. Tendrá que moverse agresivamente; Sus rivales, incluidos EvolutionaryScale y Basecamp Research, están entrenando rápidamente sus propios modelos de generación de proteínas y recaudando grandes sumas de dinero en efectivo de capital de riesgo.
“Hemos desarrollado nuestra plataforma inicial y hemos mostrado avances científicos en la edición de genes”, dijo Madani. “Ahora es el momento de escalar y comenzar a habilitar soluciones con socios que coincidan con nuestras ambiciones para el futuro”.