En el ecosistema LegalTech, la carrera por construir el “copiloto jurídico definitivo” se está acelerando. Plataformas que prometen redactar escritos, resumir jurisprudencia y responder consultas legales en segundos necesitan lo mismo para funcionar: datos, muchos datos. Y ahí es donde el caso Fastcase vs Alexi se convierte en una advertencia muy clara para cualquier empresa que esté entrenando modelos de IA con bases de datos de terceros.
En este artículo analizamos qué está pasando en esta disputa, qué hay detrás desde el punto de vista de licencias de datos, secretos comerciales y marcas, y qué deberían estar revisando desde ya founders, directivos e in-house counsel que trabajan con IA generativa.
1. ¿Qué está pasando en el caso Fastcase vs Alexi?
Fastcase es una conocida compañía de investigación jurídica que, tras fusionarse con vLex y ser posteriormente adquirida por Clio, forma parte de uno de los ecosistemas LegalTech más grandes del mundo.
Alexi es otra empresa LegalTech que ofrece una plataforma basada en inteligencia artificial para ayudar a abogados a obtener respuestas y análisis jurídicos automatizados. Durante años, ambas empresas tuvieron una relación comercial: Alexi contaba con una licencia de acceso a la biblioteca online de Fastcase.
Según la demanda presentada en Washington D.C., Fastcase acusa a Alexi de haber ido mucho más allá de esa licencia:
- Entrenar sus modelos de IA con datos de la biblioteca de Fastcase.
- Mostrar jurisprudencia y contenidos procedentes de Fastcase dentro de su propia plataforma.
- Usar marcas y elementos distintivos de Fastcase de forma que, presuntamente, creaban la impresión de una afiliación o colaboración continua.
Para Fastcase, esto no es solo un desacuerdo comercial: es una cuestión de incumplimiento contractual, apropiación de secretos comerciales y uso indebido de marca. La demanda solicita, entre otras medidas, una indemnización económica, la prohibición de seguir usando sus datos y la destrucción de datasets y modelos entrenados con esa información.
Alexi, por su parte, niega las acusaciones y sostiene que ha actuado dentro del alcance de la licencia, calificando la demanda como un intento de Clio de reescribir el acuerdo una vez que percibe a Alexi como competidor directo.
2. Qué hay en juego: licencias, secretos y marcas en la IA legal
Aunque se trata de un conflicto entre dos players del mundo LegalTech, los temas de fondo afectan a cualquier empresa que use datos de terceros para entrenar IA.
2.1 Licencias de datos y límites al entrenamiento de modelos
La licencia que vinculaba a Fastcase y Alexi, según Reuters, prohibía publicar o distribuir partes de la base de datos de Fastcase. El corazón del conflicto es si entrenar un modelo de IA con esos datos y luego mostrar resultados basados en ellos entra dentro de esa prohibición.
Aquí se cruzan varias preguntas clave:
- ¿El entrenamiento de modelos se considera una forma de “reproducción” o “uso” relevante a efectos contractuales y de copyright?
- ¿La salida generada por la IA es “contenido nuevo” o una reutilización de la base de datos original?
- ¿Qué pasa si el modelo memoriza o reproduce fragmentos sustanciales de la información licenciada?
Otros casos recientes, como Advance Local Media v. Cohere, ya muestran que los tribunales empiezan a aceptar que incluso los “resúmenes” generados por IA pueden infringir derechos de autor si reproducen expresión protegida, no solo los hechos.
2.2 Secretos comerciales en bases de datos jurídicas
Fastcase también alega que Alexi habría aprovechado elementos protegidos como secretos comerciales, por ejemplo:
- La forma de organizar, clasificar y enriquecer la información jurídica.
- Taxonomías propias o anotaciones que aportan valor añadido frente a fuentes públicas.
Para muchas empresas, la ventaja competitiva no está solo en los datos en bruto, sino en cómo se curan, etiquetan y estructuran. Si esos elementos se usan para entrenar un modelo ajeno, la discusión ya no es solo de copyright, sino también de protección de know-how y trade secrets.
2.3 Uso de marcas y apariencia de afiliación
El tercer frente es marcario: Fastcase afirma que Alexi habría usado sus marcas y señales de origen dentro de la interfaz, generando la impresión de que existía una alianza o que el contenido seguía siendo servido por Fastcase bajo su control.
En un entorno donde proliferan los copilotos jurídicos y asistentes automatizados, la claridad sobre quién responde por el contenido es fundamental. El uso descuidado de marcas puede derivar en:
- Reclamaciones por infracción de marca.
- Acusaciones de competencia desleal o publicidad engañosa.
- Daños reputacionales si el contenido generado por la IA es incorrecto, desactualizado o sesgado.
3. Riesgos clave para founders y equipos legales
Más allá de quién tenga razón en este litigio concreto, el caso ofrece varias lecciones para founders, directivos e in-house counsel que quieran dormir tranquilos con sus proyectos de IA generativa.
- Tu proveedor de datos de hoy puede ser tu competidor mañana.
La línea entre “cliente”, “proveedor” y “competidor” se difumina cuando todos están construyendo modelos propios. Eso hace que las cláusulas de licencia y uso de datos sean estratégicas, no un simple anexo técnico. - Los modelos y sus pesos pueden convertirse en el activo y el problema.
Si un tribunal concluye que un modelo está contaminado por datos usados fuera de licencia, no solo peligra el dataset, también los pesos del modelo, su capacidad de explotar comercialmente el sistema e incluso futuras rondas de inversión. - El riesgo no es solo de copyright.
Los litigios actuales muestran un cóctel de teorías jurídicas: contrato, copyright, secretos comerciales, marca, competencia desleal, protección de datos… Una demanda bien planteada puede atacar al negocio desde varios ángulos a la vez. - Europa va en serio con la transparencia y los derechos de autor.
Sentencias como GEMA vs OpenAI en Múnich y los trabajos de la UE en torno al Código de Buenas Prácticas y resúmenes detallados de datos de entrenamiento apuntan a un futuro en el que ser opaco con los datasets salga muy caro.
4. Checklist práctico para entrenar IA con datos de terceros
Si tu empresa está construyendo un asistente legal, una herramienta de análisis de contratos o cualquier producto de IA entrenado con datos de terceros, este es el momento de revisar tu estrategia.
4.1 Preguntas que debe responder tu contrato de licencia
Al negociar licencias de bases de datos, contenidos o datasets, asegúrate de que el contrato responde claramente, al menos, a estas cuestiones:
- ¿Se permite explícitamente el entrenamiento de modelos de IA?
- No basta con que el contrato guarde silencio. Idealmente debe indicar de forma expresa:
- Si el entrenamiento está permitido o prohibido.
- Bajo qué condiciones (finalidades, ámbito territorial, duración).
- No basta con que el contrato guarde silencio. Idealmente debe indicar de forma expresa:
- ¿Qué se puede hacer con las salidas del modelo?
- ¿Se autoriza mostrar fragmentos de la base de datos original al usuario?
- ¿Se limita el porcentaje o extensión de texto que puede aparecer en los outputs?
- ¿Quién es el titular de los modelos y pesos entrenados?
- ¿La parte que aporta los datos tiene algún derecho sobre el modelo resultante?
- ¿Se permite reutilizar ese modelo para otros clientes o productos?
- ¿Cómo se protege el know-how y los secretos comerciales?
- ¿Qué se considera secreto comercial dentro de la base de datos?
- ¿Hay obligaciones de seguridad, control de accesos y auditoría técnica?
- ¿Qué ocurre si termina la relación?
- ¿Debe borrarse el dataset?
- ¿Debe “desentrenarse” el modelo o bastan compromisos de no uso futuro?
- ¿Se prevén cláusulas específicas sobre destrucción de copias, logs y backups?
4.2 Buenas prácticas técnicas y de compliance
Además de los contratos, hay medidas técnicas que reducen el riesgo:
- Limitar la exposición directa de contenido protegido.
Evitar que la IA reproduzca decisiones o artículos “tal cual”, salvo que exista licencia para redistribución. - Implementar guardrails para minimizar memorias literales.
Ajustar parámetros y técnicas de entrenamiento para reducir la memorización y reproducir menos frases exactas de la fuente. - Trazabilidad de datasets.
Mantener un inventario claro de qué fuentes se usan, con qué licencias y para qué modelos. Esto es clave si, en un futuro, se exige acreditar el origen de los datos ante tribunales o reguladores. - Revisión periódica con el equipo legal.
A medida que el producto evoluciona, también debería hacerlo el análisis jurídico. No es lo mismo usar datos solo para entrenar un prototipo interno que para lanzar una plataforma global de IA jurídica.
5. Cómo puede ayudarte BRANDLEX
En Brandlex acompañamos a startups, scaleups y empresas consolidadas que están construyendo productos de IA generativa y LegalTech desde España y Chile hacia el mundo. Nos encontramos a diario con los mismos dilemas que plantea el caso Fastcase vs Alexi:
- ¿Puedo entrenar mi modelo con esta base de datos?
- ¿Qué pasa si mañana el proveedor cambia de estrategia y decide competir conmigo?
- ¿Hasta dónde debo transparentar mis datasets conforme al AI Act y a las normas de copyright europeas?
Desde BRANDLEX podemos ayudar a:
- Diseñar y negociar licencias de datos compatibles con IA generativa.
- Identificar y proteger activos intangibles clave (bases de datos, taxonomías, modelos, marcas).
- Revisar tu estrategia de PI, datos y contratos para que tu copiloto jurídico, tu plataforma de análisis o tu marketplace de contenidos no se construyan sobre una bomba de tiempo legal.
Si estás desarrollando o usando IA en tu negocio y quieres asegurarte de que tu licencia de datos para IA generativa es sólida, es un buen momento para revisar tus contratos, políticas y arquitectura técnica con un equipo que vive entre PI, tecnología y regulación de IA.
👉 ¿Te gustaría revisar tu estrategia de datos e IA?
Puedes contactarnos para explorar cómo blindar tu producto desde España y Chile hacia los mercados de Europa, Latam y Asia.
En BRANDLEX podemos ayudarte a alinear innovación, copyright y cumplimiento regulatorio.
👉 Escríbenos a info@brand-lex.com o visita nuestro sitio para conocer cómo podemos trabajar juntos.
Disclaimer
Este artículo tiene carácter estrictamente informativo y no constituye asesoría legal. Cada proyecto de IA y cada contrato de licencia de datos debe analizarse caso a caso. Para obtener asesoría jurídica específica, te recomendamos contactar directamente con el equipo de BRANDLEX u otro profesional especializado en propiedad intelectual, datos e inteligencia artificial.