
Beca Desarrollo de Soluciones basadas en Retrieval-Augmented Generation (RAG)
La Fundación IFEMA MADRID LAB, desde su creación en el año 2018, lleva a cabo una labor sistemática de I+D+i, centrada en la identificación y el estudio de nuevas tecnologías, en su adaptación a las necesidades sectoriales y en aprovechar el potencial y las oportunidades que ofrecen, entre ellas, las soluciones innovadoras basadas en inteligencia artificial que transforman la forma en que las organizaciones acceden y utilizan sus datos y conocimiento.
En la actualidad, queremos sumar al equipo a una persona en prácticas que tenga ganas de aprender y aportar en el desarrollo de sistemas basados en Retrieval-Augmented Generation (RAG), donde tendrá la oportunidad de participar en el análisis, desarrollo e implementación de nuevas funcionalidades y soluciones en proyectos y prototipos relacionados con este ámbito.
Funciones:
-
Aprenderás a diseñar e implementar sistemas RAG, combinando recuperación de información (vector search, BM25, etc.) con modelos generativos como LLMs (GPT, LLaMA, Mistral...), en prototipos y proyectos con aplicación real.
-
Investigación y desarrollo de nuevas tecnologías y funcionalidades de sistemas RAG que sean susceptibles de convertirse en productos.
-
Colaborarás en el desarrollo de pipelines de datos, procesamiento de texto y generación de embeddings.
-
Apoyarás en pruebas, validación y mejora de sistemas de NLP (Natural Language Processing).
-
Participarás en reuniones técnicas y procesos de Brainstorming, así como también recibiras acompañamiento y formación por parte de nuestro equipo especializado en IA.
Requisitos:
-
Estudiante de últimos cursos de Ingeniería Informática, Matemáticas, Física, Telecomunicaciones o similares.
-
Conocimientos intermedios/avanzados de Python.
-
Interés y conocimiento en el ámbito de la inteligencia artificial y procesamiento del lenguaje natural (NLP).
-
Ganas de aprender sobre tecnologías como LangChain, FAISS, modelos de lenguaje (LLMs), embeddings, etc.
-
Capacidad de trabajo en equipo, curiosidad, proactividad, comunicación y feedback.
-
Capacidad de realizar código estructurado y limpio, con la documentación correspondiente.
-
Conocimientos de patrones de diseño.
-
Capacidad de plantear la arquitectura de un proyecto.
-
Uso de repositorios de control de versiones Git
Valorable:
-
Experiencia práctica con RAG o arquitecturas similares (Langchain, Haystack, LlamaIndex, etc.)
-
Experiencia en Python usando frameworks como PyTorch, Transformers o similar y librerías como Pandas o similar.
-
Familiaridad con motores de búsqueda vectorial (FAISS, Weaviate, Qdrant, Elasticsearch, etc.).
-
Conocimientos en bases de datos SQL y NoSQL (MongoDB o similares).
-
Experiencia con embedding models, tuning y análisis de resultados.
-
Conocimientos de evaluación de sistemas de NLP.
-
Experiencia en producción (Docker, Kubernetes, APIs REST/FastAPI)
Beneficios:
-
2 días de teletrabajo a la semana.
-
Comedor subvencionado.
-
Parking gratuito para empleados.
-
Horario de entrada flexible.
-
Entorno joven y dinámico, donde se valora la creatividad y la innovación.
-
Acceso a formación continua en las últimas tecnologías y metodologías.
-
Asistencia a conferencias y eventos tecnológicos para estar al día con las tendencias del sector.