Remote
Descripcion del puesto
Rejoignez tether, une start‑up technologique basée à Lugano (CH) qui révolutionne le paysage de l’intelligence artificielle grâce à des modèles de grande envergure et à des solutions multi‑modales. En tant qu’Ingénieur Recherche IA spécialisé dans le pré‑entraînement, vous intégrerez l’équipe « Modèles IA », un groupe international de chercheurs, data scientists et ingénieurs qui conçoivent, entraînent et déploient les prochains modèles de langage et de vision.
**Vos missions principales**
- Concevoir et implémenter des architectures de modèles innovantes (LLM, vision‑langage, audio‑texte) capables de s’adapter à des tailles de paramètres très variées, de quelques millions à plusieurs dizaines de milliards.
- Piloter le pipeline complet de pré‑entraînement : collecte, nettoyage et curation de jeux de données massifs, création de stratégies de filtrage et d’augmentation, mise en place de méthodes de renforcement des bases de référence (retrieval‑augmented generation).
- Optimiser l’utilisation de clusters GPU NVIDIA (A100, H100) en développant des algorithmes de parallélisme (pipeline, tensor‑parallel, ZeRO) et en résolvant les goulets d’étranglement liés à la bande passante, à la synchronisation et à la gestion de la mémoire.
- Mettre en place des métriques de performance et d’efficacité (throughput, coût‑par‑token, énergie) et proposer des améliorations continues pour réduire le coût d’entraînement tout en augmentant la qualité des modèles.
- Collaborer étroitement avec les équipes produit, recherche fondamentale et infrastructure pour aligner les objectifs de recherche avec les exigences de mise en production et de scalabilité.
- Rédiger des rapports techniques, publier des articles scientifiques et présenter les résultats lors de conférences ou de réunions internes.
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche appliquée ou en ingénierie IA, avec un historique de projets de pré‑entraînement de modèles de langage ou de systèmes multi‑modaux.
- Maîtrise avancée de Python et des frameworks Deep Learning (PyTorch, TensorFlow) ainsi que des bibliothèques de parallélisme (DeepSpeed, Megatron‑LM, FairScale).
- Solide expérience en systèmes distribués, programmation CUDA, optimisation GPU et gestion de clusters à grande échelle.
- Connaissances approfondies en NLP, vision‑langage, retrieval‑augmented generation, et techniques de data curation.
- Capacité à travailler en anglais (écrit et oral) dans un environnement international et à communiquer clairement des concepts complexes.
- Esprit d’innovation, autonomie, rigueur scientifique et goût du travail en équipe à distance.
**Ce que nous offrons**
- CDI en télétravail total, avec la liberté de travailler depuis n’importe quel pays tout en restant connecté à notre hub de Lugano.
- Accès à une infrastructure de pointe : clusters de plusieurs milliers de GPU NVIDIA, stockage haute‑performance et outils de monitoring avancés.
- Budget dédié à la formation continue (conférences, cours en ligne, certifications) et à la publication scientifique.
- Environnement de travail stimulant, culture d’entreprise ouverte, réunions hebdomadaires d’équipe en visioconférence et hackathons internes.
- Package salarial compétitif, bonus basé sur les performances de recherche et participation au capital de l’entreprise.
- Politique de congés généreuse, assurance santé internationale et programme de bien‑être.
Si vous êtes passionné(e) par les défis du pré‑entraînement à grande échelle et que vous souhaitez contribuer à façonner l’avenir de l’IA, postulez dès maintenant et rejoignez une équipe qui repousse les limites du possible.