CYS - Data & Application Engineer - IDG

Roma
Tempo indeterminato
Full time

2 mesi fa

Job Description:Leonardo SpA è un gruppo industriale internazionale, tra le principali realtà mondiali nell’Aerospazio, Difesa e Sicurezza che realizza capacità tecnologiche multidominio in ambito Elicotteri, Velivoli, Aerostrutture, Elettronica, Cyber Security e Spazio. Con oltre 60.000 dipendenti nel mondo, l’azienda ha una solida presenza industriale in Italia, Regno Unito, Polonia, Stati Uniti, e opera in 150 paesi anche attraverso aziende controllate, joint venture e partecipazioni.Protagonista dei principali programmi strategici a livello globale, è partner tecnologico e industriale di Governi, Amministrazioni della Difesa, Istituzioni e imprese.All’interno dell’Area Cyber & Security Solutions, stiamo ricercando un/a Data & application engineer per la nostra sede di Roma.La persona si occuperà delle seguenti attività:

Progettare e sviluppare componenti di RAG/LLM per risposte sintetiche e spiegabili su documenti interni (prompting, tool/function calling se previsto, gestione multi-turn).
Definire e implementare metodologie di valutazione (offline/online) per qualità delle risposte: groundedness (aderenza alle fonti), completezza, coerenza, gestione incertezza e copertura del retrieval.
Creare dataset di test e “golden set” di dominio (domande reali, query complesse, casi ambigui/contraddittori) e automatizzare la generazione di report di performance.
Tuning del retrieval ibrido (BM25 + semantic): scelta top-k, pesi, filtri metadati, dedup/reranking e query rewriting per sigle/gergo tecnico.
Sviluppare logiche di planning per query complesse (decomposizione in sotto-query/DAG) e criteri di stop/iterazione del ciclo retrieve→answer→critique.
Collaborare con team di piattaforma per integrazione con inference backend e garantire requisiti di latenza/streaming (SSE) e robustezza in modalità degraded.
Implementare strumenti e pipeline software (Python) per esperimenti riproducibili: tracking configurazioni, versioning prompt/modelli, ablation study, analisi errori e regressioni.

Titolo di studio: Laurea magistrale o PhD in Data Science, Informatica, Ingegneria, Matematica, Statistica o discipline affiniSeniority: Senior.Conoscenze e competenze tecniche:

Ottima programmazione in Python (design modulare, testing, packaging), uso di Git e code review.
Esperienza con NLP/LLM e architetture RAG (embeddings, chunking, retrieval, grounding, citazioni).
Capacità di costruire evaluation framework: metriche automatiche + human-in-the-loop, analisi qualitativa degli errori, definizione di soglie e criteri di accettazione.
Familiarità con vector search e sistemi di ricerca (OpenSearch/Elasticsearch o equivalenti), BM25, KNN, reranking.
Conoscenza di FastAPI/REST per integrazione servizi e debugging di flussi end-to-end.
Buone basi di statistica sperimentale (A/B test concettuale, significatività, bias/variance), ottimizzazione e interpretazione risultati.
Gradita esperienza con stack containerizzato (Docker/Kubernetes) e GPU inference (concetti di latenza, batching, timeouts).

Competenze comportamentali:

Forte orientamento al risultato e capacità di passare dal prototipo al software robusto.
Attitudine al problem solving su dati/documenti complessi e requisiti stringenti di trasparenza.
Autonomia nella conduzione di esperimenti, ma anche capacità di lavorare in team cross-funzionali (AI, backend, cybersecurity, domain expert).
Comunicazione chiara: capacità di spiegare trade-off, limiti e incertezze in modo verificabile

Conoscenze linguistiche: Inglese almeno B2/C1 (scrittura documentazione tecnica, lettura paper e doc di prodotto.Competenze informatiche: Linux, Git, strumenti di CI/CD, strumenti di tracking (Jira/analoghi), ambiente notebook e scripting, Ottima conoscenza del linguaggio Python e delle librerie più popolari (numpy, pandas, opencv), Esperienza in addestramenti e fine-tuning di modelli di AI su framework PyTorch/PyTorch Lightining/Hugginface.Altro (es. Disponibilità a trasferte, Certificazioni specifiche…): Disponibilità a trasferte occasionali; gradite certificazioni/esperienza su MLOps, osservabilità (logging/metrics), sicurezza applicativa in contesti enterprise/regulated; gradita esperienza con dati e documentazione in ambito difesa/sicurezza.Seniority:Primary Location: IT - Roma - Via LaurentinaAdditional Locations: IT - Genova - FiumaraContract Type: PermanentHybrid Working:

Leonardo

Candidati