Junior Data Scientist
DGS Visualizza tutti gli annunci
- Milano
- Tempo indeterminato
- Full time
- Supporto al team nella comprensione degli use case e dei requisiti di business;
- Sviluppo dei prototipi GenAI funzionanti (prompt, semplici RAG, workflow base);
- Preparazione e strutturazione dati (chunking, indicizzazione documenti);
- Integrazione di API LLM in script e microservizi;
- Supporto nella valutazione dei modelli (test set, metriche base, A/B test);
- Redazione di documentazione tecnica chiara e condivisibile;
- Applicazione di best practice base su sicurezza e compliance.
- Laurea in discipline STEM (Informatica, Ingegneria Informatica, Data Science, Matematica, Fisica o equivalenti) oppure esperienza equivalente in sviluppo software/progetti AI;
- Conoscenza di Python (pandas, notebook) e SQL;
- Fondamenti LLM (chat/completions, embeddings) e prompt engineering;
- RAG base (chunking, retrieval, vettorializzazione);
- Esperienza con API LLM (OpenAI/Azure OpenAI o equivalenti),Git, REST/JSON; basi Docker;
- Notebook (Jupyter/Colab) e data visualization base;
- Conoscenze base del mondo Cloud (AWS/GCP/Azure)
- LangChain o LlamaIndex
- Vector DB (Pinecone, Weaviate, Elasticsearch/OpenSearch)
- FastAPI / Streamlit
- Hugging Face e fine-tuning leggero (LoRA/PEFT)
- Tool di evaluation (Langfuse, W&B, MLflow)
- OCR / document processing
- Nozioni di sicurezza GenAI (prompt injection, PII)
- Attitudine all'apprendimento continuo e curiosità verso nuove tecnologie, con capacità di recepire feedback e migliorare rapidamente, e con volontà di crescere verso ruoli più autonomi.
- Buone capacità comunicative e di lavoro in team, con attenzione alla chiarezza nella documentazione e nella condivisione delle attività.