Evaluation Scenario Writer - AI Agent Testing Specialist
30 $/oraMindrift
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems.
Participation is project-based, not permanent employment.
What This Opportunity Involves- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources.
- Write comprehensive functional tests that validate actual end-to-end behavior and edge‑cases, not just superficial checks.
- Craft "fair but hard" challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required).
- Analyze AI failures to understand what the model struggles with vs. what it masters.
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria.
- Degree in Computer Science, Software Engineering or related fields.
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations).
- Background in Full‑Stack development, with an equal focus on building React‑based interfaces and robust Back‑end systems.
- Experience writing tests (functional, integration - not just running them).
- Docker containers (running evaluations locally in containers).
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results).
- English proficiency – B2.
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid.
Effort estimateTasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Payment- Paid contributions, with rates up to $30/hour*.
- Fixed project rate or individual rates, depending on the project.
- Some projects include incentive payments.
Note: Rates vary based on expertise, skills assessment, location, project needs, and other factors. Higher rates may be offered to highly specialized experts. Lower rates may apply during onboarding or non-core project phases. Payment details are shared per project.
#J-18808-Ljbffr32 $/ora
...ethically shape the future of AI. What We Do The... ...realistic and structured evaluation scenarios for LLM-based agents. You'll create test cases that simulate... ...standard behavior to compare agent actions against. You'll work to ensure each scenario is clearly defined, well...ConsigliatoPart-timeLibero professionistaRemotoOrario flessibile30 $/ora
...technology consulting firm in Italy seeks professionals for project-based AI opportunities focused on testing and improving AI systems. Responsibilities include reviewing coding tasks, writing functional tests, and analyzing AI performance. Ideal candidates have a degree in...ConsigliatoOrario flessibile- Per lo stabilimento produttivo di Origgio (VA, a 30 km da Milano), ricerchiamo la figura di QC Analyst. Il nostro team che opera nel Manufacturing & Global Operations condivide delle priorità ben definite: sicurezza, efficienza, qualità e miglioramento continuo. ...Consigliato2 turni
- ...devono avere conoscenze in elettronica analogica e digitale, autonomia, e disponibilità a trasferte giornaliere. Il ruolo prevede il test e collaudo di schede elettroniche, assistenza tecnica e supporto alla produzione. Contratto iniziale di somministrazione con...ConsigliatoImpiego permanenteSomministrazione
- Grünenthal GmbH cerca un QC Analyst per il suo stabilimento di Origgio (VA). Il candidato ideale ha una laurea in Chimica e almeno 5 anni di esperienza nel controllo qualità nella produzione farmaceutica. Sarà responsabile delle analisi chimiche per materie prime e prodotti...Consigliato2 turni
- Oggi Lavoro S.r.l. cerca un/a tecnico per installazione, collaudo e avviamento di impianti nel settore metalmeccanico. La figura selezionata garantirà il corretto funzionamento delle macchine prima della consegna ai clienti. Richiesta esperienza in collaudo, lettura...Impiego permanente
28.000 € - 32.000 €
...sono sempre al primo posto. Posizione: Tester AI Seniority: Middle (almeno 3 anni di... ...di Progettare, sviluppare ed eseguire test automatizzati per applicazioni web e mobile... ...dei test. Definire e strutturare Agent Skills e playbook di test riutilizzabili...Impiego permanenteRemoto- AMARIS GROUP SA is seeking a Software Engineer (TypeScript/Electron) fluent in Italian to join their Varese team. Responsibilities include designing cross-platform applications and backend services using modern technologies like SvelteKit and Go. The role offers rapid career...Orario flessibile
- ...Jobtech, agenzia digitale per il lavoro, è alla ricerca di un/a Agente di Commercio che voglia intraprendere un percorso lavorativo nel settore commerciale a Varese. Dai un'occhiata a questa opportunità e invia la tua candidatura. Cosa prevede l'offerta? Stipendio...Tempo pienoImpiego permanenteContratto con partita IVAWeekendDal lunedì al venerdì
- ...valorizza autonomia, responsabilità e spirito imprenditoriale, inserita in un gruppo in espansione anche su aree terapeutiche specialistiche. Offerta Promozione scientifica di prodotti dermocosmetici e nutraceutici Attività di visita presso dermatologi e medici...Contratto con partita IVAOrario flessibile
- Chi cerchiamo Una figura Commerciale/Sales Account per la promozione delle soluzioni software gestionali, dei servizi IT e per la gestione del parco clienti attivo. Attività principali Gestione della clientela già acquisita Ricerca di nuovi contatti. Creazione...
1.000 €/mese
Verisure ti offre un'opportunità unica per costruire una carriera di successo , con guadagni competitivi e possibilità di crescita . Entrare a far parte di Verisure significa unirsi a un gruppo di professionisti seri e competenti , uniti da un unico grande obiettivo...Tempo pienoContratto con partita IVAAuto aziendale24.000 € - 36.000 €
...Location & Languages Varese, Milan English, Italian Job Title EMC Test & Validation Engineer (Aerospace) Cosa farai? Eseguire test di compatibilità elettromagnetica (EMC/EMI) su dispositivi e sistemi in ambito defence e aerospace. Utilizzare strumenti...Stage/TirocinioOrario flessibile- ...data management. Write and maintain unit tests to ensure code quality. Manage... ...pipelines on Azure DevOps, covering build, test automation, packaging, and multi-environment... ...rapidly with a tailored career path and salary evaluation. 70% of our senior leaders started at...Impiego permanenteRemotoOrario flessibile
- ...clienti finali. La risorsa si occuperà di: Esecuzione di collaudi funzionali e prestazionali Gestione dei Factory Acceptance Test (FAT) in presenza del cliente Installazione e messa in servizio degli impianti Diagnosi e risoluzione di anomalie tecniche...Tempo pienoImpiego permanenteDal lunedì al venerdì
- ...dapprima la valutazione del CV sulla base delle caratteristiche richieste per il ruolo, un primo breve colloquio telefonico, l'invio di un test online logico-attitudinale e, in base all'esito di quest'ultimo, successivi colloqui conoscitivi. Criteri candidato Livello...
- Se sei un/una giovane laureato/a in ambito umanistico, economico - giuridico o quantitativo, hai entusiasmo, resilienza ed un ottimo orientamento alle relazioni e al cliente, sei la persona che Crédit Agricole Italia sta cercando per il suo retail nel territorio nazionale...Tempo pieno
- SELTIS S.r.l. cerca un/a Contabile per un'importante concessionaria a Lozza. La risorsa supporterà il team contabile nella gestione delle operazioni quotidiane e nel controllo dei flussi finanziari per garantire l’efficienza dei processi amministrativi. Richiediamo ...
- Crédit Agricole Italia cerca di assumere un/una giovane laureato/a come Gestore Clientela in Lombardia, Varese. Il candidato interagirà direttamente con i clienti e contribuirà all'efficace gestione delle loro esigenze, apprendendo i prodotti e servizi bancari offerti ...
- Are you passionate about language and healthcare? Do you thrive on solving linguistic puzzles, like deciphering challenging handwritten medical notes? If so, we’d love to hear from you! The Language Doctors, Inc. is looking for skilled Italian-to-English medical translators...Libero professionistaLungo termineRemotoOrario flessibile
- A medical translation company is looking for skilled Italian-to-English medical translators and editors in Milan. This remote role allows flexibility while engaging in long-term projects that contribute to healthcare clarity. Candidates should have over five years of experience...Lungo termineRemotoOrario flessibile
- ...Jobtech è alla ricerca di un/a Agente di Commercio a Varese. Il candidato ideale ha esperienza nel settore vendite e dovrà gestire visite commerciali per i clienti. Sono previsti stipendi tra €4.000 e €8.000 al mese, con provvigioni continuative e supporto da un call...Tempo pienoImpiego permanenteContratto con partita IVA
- Posizioni aperte Stema S.r.l. è incaricata di ricercare per la filiale italiana situata in provincia di Varese che, alle dipendenze del Direttore della Filiale, si occuperà di: # sviluppare azioni commerciali sul territorio nel settore di riferimento # gestire...
- ADAMI & ASSOCIATI, situata a Varese, è alla ricerca di un professionista con un solido background tecnico nel settore meccanico, per gestire clienti internazionali nel settore della componentistica oleodinamica. La posizione richiede un'ottima conoscenza dell'inglese e...
- Un'opportunità unica per diventare venditore presso il BMW dealer di Varese, Lombardia. Il candidato ideale ha una forte passione per l'automotive e competenze nel settore vendite. Sarà responsabile di rendere l'esperienza di acquisto memorabile per i clienti, curando ogni...
- BTicino S.p.A, situata a Varese, è alla ricerca di un Tecnico Preventivazione e Supporto Commerciale Commesse QMC per la struttura Marketing Italia. Il candidato avrà il compito di redigere preventivi tecnico-commerciali per quadri di bassa tensione e supportare i clienti...
30 $/ora
An innovative AI project firm in Milan seeks QAs for autonomous AI agents. This flexible, project-based role requires strong analytical thinking, attention to detail... ...role involves reviewing logic and completeness of scenarios and helping refine AI behaviors. Compensation can...RemotoOrario flessibile30 $/ora
...the future of AI. What We... ...systems are tested and evaluated? This is a... ...autonomous AI agents for a new... ...logic, and agent evaluation frameworks... ...through scenarios,... ...closely with QA, writers, or developers... ...structured scenario design Background... ...with QA or test-case...Part-timeImpiego permanenteLibero professionistaRemotoOrario flessibile- A technology consulting firm is seeking a fully remote Project Evaluator for AI development. Responsibilities include generating requests and evaluating an AI agent's responses. The ideal candidate must be fluent in French and have intermediate English skills for training...Tempo pienoRemoto
- Opportunità riservata ai professionisti che appartengono alle categorie protette Receptionistpart-time: Varese Azienda Per primaria realtà strutturata operante nell'ambito della consulenza professionale , ricerchiamo una risorsa da inserire con il ruolo di Receptionist...Part-time
