Evaluation Scenario Writer - AI Agent Testing Specialist
30 $/oraMindrift
At Mindrift, innovation meets opportunity. We believe in using the power of collective human intelligence to ethically shape the future of AI. What We Do
The Mindrift platform connects specialists with AI projects from major tech innovators. Our mission is to unlock the potential of Generative AI by tapping into real‑world expertise from across the globe.
About The RoleDesign realistic and structured evaluation scenarios for LLM‑based agents. Create test cases that simulate human‑performed tasks and define gold‑standard behavior to compare agent actions against. Ensure each scenario is clearly defined, well‑scored, easy to execute, and reusable. Require sharp analytical mindset, attention to detail, and interest in how AI agents make decisions.
- Create structured test cases that simulate complex human workflows.
- Define gold‑standard behavior and scoring logic to evaluate agent actions.
- Analyze agent logs, failure modes, and decision paths.
- Work with code repositories and test frameworks to validate scenarios.
- Iterate on prompts, instructions, and test cases to improve clarity and difficulty.
- Ensure scenarios are production‑ready, easy to run, and reusable.
Apply to this post, qualify, and get the chance to contribute to projects aligned with your skills, on your own schedule. From creating training prompts to refining model responses, you'll help shape the future of AI while ensuring technology benefits everyone.
Requirements- Bachelor's and/or Master's Degree in Computer Science, Software Engineering, Data Science / Data Analytics, Artificial Intelligence / Machine Learning, Computational Linguistics / NLP, Information Systems or related fields.
- Background in QA, software testing, data analysis, or NLP annotation.
- Good understanding of test design principles (e.g., reproducibility, coverage, edge cases).
- Strong written communication skills in English.
- Comfortable with structured formats like JSON/YAML for scenario description.
- Can define expected agent behaviors (gold paths) and scoring logic.
- Basic experience with Python and JavaScript.
- Curious and open to working with AI‑generated content, agent logs, and prompt‑based behavior.
- Experience in writing manual or automated test cases.
- Familiarity with LLM capabilities and typical failure modes.
- Understanding of scoring metrics (precision, recall, coverage, reward functions).
- Get paid for your expertise, with rates up to $30/hour depending on skills, experience, and project needs.
- Flexible, remote, freelance project that fits around professional or academic commitments.
- Participate in an advanced AI project and gain valuable experience to enhance your portfolio.
- Influence how future AI models understand and communicate in your field of expertise.
Entry level
Employment typePart‑time
Job functionOther
IndustriesIT Services and IT Consulting
#J-18808-Ljbffr- 2night-Lab cerca un Social Media Professional a Mestre, per gestire i progetti di marketing esperienziale. Sarai responsabile della narrazione digitale, traducendo eventi live in contenuti social efficaci e ottimizzando strategie di engagement. Richiesta esperienza di...ConsigliatoApprendistato
- Essere 2nighter significa far parte di un team che crede nel potere dell’innovazione e nella forza di emozionare, creando esperienze uniche che spingono i confini della creatività, per reinventare ogni giorno il marketing esperienziale, in Italia e nel mondo. Il tuo...ConsigliatoApprendistatoLavoro ibrido
35.000 €
...Itconsulting srl, società di consulenza IT, cerca un Automation Tester con almeno 4 anni di esperienza. La posizione è full remote e richiede padronanza di tecnologie di automazione mobile e web, oltre a conoscenze di Python, JavaScript e TypeScript. Offriamo un pacchetto...ConsigliatoRemoto28.000 € - 32.000 €
...sono sempre al primo posto. Posizione: Tester AI Seniority: Middle (almeno 3 anni di... ...di Progettare, sviluppare ed eseguire test automatizzati per applicazioni web e mobile... ...dei test. Definire e strutturare Agent Skills e playbook di test riutilizzabili...ConsigliatoImpiego permanenteRemoto1.600 - 2.000 €/mese
In Job S.p.A. - Career Center di TREVISO seleziona ADDETTO/A AL COLLAUDO CAPI D'ABBIGLIAMENTO per realtà operante nel settore tessile Mansioni Individuazione di difetti o non conformità Controllo qualità visivo e funzionale dei prodotti Collaudo e...ConsigliatoTempo pienoTempo determinato- ...clienti, offriamo soluzioni avanzate di customer care e digital outsourcing, dove tecnologie intelligenti – come l’hyper automation, l’AI e il martech – lavorano insieme alle persone per creare esperienze di valore. Se cerchi un'azienda solida ma in continua...Part-timeTempo determinatoDal lunedì al venerdì20 h/sett.
- ...clienti, offriamo soluzioni avanzate di customer care e digital outsourcing, dove tecnologie intelligenti – come l’hyper automation, l’AI e il martech – lavorano insieme alle persone per creare esperienze di valore. Se cerchi un'azienda solida ma in continua...Part-timeTempo determinatoTurniDal lunedì al venerdì20 h/sett.
- CGM Consulting S.R.L. cerca un/una Backend Developer AI Agent Platform con esperienza in Node.Js e TypeScript. Il candidato ideale lavora su sistemi assicurando servizi backend scalabili e affidabili in un contesto Full Remote.Richieste buone competenze in JavaScript,...Impiego permanenteRemoto
- ...Lead Writer Remote Permanent or Full-time Contractor Competitive package About Us: ClickOut Media is not just a company... ...# Have an introduction call with our recruitment team # Do a test # Have a technical interview # Equal Opportunities ClickOut...Tempo pienoImpiego permanenteLibero professionistaRemotoOrario flessibile
- ...LILT (Production) seeks detail-oriented human reviewers for various AI training projects. You will evaluate prompts, review text, and analyze multimedia to ensure high-quality results. The ideal candidate holds native fluency in the target language, a strong command of...
- UMANA S.p.A. cerca un OPERAIO ELETTROMECCANICO JUNIOR da inserire nella sua azienda metalmeccanica a Santa Maria di Sala, Venezia. Il candidato ideale ha un diploma o qualifica professionale, dimostra interesse per il settore meccanico-elettrico e possiede buone capacità...Tempo pienoTempo determinato
20.000 € - 24.000 €
Ruralis.com cerca un/una talentuoso/a Special Copywriter per contribuire alla comunicazione aziendale, dal blog ai social media. La posizione è full-time e totalmente remota, con retribuzione annuale fra 20.000 e 24.000 euro lordi. Le attività includono la creazione di...Tempo pienoRemoto- ...Siamo alla ricerca di un QA Engineer (verticale sull'ambito Test Automation ) su Roma . Di cosa hai bisogno per avere successo... ...Python. Quotidiano utilizzo (o conoscenza) dei tool di Generative AI. Certificazioni ISTQB o equivalenti. Preferibile laurea...Tempo pienoLibero professionistaLavoro ibrido
55.000 €
...Chi Siamo In Galene.AI sviluppiamo una piattaforma di AI generativa privata e governata per portare l’AI in produzione con sovranità del dato, sicurezza e compliance, per aziende di ogni dimensione, in ogni settore. Siamo NVIDIA Solution Advisor Partner e, insieme...Impiego permanenteLavoro ibridoRemoto- A leading multinational corporation is seeking a Marketing Automation & Content Specialist in Italy to execute global multi-channel marketing campaigns. With at least 5 years of B2B marketing automation experience, you will collaborate to create high-performing digital...
40.000 € - 45.000 €
...B2B Sales Specialist end-to-end – Start up Textile & AI Solutions Per conto di AQC Industry, realtà innovativa che sta digitalizzando la gestione della qualità nel settore tessile e della moda di lusso, siamo alla ricerca di un* SALES pronto a contribuire in prima...Auto aziendaleOrario flessibile- ...attitudine al contatto con clienti B2B; Autonomia negli spostamenti (automunito/a); Partita IVA obbligatoria; Iscrizione come agente di commercio (titolo fondamentale); Esperienza di almeno 1 anno nel ruolo di agente di commercio; Ottime capacità relazionali...Tempo pienoImpiego permanenteContratto con partita IVAWeekendDal lunedì al venerdì
- ...added resellers (VARs), distributors or retailers. You locate, evaluate and recruit potential channel partners, support partners throughout... ...Manage and organize training for sales force and coordinate agents’ activity when required Visit periodically the customers and...Orario flessibileTurno di notte
- UMANA S.p.A. cerca un Operaio Automotive Junior per la filiale di Venezia (Scorzè). Il candidato ideale avrà una minima conoscenza di motori e meccanica auto e competenze informatiche. Il ruolo include diagnosi e revisione di veicoli e prevede la possibilità di assunzione...SomministrazioneApprendistato
1.050 €/mese
Global Talent View is looking for Italian speakers to join exciting roles in Lisbon, Portugal including Customer Advisor and Content Moderator positions. This opportunity offers paid training and a monthly salary of €1,050 gross with accommodation or €1,379 gross without...1.050 €/mese
Exciting Opportunity for Italian Speakers in Lisbon! Relocation Included! Ready for a change of scenery? Start your new adventure in Lisbon, Portugal! Whether you’re looking to kickstart your career or simply craving a fresh start, we’ve got the perfect opportunity for...2.500 €/mese
...osteoarticolare, vascolare, urologica Azienda Azienda storica nel campo dell'integrazione che vanta diverse linee di prodotti specialistici la cui validità è assicurata dalla stretta collaborazione con i più prestigiosi centri di ricerca nazionale. Le diverse aree di...SomministrazioneContratto con partita IVA- ...potrebbe essere la tua giornata tipo? MISSION Guidare la qualità di servizi API‑first su architettura a microservizi , con un test design rigoroso, automazione sostenibile, e integrazione di performance e sicurezza nelle pipeline CI/CD . Responsabilità...Smart workingLavoro ibridoOrario flessibile
- ...CGM Consulting S.r.l. cerca un/una Specialista AMS / Tester Billing per attività di Application Management Services. La posizione è full... ...possiede esperienza nella gestione dei ticket e nei servizi di test, sa interfacciarsi con clienti business e ha conoscenza dei principi...Remoto
- Il Progetto Professional Recruitment seleziona un Informatore Scientifico del Farmaco per un realtà italiana nel settore Farmaceutico. Un progetto che coniuga informazione medica e divulgazione scientifica di qualità con rigore scientifico e innovazione tecnologica....
2.500 €/mese
Michael Page International Italia S.r.l. è alla ricerca di un Informatore Medico Scientifico per il territorio di Venezia. La figura si occuperà di promuovere l'informazione scientifica sui prodotti di competenza, collaborando con medici specialisti. Si offre un contratto...Somministrazione35.000 € - 40.000 €
...campo per massimizzare la produttività e mantenere alto lo slancio in tutto il territorio. Lavorare in modo più intelligente con l'AI/CRM e proteggere gli standard: utilizzare strumenti AI/CRM per dare priorità e qualificare i lead, massimizzare il tempo sul campo,...- ...territorio nazionale della propria struttura commerciale seleziona 2 agenti commerciali per clienti residenziali e pmi. Si richiede: -... ...commerciale, venditori, sales, account, sales account, agente, agente di commercio, rappresentante, agente plurimandatario by...
1.600 - 2.000 €/mese
Orienta S.p.A., Società benefit, filiale di Bolzano, ricerca per azienda cliente, operante nel settore delle ceramiche, un TECNICO COMMERCIALE . La risorsa si occuperà di: Vendita dei prodotti; Sviluppo del fatturato attraverso strategie di vendita innovative;...Tempo pienoTempo determinatoDal lunedì al sabato- TWY cerca un operatore telefonico inbound per il servizio di booking per una catena alberghiera. La posizione è presso la sede di Marcon (VE). Gli operatori gestiranno richieste di prenotazioni, modifiche e cancellazioni attraverso il telefono e le email. È necessaria...Part-time

