Com millorar l'avaluació de competències amb IA: preguntes BEI i indicadors conductuals (2026)

Preguntes BEI i indicadors conductuals: portada Voicit
Rafa Torres García

Actualitzat: maig 2026 · Per Rafa Torres García, CTO i cofundador de Voicit

Un motor d'avaluació de competències ben construït —amb la metodologia BEI, els nivells definits i un procés d'anàlisi en fases— ja produeix avaluacions fiables. Aquesta és la base, i l'hem cobert a l'article anterior. El que comptem aquí és el pas següent: com dos elements concrets del motor de Voicit fan que aquestes avaluacions passin de fiables a auditables, reproduïbles i molt més precises a l'hora d'assignar un nivell.

Com es guanya precisió en una avaluació de competències per IA? Afegint dos elements al motor: preguntes BEI associades a la competència (que orienten la cerca d'evidència a la conversa) e indicadors conductuals per nivell amb un sistema de rols – crític, complementari i bloquejant – que donen a la IA criteris objectius per assignar un nivell i deixen cada decisió vinculada a comportaments observables.

A Voicit hem redissenyat el motor d'avaluació de competències incorporant aquests dos elements sobre els pilars que ja teníem. El motor anterior ja generava informes sòlids; el que afegeixen les preguntes BEI i els indicadors conductuals és més cobertura de l'evidència que apareix a l'entrevista i més rigor com aquesta evidència es tradueix en un nivell. En aquest article t'expliquem què són cadascun, per què viuen separats a l'arquitectura del producte i per què tots dos junts són la diferència entre un informe que sembla bo i un que pots defensar amb arguments davant del teu client.

⏱ Si només tens 30 segons

Preguntes BEI: ajuden la IA a localitzar incidents crítics a la conversa. Que no se li escapi evidència útil. Additives, no excloents. No puntuen.

Indicadors conductuals: són els criteris ancorats a cada nivell (1-4). Fan que el veredicte sigui més precís i traçable.

Tres rols per indicador: crític (condició necessària), complementari (reforç), bloquejant (desqualificador en negatiu).

El veredicte es torna auditable: deixa de ser només la conclusió del model i passa a ser un algorisme de descartar → validar → confirmar → ascendir.

🧱 El problema que milloren aquests dos elements

Imagina que demanes a una IA amb metodologia BEI i nivells definits: «Avalua el nivell de lideratge d'aquest candidat». Amb un bon model i una transcripció decent, reps una avaluació que ja és raonable: una cosa així com «Nivell avançat — gestiona equips multidisciplinaris amb visió estratègica«.

Raonable, però hi ha tres preguntes que costa respondre amb confiança només amb això:

  • A quina part exacta de la conversa hi ha l'evidència de «visió estratègica»?
  • Què hauria tingut a veure el model per no assignar nivell avançat?
  • Si passem una altra entrevista similar pel mateix motor demà, sortirà la mateixa manera de puntuar?

Mentre que la IA només treballa amb la definició textual de cada nivell, ha de decidir pel seu compte què explica com què. Això introdueix variabilitat en avaluacions que haurien de ser reproduïbles, i redueix la traçabilitat de cada decisió — dues coses que qualsevol consultora de selecció necessita poder defensar davant del client.

Les preguntes BEI i els indicadors conductuals ataquen dos problemes diferents. Les primeres milloren quina evidència entra a l'anàlisi. Els segons milloren com aquesta evidència es tradueix en un nivell. Són ortogonals i, per això, combinables.

❓ Preguntes BEI: l'entrada que amplia la cobertura

Les preguntes BEI són guions d?entrevista per incidents crítics associats a una competència. Una pregunta BEI no és «Saps liderar?». És una invitació a relatar un incident concret: «Explica'm una situació on el teu equip no arribava a l'objectiu i vas haver de prendre una decisió difícil».

Què entra

Què fan les preguntes BEI quan les passes al motor

Quan el motor analitza la transcripció de l'entrevista, les preguntes BEI funcionen com localitzadors: li diuen al motor «busca també episodis de tipus X». L'efecte és que afloren incidents subtils, esmentats de passada pel candidat, que una anàlisi genèrica podria passar per alt.

Tres propietats importants:

  • Additives, no excloents. Si el candidat explica un episodi rellevant que no encaixa amb cap pregunta, continua comptant. Les preguntes amplien la cerca; no la limiten.
  • No puntuen ni assignen nivell. Són pura entrada. Qui decideix el nivell són els indicadors conductuals, no les preguntes.
  • No apareixen a l'informe final. Són una pista interna per al motor; el consultor les fa servir també com a guió durant l'entrevista, si vol.

Etiquetatge per perfil de lloc

Una mateixa pregunta ben formulada pot revelar qualsevol nivell de domini. Si preguntes «Explica'm una situació en què vas detectar alguna cosa èticament qüestionable a la teva feina»:

  • Un candidat de nivell 1 relatarà que va seguir el protocol.
  • Un nivell 3 explicarà com va intervenir i va canviar la dinàmica de l'equip.
  • Un de nivell 4 explicarà com va redissenyar la política de l?empresa.

Per això les preguntes s'etiqueten per perfil de lloc (operatiu, comandament mitjà, executiu), no per nivell de la competència. Una pregunta per a un directiu aborda governança perquè aquest és el seu dia a dia –però un executiu mediocre podria respondre i demostrar nivell 2. El que classifica aquesta resposta no és la pregunta: són els indicadors conductuals.

📐 Indicadors conductuals: els criteris que afinen el veredicte

Un indicador conductual és un comportament observable que evidencia que el candidat domina la competència a un nivell concret. No és una propietat de la competència en abstracte — és una propietat d'un nivell específic d'aquesta competència.

Aquesta vinculació nivell-comportament és la clau. «Compleix els terminis acordats» i «Establix codis de conducta organitzacional» són tots dos indicadors de Professionalitat, però pertanyen a nivells de maduresa completament diferents. Sense aquesta assignació a un nivell, la IA ha d'inferir la jerarquia pel seu compte. Amb ella, contrasta allò que ha extret de la conversa contra criteris objectius.

Com es jutja

D'on ve aquest enfocament

Els marcs de competències de referència a la indústria estructuren els indicadors conductuals per nivell de domini des de fa dècades:

  • Korn Ferry / Lominger — leadership architect amb indicadors per nivell i stallers and stoppers (factors que descarrilen la carrera).
  • SHL Universal Competency Framework — distingeix indicadors «essencials» (crítics) de «desitjables» (complementaris).
  • Hi ha Group — models de competència amb ponderacions diferenciades per indicador.
  • Hogan Assessments — derailment factors aplicables com a contraindicadors.
  • Center for Creative Leadership (CCL) - factors de descarrilament com a senyals d'alerta de carrera.

El que en assessment centers professionals s'anomena «indicadors essencials», «desitjables» i «contraindicadors» és exactament el sistema de tres rols que veurem a continuació.

📚
Recurs gratuït

Diccionari de 26 competències toves

Descarrega la llista completa amb definicions, nivells i indicadors conductuals observables per a cada competència. A punt per utilitzar a les teves rubriques d'avaluació i entrevistes BEI.

Descarregar diccionari gratis →

🎯 Els tres rols que canvien l'avaluació

Cada indicador conductual porta un rol que en defineix la funció. Això converteix un llistat pla de comportaments en un marc d'avaluació que la IA —o qualsevol avaluador humà— pot aplicar de manera reproduïble.

Crític

Crític — condició necessària

Redactat en positiu. Si no s'observa, el candidat no arriba a aquest nivell, independentment de quants altres indicadors sí que s'observin. És l'àncora del nivell.

Equival als indicadors «essencials» de SHL i als indicadors amb més ponderació a Korn Ferry. A assessment centers professionals és pràctica estàndard que certs comportaments siguin condició necessària.

Exemple · Lideratge, nivell intermedi
«Delega tasques amb responsabilitat associada i fa seguiment del progrés.»
Complementari

Complementari — reforç, no requisit

Redactat en positiu. La seva presència dóna solidesa a lavaluació; la seva absència, per si sola, no desqualifica. Correspon als indicadors «desitjables» de SHL.

A la pràctica, ajuden a distingir entre «aquest candidat compleix el nivell» i «aquest candidat ho compleix amb comoditat».

Exemple · Lideratge, nivell intermedi
«Facilita converses difícils dins de l'equip sense recórrer al comandament jeràrquic.»
Bloquejant

Bloquejant — senyal d'alerta en negatiu

Redactat en negatiu. Si s'observa, impedeix assignar aquest nivell o qualsevol superior. Formalitza el concepte de “stallers and stoppers” de Lominger, els “derailment factors” d'Hogan i els factors de descarrilament del CCL.

En guies d'entrevista estructurada també es coneixen com a «contraindicadors» o «red flags».

Exemple · Lideratge, nivell intermedi
"Atribueix els errors de l'equip a persones concretes en lloc d'assumir responsabilitat com a líder."

Límits recomanats per nivell per mantenir l'eficàcia de l'avaluació i evitar la dilució: 2-3 indicadors crítics, 3-4 complementaris i 1-2 bloquejants.

🧮 L'algorisme en quatre passos

El sistema de rols defineix un algorisme que el motor aplica de forma consistent - el mateix a cada avaluació, independentment del candidat o del consultor. Això és el que converteix criteri expert tàcit en un procés explícit i auditable.

1
DescartarS'observa algun bloquejant al nivell N? Si la resposta és sí, el candidat no arriba aquest nivell. Es baixa a avaluar-ne el nivell inferior.
2
ValidarS'observen els indicadors crítics del nivell N? Si en falta algun, no s'assigna aquest nivell. Això tanca la porta perquè el motor infli el nivell sense evidència suficient.
3
ConfirmaQuants indicadors complementaris del nivell N s'observen? Determinen la solidesa de l'assignació. Pocs complementaris = nivell complert just. Molts = nivell complert amb folgança.
4
AscendirRepetir el procés des del nivell següent. El veredicte final és el nivell més alt que passa els tres filtres anteriors.

El resultat: cada decisió està vinculada a una evidència específica ia una regla explícita. Podeu auditar l'avaluació incident per incident i, si discrepeu amb el veredicte, sabeu exactament on apuntar.

🧩 Instrument vs. criteris: per què viuen separats

Una de les decisions més importants que prenem en redissenyar el motor va ser mantenir les preguntes BEI i els indicadors conductuals com a elements separats a l'arquitectura del producte.

  • Les preguntes BEI són el instrument que provoca l'evidència. Les fas perquè el candidat relati incidents.
  • Els indicadors conductuals són els criteris que classifiquen aquesta evidència. Els apliques per decidir quin nivell demostren els incidents relatats.

Barrejar tots dos elements en una mateixa estructura (per exemple, «preguntes de nivell 3») és un error freqüent. Fa pensar que certes preguntes produeixen respostes d'un nivell concret — quan en realitat la pregunta només convida a relatar, i és el contingut del relat (contrastat amb els indicadors) allò que classifica el nivell.

Separar-los et dóna dues palanques independents:

  • Millorar les preguntes perquè aflori més evidència útil a cada entrevista.
  • Refinar els indicadors perquè el veredicte sigui més ajustat al nivell real del candidat.

⚡ Com Voicit ho aplica a cada avaluació

En Voicit, tot això ja ve configurat per defecte i llest per utilitzar:

1
Diccionari de 26 competències per defecte. Cada competència porta els nivells (1-4), un conjunt de preguntes BEI per perfil de lloc (operatiu, comandament mitjà, executiu) i els seus indicadors conductuals amb els tres rols (crític, complementari, bloquejant) ja redactats. El punt de partida que la majoria de consultores només necessiten retocar.
2
Dues maneres per decidir què avaluar. De manera manual, tu tries les competències rellevants per a l'entrevista. En mode automàtic, puges la descripció del lloc i Voicit detecta quines competències del diccionari apliquen a aquest perfil concret, basant-se en les funcions, responsabilitats i requisits del lloc.
3
Informe PDF i gràfic de competències. En acabar, Voicit genera un informe en PDF amb el detall de cada competència avaluada (nivell detectat, indicadors observats i absents, bloquejants activats i la cita textual de cada evidència) i un gràfic de competències vs. nivell requerit que permet veure, de cop i volta, l'encaix del candidat amb el lloc.
4
Personalització completa. Pots afegir competències pròpies, ajustar els nivells, modificar les preguntes BEI o redefinir els indicadors conductuals per adaptar-ho tot a la teva metodologia, sector o client. El diccionari base no és una cotilla: és un punt de partida.

El consultor passa de «llegir-se» un informe que ha produït la IA a auditar una avaluació que la IA ha sustentat amb evidència. És una diferència de fons, no de manera.

📋 Resum comparatiu

ElementFuncióEfecteQuan configurar-ho
Preguntes BEILocalitzar incidents crítics a la conversa↑ Cobertura — aflora evidència que es podria passar per altQuan vols assegurar que s'exploren escenaris concrets
Indicadors críticsCondició necessària del nivell (en positiu)↑ Precisió — sense crítics, no hi ha nivellPels comportaments imprescindibles del nivell
Indicadors complementarisReforç del nivell (en positiu)↑ Solidesa — donen confiança al veredictePer distingir nivell complert just vs. amb folgança
Indicadors bloquejantsSenyal d'alerta (en negatiu)↓ Desqualificació automàtica del nivellPer a conductes de risc o derailment factors

Sense preguntes BEI, el motor pot passar per alt evidència rellevant. Sense indicadors conductuals, manca el marc d'avaluació que aterra la metodologia. Amb tots dos, l'avaluació de competències per IA passa de ser un informe que sembla bo a un procés reproduïble que pots defensar davant del teu client amb arguments concrets.

💬 Preguntes freqüents

Necessito coneixements tècnics per configurar preguntes BEI i indicadors conductuals?

No. A Voicit hi ha un diccionari de 26 competències amb preguntes i indicadors ja redactats segons els marcs de Korn Ferry, SHL i Hay. La majoria de consultores només necessiten ajustar-los al sector o client. Si la teva metodologia és molt específica, podeu crear competències des de zero amb un editor visual.

Quina és la diferència real entre preguntes BEI i preguntes normals d'entrevista?

Les preguntes BEI demanen sempre un incident concret: «Explica'm una situació en què…». Les preguntes normals (Saps liderar? Com treballes en equip?) conviden a respostes hipotètiques o autoavaluatives, fàcils de fabricar. Les BEI forcen el candidat a explicar una cosa que va passar —i, sobretot, fan molt més fàcil que el motor trobi evidència conductual real a la conversa.

Puc avaluar competències sense definir indicadors conductuals?

Sí, i el resultat continuarà sent fiable si la competència té nivells ben definits i el motor aplica metodologia BEI amb el procés en fases. Però perds el marc d'avaluació auditable: el motor continuarà generant una avaluació però serà més interpretativa i menys reproduïble. Els indicadors converteixen la definició dun nivell en una cosa que es pot verificar punt per punt.

Què passa si la conversa no toca alguna de les preguntes BEI configurades?

Res problemàtic. Les preguntes són additives: orienten la cerca, però no obliguen que cadascuna tingui el seu incident. El motor extreu tots els incidents rellevants que apareguin a la conversa, encaixin o no amb una pregunta concreta. L'únic que perds és l'oportunitat d'explorar aquest escenari en particular — cosa que el sistema t'assenyala com a gap perquè l'aprofundeixis a la següent entrevista.

Un bloquejant observat desqualifica el candidat sencer o només el nivell?

Només el nivell on està definit i els superiors. Un bloquejant de nivell 3 impedeix assignar nivell 3 o 4, però el candidat continua sent avaluable a nivell 1 o 2. És una desqualificació de nivell, no de candidat. Per això és important definir-los en el nivell on tenen sentit —un bloquejant de nivell 1, per exemple, sí que desqualifica la competència sencera.

Voicit detecta automàticament les competències a avaluar?

Sí. Si puges la descripció del lloc, Voicit detecta del diccionari de 26 competències quines apliquen a aquest perfil - basant-se en les funcions, responsabilitats i requisits descrits - i configura l'avaluació amb elles. Tu podeu ajustar la selecció abans de processar l'entrevista. Si prefereixes triar-les a mà, també ho pots fer en mode manual.

La IA pot substituir el meu judici com a consultor de selecció?

No, i no ho hauria de fer. Les preguntes BEI i els indicadors conductuals fan que l'avaluació sigui més rigorosa i auditable, però el context del client, l'encaix cultural i la responsabilitat de la recomanació són encara teus. El que guanyes és temps i traçabilitat — allò que t'allibera per fer millor la part que només tu pots fer.

Darrera actualització: maig de 2026. Aquest article descriu l'enfocament metodològic que aplica el motor d'avaluació de competències de Voicit, basat en marcs de referència com Korn Ferry/Lominger, SHL UCF, Hay Group, Hogan i CCL. Per a decisions formals de contractació, combina sempre l'avaluació automatitzada amb el criteri professional del consultor responsable.

Rafa Torres García

Rafa Torres García
CTO i cofundador de Voicit. Dissenya els sistemes d'avaluació de competències amb IA que usen consultores de selecció i equips de RH per generar informes més precisos en menys temps.

T'ha resultat interessant? Comparteix-t'ho!

Articles relacionats

Descobreix el poder de la documentació automàtica.

Gaudeix del pla gratis per sempre.