Métricas Associate
La confianza (o confidence) es una métrica fundamental en las reglas de asociación y mide la probabilidad condicional de que un evento ocurra dado que otro ya ha ocurrido. En el contexto de una regla de asociación como A ⇒ B
, la confianza indica con qué frecuencia ocurre B
cuando A
ya ha ocurrido.
Fórmula de la Confianza
La confianza de una regla A ⇒ B
se calcula como:
[ \text{Confianza} = \frac{\text{Soporte}(A \text{ y } B)}{\text{Soporte}(A)} ]
donde:
- Soporte(A y B) es la probabilidad de que ambos eventos
A
yB
ocurran juntos. - Soporte(A) es la probabilidad de que ocurra
A
por sí solo.
En otras palabras, la confianza mide la fracción de las veces que B
ocurre en aquellos casos en que A
ya ha ocurrido.
Interpretación de la Confianza
- Confianza = 1 (o 100%): Indica que cada vez que ocurre
A
, también ocurreB
sin excepción. Esto significa que la reglaA ⇒ B
es completamente confiable. - Confianza cercana a 1: Indica una alta probabilidad de que
B
ocurra cuando ocurreA
, pero no es totalmente seguro. - Confianza < 1: A medida que la confianza disminuye, la probabilidad de que
B
ocurra dadoA
también es menor. - Confianza muy baja: Una confianza baja indica que
A
ocurre frecuentemente sinB
, por lo que la relación entreA
yB
no es muy fuerte.
Ejemplo
Supongamos que estamos analizando las compras de clientes y encontramos la regla:
Si se compra café (A), también se compra azúcar (B).
- Si la confianza de esta regla es
0.8
(o 80%), esto significa que el 80% de las veces que los clientes compran café, también compran azúcar. - Una confianza de
0.8
indica una alta probabilidad de que estos productos se compren juntos, pero no es una relación perfecta (es decir, hay un 20% de las veces en que los clientes compran café sin comprar azúcar).
Diferencia entre Confianza y otras métricas como Lift
- Confianza es una medida condicional; solo mide la probabilidad de que
B
ocurra dado que ya ocurrióA
. - Lift considera si la relación es significativa en comparación con la independencia.
- Convicción mide qué tan inesperado sería ver
A
sinB
.
¿Por qué es útil la Confianza?
La confianza es crucial para identificar patrones en datos y evaluar la fiabilidad de las reglas de asociación. Es muy utilizada en sistemas de recomendación, análisis de mercado, y minería de datos en general, ya que permite identificar qué tan frecuentemente un evento o artículo ocurre en presencia de otro, ayudando a diseñar estrategias de ventas y recomendaciones personalizadas.
El lift es una métrica utilizada en las reglas de asociación para medir la fortaleza de una regla. En el contexto de minería de datos, se utiliza para evaluar la relación entre dos conjuntos de artículos o eventos en comparación con lo que esperaríamos si fueran completamente independientes.
Fórmula del Lift
La fórmula del lift de una regla de asociación A ⇒ B
es:
[ \text{Lift} = \frac{\text{Soporte}(A \text{ y } B)}{\text{Soporte}(A) \times \text{Soporte}(B)} ]
donde:
- Soporte(A y B): es la frecuencia o probabilidad de que ambos eventos ocurran juntos.
- Soporte(A) y Soporte(B): son las probabilidades individuales de que ocurran
A
yB
por separado.
Interpretación del Lift
El lift nos indica en qué medida la ocurrencia de A
incrementa (o disminuye) la probabilidad de que ocurra B
:
- Lift = 1:
A
yB
son independientes, es decir,A
no afecta la probabilidad de que ocurraB
. - Lift > 1: Existe una relación positiva entre
A
yB
. Esto significa que cuando ocurreA
, es más probable que ocurraB
que si fueran independientes. Cuanto mayor es el lift, más fuerte es la asociación. - Lift < 1: Existe una relación negativa entre
A
yB
. Esto significa que cuando ocurreA
, la probabilidad de que ocurraB
es menor de lo esperado si fueran independientes.
Ejemplo
Supongamos que estamos analizando las compras en un supermercado, y encontramos la siguiente regla de asociación:
Si se compra pan (A), entonces también se compra leche (B).
Si el lift de esta regla es 1.5
, esto significa que la probabilidad de que se compre leche cuando ya se ha comprado pan es 1.5 veces mayor que si ambos productos fueran independientes.
¿Por qué es útil el Lift?
El lift ayuda a identificar relaciones significativas entre eventos o artículos que no se explicarían solo por el azar o por la popularidad individual de los elementos. Esta métrica se utiliza mucho en marketing, recomendaciones de productos y análisis de patrones de comportamiento, ya que permite resaltar combinaciones de productos que tienen una mayor probabilidad de comprarse juntos que la esperada.
El leverage es otra métrica en las reglas de asociación que ayuda a medir la fortaleza de la relación entre dos conjuntos de artículos o eventos, pero desde una perspectiva ligeramente diferente al lift.
Fórmula del Leverage
Para una regla de asociación A ⇒ B
, el leverage se calcula como:
[ \text{Leverage} = \text{Soporte}(A \text{ y } B) – \left(\text{Soporte}(A) \times \text{Soporte}(B)\right) ]
donde:
- Soporte(A y B) es la probabilidad de que
A
yB
ocurran juntos. - Soporte(A) y Soporte(B) son las probabilidades individuales de
A
yB
.
Interpretación del Leverage
El leverage indica el incremento en la probabilidad de que A
y B
ocurran juntos por encima de lo esperado si fueran independientes. Su valor puede ser positivo, cero o negativo:
- Leverage > 0: Hay una relación positiva entre
A
yB
, lo que significa queA
yB
ocurren juntos más frecuentemente de lo esperado si fueran independientes. - Leverage = 0:
A
yB
son independientes y no hay relación entre ellos. - Leverage < 0: Hay una relación negativa entre
A
yB
, es decir,A
yB
ocurren juntos menos frecuentemente de lo esperado si fueran independientes.
Ejemplo
Imagina que en un supermercado, encontramos una regla de asociación:
Si se compra cerveza (A), también se compran papas fritas (B).
Si el leverage de esta regla es 0.02
, esto significa que la probabilidad de que los clientes compren cerveza y papas fritas juntos es un 2%
mayor de lo que sería si fueran completamente independientes.
Diferencias entre Lift y Leverage
- Lift es un valor relativo: mide cuántas veces es más probable que
A
yB
ocurran juntos en comparación con la probabilidad de que ocurran de manera independiente. - Leverage es un valor absoluto: mide el incremento real en la probabilidad de que
A
yB
ocurran juntos en comparación con la independencia.
¿Por qué es útil el Leverage?
Leverage es útil para identificar combinaciones de artículos o eventos cuya ocurrencia conjunta es significativa. Se utiliza a menudo junto con el lift para dar una mejor comprensión de la relación entre artículos, especialmente en contextos de marketing y análisis de patrones, ya que ayuda a identificar asociaciones que realmente aumentan la probabilidad conjunta de los eventos en comparación con lo que se esperaría al azar.
La convicción es una métrica en las reglas de asociación que mide la fortaleza y dirección de una relación, tomando en cuenta las desviaciones de la independencia entre dos eventos. A diferencia del lift, que mide cuántas veces es más probable que ocurra B
dado que ocurre A
, la convicción se centra en la inversión de la regla y mide qué tan bien la presencia de A
reduce las situaciones donde B
no ocurre.
Fórmula de la Convicción
Para una regla de asociación A ⇒ B
, la convicción se calcula como:
[ \text{Convicción} = \frac{1 – \text{Soporte}(B)}{1 – \text{Confianza}(A ⇒ B)} ]
donde:
- Soporte(B) es la probabilidad de que
B
ocurra en general. - Confianza(A ⇒ B) es la probabilidad de que
B
ocurra dado queA
ha ocurrido.
Interpretación de la Convicción
La convicción se interpreta en función de su valor:
- Convicción = 1: No hay ninguna relación entre
A
yB
. Esto significa queA
no proporciona ninguna información sobre la ocurrencia deB
. - Convicción > 1: Existe una relación positiva entre
A
yB
, lo que indica que cuando ocurreA
, es más probable que ocurraB
. Cuanto mayor es la convicción, más fuerte es la asociación. - Convicción < 1: Esto indicaría una relación negativa entre
A
yB
, aunque esta situación es menos común en la interpretación de reglas de asociación.
La convicción puede interpretarse como una medida de certeza de la regla: un valor más alto indica que, dado que A
ocurre, B
también ocurrirá y viceversa. En otras palabras, indica qué tan “sorprendente” sería encontrar A
sin que ocurra B
.
Ejemplo
Supongamos que estamos analizando patrones de compra y encontramos la regla de asociación:
Si se compra refresco (A), entonces también se compra papas fritas (B).
Si la convicción de esta regla es 1.5
, significa que la presencia de A
reduce en un 50%
la expectativa de ver A
sin B
. En otras palabras, cuando se compra refresco, la probabilidad de no comprar papas fritas disminuye significativamente.
Diferencias entre Convicción y Lift
- Convicción se enfoca en la expectativa inversa de la regla, midiendo cómo
A
reduce las situaciones en las queB
no ocurre. - Lift mide la fuerza de asociación directa entre
A
yB
y cuántas veces es más probable queB
ocurra dadoA
.
¿Por qué es útil la Convicción?
La convicción es especialmente útil cuando queremos identificar relaciones fuertes donde la presencia de A
implica la ausencia improbable de B
. Es una métrica efectiva para reglas de asociación en aplicaciones como sistemas de recomendación, ya que ayuda a identificar pares de elementos donde la presencia de uno implica la probabilidad de aparición del otro.