Categoricos Similaridad y Cohesion
June 29, 2023 | Author: Anonymous | Category: N/A
Short Description
Download Categoricos Similaridad y Cohesion...
Description
Los nodos signifcatvos de un árbol de similaridad son aquellos correspondienes a una clasifcación compatble lo mejor posible con los valores y la calidad de los valores de similaridad. Defnición 1 Se llama pre orden inicial y globalΩ sobre A × A , al preorden inducido por la aplicación similaridad Ssobre A × A .
Gs ( Ω )={(( a , b ) ; ( c , d ))∨ s ( a , b )< s ( c , d ) } Llamamos SΠ k al conjuno de pares separados al nivelk y RΠ k al conjuno de pares que ya se han reunido en el nivel k . La inersección de los conjunos Gs ( Ω ) ∩ [ SΠ k × RΠ k ] esá ormada por los pares de parejas que en la alura k respean el preorden inicial y que además la primera pareja se encuenra separada mienras que la segunda esá reunida. Por ejemplo, si
(( a , b ) , ( c , d )) ∈ G s ( Ω) ∩ [ S Π k × R Π k ] se tene que s ( a ,b )< s ( c , d ) y que las variables (a, b) se encuenran separadas y( c , d )reunidas al nivel k . No obsane, el cardinal de ese conjuno varía en unción de la alura k . Al cardinal de ¿
¿
Gs ( Ω ) ∩ [ SΠ k × RΠ k ] se le asocia el índice aleaorio G s ( Ω ) ∩ [ SΠ k × RΠ k ] ,dondeΩ es un pre orden aleaorio proviso de una probabilidad uniorme. Ese índice tene [8]: por esperanza:
por varianza:
1 s r ,y 2 k k
s k r k ( s k + r k + 1) 12
siendo sk =Card [ SΠ k ] y r k =Card [ RΠ k ]. El índice cenrado se defne como:
1 Card [ Gs ( Ω ) ∩[ SΠ k × RΠ k ] ]− 2 sk r k S ( Ω , k )= s k r k ( s k + r k + 1 ) 12 Defnición 2 Se llama nivel signifcatvo a odo nivel que corresponde a un máximo local de
S ( Ω , k ) durane la consrucción de la jerarquía. Se llama nodo signifcatvo a cualquier nodo ormado a un nivel que corresponde con un máximo local de v ( Ω , k ) donde:
v ( Ω , k )= )= S ( Ω , k )− S ( Ω , k − 1 ) . CHIC deermina los nodos signifcatvos para la clasifcación obenida, los cuales se muesran gráfcamene con razos gruesos y rojos (Figura 3.1). Para el ejemplo desarrollado, aparecen los nodos signifcatvos en los niveles 1 y 3. Examinemos como se deerminaron esos nodos, paraello utlizaremos las siguienes noaciones:
t = Card ( A ) , I k ={ j ∨ p j ∈ R Π k }, p j son los elemenos del preorden inicial Ω, con j =1 , ... , m con m= Card ( Ω ) , Pl={ p j ∈ Ω ∨s ( p j )= sl }, donde sl es un valor cualquiera que puede omar el índice de similaridad y l =1 , ... , d , siendod la cantdad de valores dierenes que oma ese índice, k
f i i = Card [ p j ∨ j ∄ I k , j < i , s ( p j)= s ( pi)] . Con el propósio de modelar la exracción y represenación de reglas deductvas no siméricas “si a enonces casi b” Al igual que en el análisis clasifcaorio, en el ASI se conempla un conjuno I compueso de n individuos y un conjuno A ormado por p aribuos A ={a 1 , a 2 , ... , ap }, además se supone:
Ai ={ x ∈ I ∨ai ( x )=1 } ,Card ( I )= n,Card ( A i)= nai y Ca Carrd ( Ai )=n ai . ~
En ese caso la variable aleaoria de inerés es Card ( X i ∩ X j ) , que hace reerencia al número de individuos que tenen el aribuo ai pero no el a j.
La cohesión aparece como una medida de la calidad implicatva de la R-regla. El propósio es averiguar R-reglas R ' → R ' ' con con una sólida relación implicatva enre los elemenos de R ' y y los de R ´ ´ . Por ejemplo, es inherene componer la regla ( a 1 → a2) → ( a 3 → a4 ) si las relaciones implicatvas a 1 → a3 , a1 → a4 , a 2 → a3 y a 2 → a4 son lo basane signifcatvas. Para medir esa calidad se planea conrasar con el desorden de una experiencia aleaoria, para ello se propone la Enropía. Se pare de considerar una regla a i → a j de orden 1 y de defnir la variable aleaoria Y como indicatvo del suceso X ai ∧ a j ≥ n ai ∧ a´ j , luego:
P r [ Y =1 ] = P r [ X a ∧ a ≥ na ∧ ´a ] =φ ( ai , a j ) i
j
i
j
P r [ Y =1 ] = 1−φ ( ai , a j) Enonces se defne la Enropía de ese experimeno como:
E =− p log2 p −(1 − p ) log 2 ( 1− p ) ,conp =φ ( ai , a j ) . (Ten Lopez, 2020)
View more...
Comments