En el trabajo de Lee 2001 aparecen los no informativos como causantes de variaciones espúreas en los niveles de significación. Fíjense que este efecto aparece igual cuando los caracteres son informativos. Simplemente duplicando un terminal, por ejemplo así:
X 0000000000 0000000000 0000000000 0000000000 0000000000 0000000000
A 1111111000 1110000000 0000000000 0000000000 0000000000 0000000000
B 1111111111 1111111111 0000000000 0000000000 0000000000 0000000000
C 0000000111 0001111111 1111111111 1111111111 1111111111 1111111111
D 0000000111 0001111111 1111111111 1111111111 1111111111 1111111111
----A----- -----B-------------------------------------------------
produce el mismo problema, que ya no se puede curar eliminando caracteres no informativos ("informatividad" es un término un poco relativo, no?).
Algunas líneas principales que discutimos fueron:
a. La medida ILD mide incongruencia?
b. El test de ILD detecta incongruencia?
c. Se debe aplicar una medida de congruencia para decidir si combinar o no datos?
d. Para qué podríamos usar una medida de incongruencia?
Saludos, Martín
División Aracnología
Museo Argentino de Ciencias Naturales
Av. Angel Gallardo 470
C1405DJR Buenos Aires
Argentina
tel +54 11 4982-8370 int. 168
fax +54 11 4982-4494