Estoy analizando con TNT una matriz que incluye unos pocos (7/132) caracteres continuos. Ocurre una cosa que, aunque obvia, no la había considerado antes: si uno corre solamente los caracteres discretos, obtiene una cierta cantidad de árboles más cortos, pongamos por caso 20, que difieren de los subóptimos en al menos un paso. Ahora bien, basta con incluir un caracter continuo para que el árbol más corto (generalmente uno sólo!) difiera del primer subóptimo en al menos 0.001 pasos (o más propiamente en un "pasito" que vale, o pesa, una milésima de paso). La diferencia suena insignificante. Realmente tiene sentido quedarse con el árbol más corto, y descartar todos los subóptimos que difieren en menos de un paso? Admito que si nos ponemos en filósofos puristas "alla Kluge" encontremos razones lógicas para preferir ese árbol más corto sobre los otros un cachitito más largos... pero eso implica aceptar que nuestros datos son de una "limpieza" perfecta. Considerando que los muestreos en sistemática están usualmente muy lejos de la perfección deseada por los estadísticos (observamos lo que podemos, a veces cien ejemplares de una especie y un pedacito de ejemplar de la otra), y que somos (casi) humanos, ¿no es esperable un error en los datos que supere una milésima de paso?
Escucho (leo) comentarios...
Saludos!
GHR
Embrapa/Cenargen - PBE
PqEB - Final W-5 Norte
C.P. 02372
Brasília, DF
CEP 70770-900
Brasil