Hola Gabriel, Salvador, y Marcos,
un comentario que empieza con sensitividad y pesos implícitos y después
termina otro lado totalmente distinto (pero relevante).
En referencia a lo que preguntaba Gabriel,
> Tengo una matriz con datos de morfología, muy poco
> robusta a los cambios de concavidad
y lo que comentaban Salvador y Marcos de
>si los resultados son muy variables entre diferentes
>funciones, es mejor tratar de ser conservativos y
>escoger los clados soportados en un rango de valores
>de concavidad (Esta idea me la sugirió Pablo cuando yo
>estaba trabajando en mi trabajo de grado).
Esto último implicaría hacer (de algún modo) el consenso de los árboles
resultantes de concavidades (digamos) de 6 a 15, o algo así. Esto
obviamente puede ser poco resuelto, lo que se puede interpretar, como dijo
Gabriel, como una indicación de que
> los datos no dan para concluir nada concluyente...
Un problema es que la gente tiende a ver al consenso estricto como la única
manera de resumir los resultados. En realidad, puede a veces encontrarse un
monton de estructura común entre varios árboles que producen un consenso
estricto muy poco resuelto; el consenso estricto facilmente se de-resuelve
sólo con que uno o unos pocos taxones tengan ubicaciones alternativas más o
menos diferentes en los árboles.
Entonces, en mi coincidencia con Marcos y Salvador de que es preferible ser
conservativo (en lugar de usar un "criterio de optimalidad" para seleccionar
una concavidad), quiero destacar que es necesario tratar de presentar la
información común a los resultados de las distintas concavidades de la
manera más util posible.
Ojo que aquí no hablo de un resultado "correcto"! Si tenemos un taxon X que
flota en cualquier posicion del arbol, presentar como consenso a ( A B C D E
F G H X ) es totalmente "correcto", así como también lo es el presentar (A
(B (C (D ( E ( F ( G H )))))), indicando con flechitas las posibles
ubicaciones de X en ese consenso podado. Ambas son correctas, pero la
primera no sirve para nada, y la segunda me da info util.
Cuáles son las partes del árbol que querramos mostrar (es decir, la posición
de cuáles taxones estaremos dispuestos a ignorar, a los efectos de calcular
el consenso), bien puede depender de qué problema en particular estemos
tratando de resolver.
TNT provee algunas herramientas para esto (el podado de taxones para
resolver el consenso, los agreement subtrees, las distancias de SPR). Acabo
de agregar otra más (y en realidad ése es el motivo de esta nota: Gabriel me
dio pie a que hablara de esto). Al calcular un consenso podado, TNT permite
ahora que se indique las ramas alternativas del consenso podado donde pueden
ubicarse los taxones no considerados en el cálculo del consenso. Este
agregado se lo terminé de hacer ayer, y lo he subido hace un ratito a la web
(a www.zmuc.dk/public/phylogeny/tnt), en versiones Win y Linux (me falta
todavía subir la versión Mac). En Win, aparece como una opción en el
diálogo de consensos. En comandos, para mostrar la ubicación de x, y y z,
se usa "nelsen / / x y z ;" (así como "nelsen / x y z;" calcula el consenso
estricto sin considerar a x, y o z).
En el caso del taxon X que flotaba, del ejemplo de arriba, esta opción me
indicaría automaticamente el árbol (A (B (C (D ( E ( F ( G H )))))) y
marcaría cada rama de ese árbol donde X puede ir --todas.
Adjunto un archivo ("boton", que para una muestra basta!) con otro ejemplo,
menos trivial, producido con TNT. Lo pueden ver con el edit de DOS, o el
notepad. Muestra primero el consenso considerando todos los taxones, y
luego el árbol indicando las posiciones de ciertos taxones conflictivos (con
letras, a, b, y c). A continuación, les puse los 4 árboles originales, para
que puedan ver como el segundo arbol (el consenso) resume correctamente la
info común a los árboles originales. No es una masa? En fin, yo estoy
re-contento con este chiche nuevo que acabo de ponerle a TNT... será una
pavada (lo programé en sólo un par de días), pero yo lo veo como super util.
Por ejemplo, en la tesis recién defendida de Pancho Prevosti, él hizo varios
análisis separados de distintos data sets (morfo, molecs, continuos). Esto
podrá ayudar a Pancho a presentar un resumen de los resultados de los
distintos análisis...
Por ultimo, volviendo a pesos implicados...
...el rango de concavidades que yo usaría para seleccionar resultados es
algo así como de 6 a 15. La concavidad default de TNT es realmente muy
fuerte; la conservo en 3 sólo por razones históricas. Las concavidades más
allá de 15, para matrices morfológicas, probablemente pasen a producir
resultados muy similares (i.e. un subconjunto de los árboles óptimos bajo
pesos iguales). Por lo tanto, yo diría que 6-15 es un rango razonable.
De todos modos, idealmente, uno también tiene que tomar en cuenta que, para
cada concavidad, debe considerarse el grado de apoyo; por ejemplo,
considerando hipótesis ligeramente subóptimas, obtenidas mediante búsquedas
más o menos buenas pero que en lugar de encontrar los mejores árboles para
esa K, se quedaron 0.01% más arriba...
Bueno, espero que sirva, un abrazo, para todos ...
---------------------------------------------------
Pablo A. Goloboff
INSUE, CONICET, Instituto Miguel Lillo,
Miguel Lillo 205 - 4000 S.M.Tucuman - Argentina
Phone/FAX (+54381)-4232965