PERFORMANCE ANALYSIS OF RESTRICTION ENZYMES BASED IN RESULTS OF CLUSTER STABILITY

Autores

  • Carlos Dias Maciel Universidade de São Paulo, Escola de Engenharia de São Carlos
  • Selma Terezinha Milagre Universidade Federal de Goiás, Campus de Catalão

Resumo

ABSTRACT This paper presents an application of a method aiming to compare a performance of the restriction enzymes with the results obtained by the analysis from cluster stability within a Brazilian collection of 119 Bradyrhizobium strains. The stability has been studied as a combination of six restriction enzymes used in the RFLP-PCR analysis and three ribosomal regions using three restriction enzymes per region, each combination forms a pair, thus there are nine pairs: pair 1 (Cfo I 16S), pair 2 (Dde I 16S), pair 3 (Dde I IGS), pair 4 (Hae III IGS), pair 5 (Hae III 23S), pair 6 (Hha I 23S), pair 7 (Hinf I 23S), pair 8 (Msp I 16S), pair 9 (Msp I IGS). The analysis of cluster stability is a way to validate the partitioning of data encountered through any conventional clustering algorithms. The aim is to compare a reference cluster obtained from all of samples with several clusters from subsamples of original dataset. For this study, the sampling ratio was 0.8 and 25 datasets were made from subsamples. The similarity was calculated between pairs of samples of the data and the stability was computed using the whole collection of similarities. For the system analyzed, were generated 511 experiments (all combinations from 1 up to 9 pairs = 9!-1 pairs) and the number of possible clusters varied from 2 to 10. The results indicated that groupings up to 7 clusters were sufficient to achieve the stable result with a reduction of time expense in simulations. The pairs 1 and 2 increased the similarities of the clustering process. The pair 3 increased the similarities of experiments when associated with pairs 7 and 8, and decreased the similarities of the experiments with pair 4. Pair 4 decreased the similarities of the experiments. Keywords: restriction enzymes, cluster stability, Bradyrhizobium. RESUMO Este artigo apresenta a aplicação de um método objetivando comparar o desempenho de enzimas de restrição com os resultados obtidos pela análise de estabilidade de cluster em uma coleção brasileira de 119 estirpes de Bradyrhizobium. A estabilidade foi estudada como uma combinação de seis enzimas de restrição usadas na análise RFLP-PCR e três regiões ribossomais utilizando três enzimas de restrição por região, cada combinação forma um par, então existem nove pares: par 1 (Cfo I 16S), par 2 (Dde I 16S), par 3 (Dde I IGS), par 4 (Hae III IGS), par 5 (Hae III 23S), par 6 (Hha I 23S), par 7 (Hinf I 23S), par 8 (Msp I 16S), par 9 (Msp I IGS). A análise de estabilidade de cluster é uma forma de validar o particionamento dos dados encontrados por meio de qualquer algoritmo de agrupamento convencional. O objetivo é comparar um cluster de referência obtido a partir de todas as amostras com diferentes clusters de subamostras do conjunto original de dados. Para este estudo, a taxa de amostragem foi 0,8 e 25 subamostras. A similaridade foi calculada entre pares de amostras dos dados e a estabilidade foi calculada usando a coleção completa de similaridades. Par o sistema analisado, foram gerados 511 experimentos (todas as combinações de 1 até 9 pares=9!-1 par) e o número de possíveis clusters variou de 2 a 10. Os resultados indicaram que agrupamentos até 7 clusters foram suficientes para alcançar o resultado estável com redução de tempo gasto nas simulações. Os pares 1 e 2 aumentaram as similaridades dos processos de agrupamento. O par 3 aumentou as similaridades dos experimentos quando associados com os pares 7 e 8, e diminuiu as similaridades dos experimentos com o par 4. O par 4 diminuiu as similaridades dos experimentos. Palavras-chave: enzimas de restrição, estabilidade de cluster, Bradyrhizobium.

Downloads

Não há dados estatísticos.

Biografia do Autor

Carlos Dias Maciel, Universidade de São Paulo, Escola de Engenharia de São Carlos

Departamento de Engenharia Elétrica

Selma Terezinha Milagre, Universidade Federal de Goiás, Campus de Catalão

Departamento de Ciências da Computação

Publicado

2008-08-04

Edição

Seção

Sumário