CAPÍTULO 2

CLASSIFICAÇÃO DE CROMOSSOMOS

2.1 - Conceitos Básicos

A análise microscópica dos cromossomos humanos visa o pareamento dos mesmos para a avaliação de sua integridade estrutural. O estudo microscópico é demorado e exige extrema experiência do profissional, constituindo-se em um trabalho artesanal.

O cariotipo é o processo pelo qual os cromossomos em uma célula, preparada adequadamente, são identificados e alocados para uma determinada classe a qual presumivelmente pertencem. Esta é uma importante tarefa clínica, pois a identificação de anormalidades nos cromossomos de uma particular classe pode ser detectada, e assim, feito o diagnóstico de certas síndromes clínicas (Tso et al, 1991). Esta classificação pela inspeção (cariotipagem) é uma tarefa importante e trabalhosa em diagnóstico pré-natal de anormalidades genéticas e no diagnóstico e monitoramento do câncer (Errington, 1993).

Para formar um cariotipo de 46 cromossomos de uma célula humana normal, algumas características dos cromossomos (comprimento, posição do centrômero, padrão de bandas, etc.) devem ser mensuradas de maneira que cada cromossomo possa ser atribuído a uma das 24 classes. São 22 pares de cromossomas idênticos (homólogos) e um par sexual designado pelas letras X e Y (um par de cromossoma X no caso de feminino e um cromossoma X e um Y no caso de masculino).

2.1.1 - Alguns Aspectos Biológicos

Cromossomos estão presentes em todas as células nucleadas de todos os organismos vivos, levando informações genéticas que são usadas como mensageiros na reprodução das células e organismos. Seu nome é derivado do Grego "chroma" para cor e "soma" para corpo, isto porque elas podem ser fixadas com certas tinturas. Para melhor entendimento de sua função de mensageiro, um esboço do processo reprodutivo de células e organismos será apresentado. A reprodução das células serve para dois importantes propósitos:

  1. Crescimento e manutenção dos organismos vivos gerando novas células através da divisão, chamada mitóse, também derivada do Grego.
  2. Reprodução dos organismos como um todo pela geração de células reprodutivas especializadas através da redução da divisão, chamada meiose, da palavra Grega redução. Devido a fertilização de duas células reprodutivas que se unim e formam um célula somática, o número de cromossomas deve ser primeiro reduzido para metade do número original.

Em nosso estudo, as células reprodutivas não serão alvo de estudo.

O Ciclo Mitótico da Célula

O período entre a geração de uma célula pela mitóse e o momento dela própria dividir é chamado ciclo mitótico. Este ciclo é dividido em dois distintos estágios ou fases, como ilustrado na Figura 2.1. Mitóse, ou fase-M toma somente na ordem de uma hora, uma pequena fração do tempo total do ciclo mitótico. O tempo remanescente chama-se interfase; ele é subdividido nos períodos G1, S (síntese) e G2. Durante a fase S o material genético em cada cromossomo é replicado, resultando em um núcleo em G2 com duplicação da quantia de material genético de G1.

A síntese segue um padrão característico para cada cromossomo, sendo que para o sexo feminino um dos dois cromossomas X, chamado X inativo, é sempre o último a completar a replicação (Vossepoel, 1987). O comprimento dos períodos S e G2 são mais constantes para um dado tipo de célula. Para linfócitos humanos, a fase S gasta aproximadamente 7 horas e, a G2, 5 horas (Vossopoel, 1987). O comprimento do período G1 apresenta grande variação, também para células de mesmo tipo sobre as mesmas circunstâncias.

Na metáfase os cromossomas tornando-se totalmente condensados ou contraídos, e agregados com fibras para o fuso. Nesta fase, cada cromossoma mostra uma constricção chamada centrômero. O centrômero é o local de agregação das fibras do fuso.

Figura 2.1 - Diagrama do ciclo mitótico da célula: M = mitóse ou fase M, G1 = período 1, S = período da síntese, e G2 = período 2 (Vossopoel, 1987).

Os distintos estágios da mitóse são ilustrados na Figura 2.2. A fase M inicia com a profase, onde os cromossomas são muito longos, finos, emaranhados e progressivamente espessam-se, e assim tornam-se visíveis. No núcleo o fuso mitótico começa a se formar. Em seguida, a membrana nuclear começa a disaparecer, e os cromossomas movem-se em direcão ao plano equatorial da célula.

Na anafase os centrômeros dividem-se, e as irmãs cromatides separam, colocadas aparte pelas fibras do fuso que conectam os centrômeros com os polos das células. Como cada cromatide separada se tornará um novo cromossoma durante a fase S, qualquer erro neste processo de separacão, chamado não-disjunção, resultará em um célula irmã eneuploid, isto é, com um número errado de cromossomas.

A mitóse termina com a telofase, que é na verdade a inversa da profase, quando as cromatides alcançam o pólo da célula, e tornam-se gradualmente alongadas e menos distintas novamente.

Figura 2.2 - Os distintos estágios da mitóse: Por simplicidade, somente 2 dos 46 cromossomos são mostrados (Vossopoel, 1987).

2.1.2 - Preparação Da Amostra

Do ponto de vista citogenético, o principal interesse na célula em um específico estágio da mitóse, é a metáfase, e muito menos extensivo, a profase, porque somente nestes estágios os cromossomas são visíveis como entidades separadas e podem passar informação (Philip et al, 1983). Desta forma, o objetivo é tentar o maior número de metáfases pela intervenção no ciclo mitótico normal da célula, através de um processo laboratorial chamado cultura. Além disso, é contrastar o cromossoma para que detalhes possam ser visualizados para fins de diagnóstico.

Em 1968 Casperson et al, publicaram seu primerio artigo descrevendo o uso de mostarda quinacrine para tingir cromossomos, e desde então se iniciou uma nova era de cromossomos com banda. Em poucos anos novos métodos foram desenvolvidos e várias técnicas foram introduzidas (Sumner, 1990).

Por mais de 20 anos o grande trabalho dos citogenecistas tem sido a preparação da metáfase de cromossomos com banda, e o método trypsin-Giemsa (banda G) tem-se tornado prática padrão em muitos laboratórios citogenéticos (Paut, 1993). Este método é um dos mais úteis na detecção de anormalidades cromossômicas porque a distribuição de bandas claras e escuras é característica para cada par cromossômico, permitindo assim, a perfeita classificação dos mesmos (Pereira, 1988). Métodos mais recentes tem sido criados, como é o caso da fluorescence in situ hybridization (FISH), o qual permite a rápida visualização de sondas de DNA hibridizadas para sequências de DNA na metáfase ou interfase dos cromossomos. Isto tem melhorado sensivelmente o nível de resolução possível na metáfase do cromossomo e também tem tornado possível identificar precisamente cromossomos específicos na interfase (Paut, 1993).

Uma das principais utilizações do exame citogenético é o diagnóstico pré-natal. A metáfase de cromossomos com banda são preparados para diagnóstico pré-natal de culturas do fluído aminiótico, chorionic villi, ou sangue fetal. A amostra com líquido aminiótico deve ser feita aproximadamente 7 dias após a cultura. Já o chorionic villi pode ser preparada diretamente para análise citogenética aproximadamente 5 horas após a cultura. Na maioria das vezes o que ocorre, infelizmente, é que a morfologia cromossômica e o índice mitótico são pobres na resolução em preparações rápidas. Células de sangue fetal são cultivadas na presença de um mitogene (phytohemaglutinin) para um mínimo de 48 horas antes de um índice mitótico satisfatório ser obtido.

O procedimento de cultura é similar para os três tipos de células. A divisão da célula é primeiramente bloqueada pela exposição em uma porção mitótica (Colcemid a 0,05 - 0,1 mg/ml) seguida pelo tratamento das células com uma solução hypotônica (0,075 M Kcl ou 0,8% citrato de sódio) para inchar (ondular) o núcleo da célula, e um ácido para fixar a proteína básica da cromatina.

A metáfase do núcleo é fisicamente rompida pingando células fixadas nas lâminas (slides) e/ou dando um "spray" de ar na lâmina ou cobrindo-as em alta humidade. As lâminas são aquecidas (por 6 horas a 45º C) e então banhadas em uma solução de trypsina (0,4 mg/ml; pH 7,2) e tingida para brilho no campo microscópico (Giemsa ou Wright). O padrão de banda lateral produzido, banda-G, refletem o estágio de condensação dos cromossomos em cada extensão particular. Quanto mais longo o cromossomo, maior o número de bandas que podem ser visualizadas (Paut, 1993).

2.1.3 - Metáfase E Cariotipo

Concluída a preparação da amostra, o único interesse na análise é das células da metáfase, que mesmo sobre circunstâncias ideais, formam uma pequena minoria das células presentes. O mais importante é achar todas estas células para posteriormente formar o cariotipo.

Metáfase

No procedimento manual a lâmina é rastreada com baixa magnitude (entre 16 e 25 vezes) sobre o miscroscópio. O número de campos rastreado desta forma é proporcional a magnitude quadrada vezes a área da lâmina, dividida pela área do diafragma ocular. O fator de proporcionalidade aparece da necessidade de se ter alguma sobreposição no campo circular. Na prática, 2 será uma boa estimativa para este fator (Vossepoel, 1987). Geralmente o número de campos envolvidos será na ordem de um a dois mil.

Quando propriamente focado, a profase e metáfase são facilmente visualizadas, porque elas mostram um padrão muito característico de um cluster de poucas duzias de objetos. Os cromossomas geralmente diferem de uma célula para outra tanto em tamanho quanto em forma. Uma vez a metáfase achada, a analizabilidade é julgada pelos vários graus de contração e alongamento dos cromossomas, e o número estimado de cromossomas que se tocam e se sobrepõem. Deve também ser notado, contudo, que analizabilidade depende dos requerimentos necessários para a(s) subsequente(s) análise(s). Se o objetivo é apenas verificar anormalidade numérica, a qualidade da metáfase é suficiente se os cromossomas são contáveis. Se o objetivo é analizar anormalidades estruturais, em alguns casos é suficiente que a metáfase seja suficiente para determinar o cariotipo (ou cariograma). Em outros casos, contudo, uma harmonia na disposição do cromossomas quanto a comprimento, forma e disposição tornam-se importantes. Algumas vezes, uma completa ausência de cromossomos se tocando ou sobrepondo é requerido. Se a metáfase achada é aprovada, em muitos casos, a análise envolve mudar para uma alta magnitude (100 vezes). É pratica guardar as coordenadas da lâmina da metáfase em estudo, caso seja necessário um estudo posterior. A Figura 2.3 mostra uma metáfase com o seu respectivo cariotipo/cariograma.

Cariotipo

Cada espécie animal tem um cromossoma complemento, caracteristico em número e forma, que é chamado as espécies karyotype. A palavra karyotype (cariotipo em português), derivada da palavra Grega "karyon" para nó e "typos" para forma, é algumas vezes também usada para representação visual dos cromossomos fixados, arranjados em ordem descendente do comprimento. Talvez um termo mais preciso seria cariograma. Como neste estudo somente cromossomas humanos são de interesse, a seguinte descrição será restringida para o cariotipo humano.

Essencialmente o processo de cariotipagem consiste dos seguintes passos:

Deve ser notado que o cariotipo é somente necessário para análise de aberrações estruturais. Contudo, os passos de localizar, isolar e contar são sempre necessários, mesmo que se esteja somente interessado em anormalidade numérica. Geralmente, tem-se aplicado um protocolo para distintos propósitos de diagnóstico, como usar 2 metáfases para cariotipagem e 15 para contagem dos cromossomos, isto para o diagnóstico pré- e pós-natal.

Figura 2.3 - Metáfase de uma célula humana e seu respectivo cariograma (Sumner, 1990).

2.2 - Automação Citogenética

Durante os últimos 25 anos, várias rotinas e experimentos de classificação automática de cromossomos (banda-G) tem sido estudados. Também deve ser lembrado, que sómente em 1956 Tijo & Levan demonstraram que o número correto de cromossomos em uma metáfase de cromossomo humano normal consiste de 46 cromossomos (Sumner, 1990). A cariotipagem automática (classificação) foi um dos primeiros problemas em análise de imagem digital e reconhecimento de padrão pictorial (van Vliet et al, 1990).

Cariotipo dos cromossomos assistido pelo computador para análise dos cromossomos tem alcançado o estágio onde muitos laboratórios aceitam que é tanto clinicamente útil quanto economicamente justificável (Piper & Granum, 1989). Sistemas comerciais já se encontram hoje disponíveis, proporcionando facilidades gráficas interativas para a classificação automática pelo computador, embora havendo a necessidade de interação com um operador. Estes sistemas geralmente procedem de forma similar. Cada célula é localizada para análise, digitalizada em alta resolução, e uma segmentação inicial é feita, geralmente por uma rotina do limiar do nível de cinza. A tarefa de segmentação, algumas vezes deixa alguns pontos não resolvidos, principalmente de cromossomos que se tocam ou sobrepostos, necessitando assim, uma segmentação interativa. Características numéricas são então medidas, geralmente incluindo o tamanho (área ou comprimento), posição do centrômero e parâmetros que descrevam o padrão de bandas dos cromossomos (Desinov, 1994; Errington, 1993; Graham, 1987; Groen et al, 1989; Keret, 1991; Lundsteen, 1986 e 1981; van Vliet et al, 1990).

2.2.1 - Aquisição Da Imagem

O primeiro passo na automação citogenética é a captura da imagem pelo computador para posterior processamento. A imagem não pode ser colocada diretamente no computador para análise, pois o computador trabalha mais com dados numéricos do que com dados ilustrativos. Assim, uma imagem deve ser convertida para forma numérica antes do processamento. Este processo de conversão é chamado digitalização, onde a imagem é dividida em pequenas regiões chamadas picture elements, ou pixels. O esquema de subdivisão mais comum é o quadro de amostragem (geralmente retangular) apresentado por (Castleman, 1979), mostrado na Figura 2.4. A imagem é dividida em linhas horizontais feitas de pixels adjacentes. Em cada localização de pixel a claridade é medida e quantificada, este processo gera um número inteiro em cada pixel representando a claridade ou escuridão da imagem naquele ponto. Quando isto tiver sido feito para todos os pixels, a imagem é representada em uma matriz de inteiros, onde cada pixel tem a localização ou endereço (par indicando a linha e a coluna) e um valor inteiro chamado nível de cinza. Esta matriz de dados digitais é agora candidata para processamento no computador.

Figura 2.4 - Digitalizando uma imagem (Castleman, 1979).

A digitalização é feita durante a aquisição de imagem, que é o primeiro passo no processamento de uma imagem. Dois elementos são requeridos para adquirir imagens digitais. O primeiro é um dispositivo físico (sensor) que seja sensitivo a bandas no spectrum de energia eletromagnética (tais como raio-X, ultravioleta, visual, ou infravermelho) e que produza um sinal elétrico de saída proporcional ao nível de energia percebida. O segundo chamado digitalizador, é um dispositivo para converter o sinal elétrico do sensor em uma forma digital (Gonzalez, 1992).

Um tipo importante e altamente versátil de digitalizador de imagem é a camera digitalizadora, que tem um sistema de lentes e pode digitalizar uma imagem ou objeto para ela apresentado. Tal dispositivo pode não sómente digitalizar objetos físicos mas também outras imagens tais como filme fotográfico. Um restrito, mas não menos importante, tipo de digitalizador de imagens é o scanner (esquadrinhador ou rastreador) de imagens de filmes ou fotos. "Scanner" de filmes pode digitalizar uma imagem de um objeto sómente depois dela ter sido fotografada por uma camera ou que esteja na forma de uma gravura. Recentemente, uma nova técnica de digitalização de imagem tem sido usada. Esta técnica usa uma camera fotográfica acoplada ao computador, e quando um objeto ou cena é fotografada um software específico se encarrega de fazer a digitalização automática. Esta técnica parece ser promissora e ter seu lugar garantido em algumas aplicações, especialmente aquelas que utilizam imagens microscópicas.

Três bases de dados de imagens digitalizadas de cromossomos já se tornaram padrão para estudos e testes comparativos. Elas utilizam diferentes abordagens para aquisição da imagem. A primeira base de dados foi coletada no Rigshospitalet, Copenhagen em 1976-1978 e consiste de 180 metáfases de células de sangue periférico, padrão banda-G (trypsina-Leishmann). Os cromossomos nesta base foram fotografados e individualmente digitalizados de negativos de fotografia em um "grid" que estava paralelo com o eixo do cromossomo, usando um microdensitômetro. O tamanho do pixel foi 0,125 mm do cromossomo original (Piper, 1989).

A segunda base foi obtida no MRC, Edinburgh em 1984, contém 125 células de sangue periférico masculino de amostras rotineiras do laboratório clínico, banda-G usando a técnica ASG (Giensa salinoacético). As células de Edinburgh foram digitalizadas diretamente das lâminas do microscópio, sendo 0,125 mm o tamanho do pixel, usando uma camera de TV Bosch "chalnicon" (Piper, 1989).

A terceira base de dados foi obtida no Jeferson Medical College, Philadelphia, em 1987, e contém 130 células chorionic villus banda-Giemsa (culturas de 24 hs). As amostras foram preparadas rotineiramente no laboratório sendo digitalizadas e analisadas em um Cytoscan CS (Sistema de Reconhecimento de Imagem, Warrington, UK). Este Cytoscan CS usa um scanner de matriz CCD (charge-coupled device) linear esquadrilhado mecanicamente com um espaço de pixel original de 0,1 mm por 0,13 mm, convertido por software para 0,13 mm quadrado de espaçamento (Piper, 1989).

2.2.2 - Segmentação Da Imagem

A segmentação da imagem é um passo importante no processo de automação citogenética e talvez uma das tarefas mais difíceis na análise de imagens (Castleman, 1979; Gonzalez, 1992). Vários algorítmos e técnicas de segmentação da imagem tem sido usados, a escolha de uma técnica de segmentação sobre outra é feita considerando as características peculiares do problema em consideração.

Os algorítmos de segmentação de imagens monocromáticas geralmente são baseados em duas propriedades básicas dos valores de nível de cinza: descontinuidade e similaridade. Descontinuidade, é o processo pelo qual uma imagem é particionada baseada na mudança abrupta do nível de cinza. A principal área de interesse dentro desta categoria é a detecção de pontos isolados e detecção de linhas e contornos (edges) na imagem. Na segunda categoria, similaridade, a principal abordagem é baseada na classificação de pixels (segmentação por limiar (thresholding), crescimento de regiões (region growing) e unir e separar regiões (region splitting and merging) (Nalva, 1993; Gonzalez, 1992).

A segmentação baseada num limiar, geralmente referenciado como thresholding, é particularmente útil em segmentação de objetos sólidos contidos na cena sobre um constraste de fundo bem definido. É computacionalmente simples e nunca falha em definir regiões disjuntas com fronteiras bem conectadas (Castleman, 1979). A regra de utilização do limiar tem como característica determinar um valor limite (limiar), e atribuir todos os pixels com nível de cinza igual ou superior ao valor do limiar pertencentes ao objeto, e todos os pixels com nível de cinza abaixo do limiar não pertencentes ao objeto. Este limiar pode ser global ou adaptativo, sendo este último usado principalmente quando o nível de cinza do fundo não é constante e o contraste do objeto varia dentro da imagem. Em imagens microscópicas, o nível de cinza do fundo varia devido a não uniformidade da iluminação, sendo que na imagem de cromossomos o contraste pode variar de cromossomo para cromossomo (Castleman, 1979). Correção de sombreado ("shading correction") pode ser uma boa opção para remover possíveis efeitos associados com não-uniformidade devido a sensibilidade da camera ou condições de iluminação (van Vliet et al, 1990).

A seleção do valor do limiar pode ser feita de mais de uma maneira, Castleman (1979) referencia a técnica do gradiente médio da fronteira e o uso do histograma de nível de cinza. A técnica "Thresholding" para segmentação da imagem foi usada nas três bases de dados anteriormente descritas (Copenhagen, Edinburgh e Philadelphia), utilizadas neste estudo que serão mais detalhadas no capítulo 4, para separar os cromossomos (Piper, 1989). Alguns sistemas de classificação automática disponíveis no mercado também tem usado este algorítmo de segmentação como é o caso do Athena, desenvolvido por Mayal e seu grupo em 1990, Magiscan 2, desenvolvido pela Joyce-Loebl, Gateshed, U.K, Cytoscan CS (sistema de reconhecimento de imagem, Warrington, UK), ScanArray, Sistema de análise de imagens, desenvolvido por Galai, Migdal Haemek, Israel.

Após a segmentação automática dos cromossomos, comumente é feita uma interação manual, que pode ser feita usando "lightpen", "mouse" ou "trackball". O objetivo é permitir a correção de possíveis falhas na segmentação decorrentes de cromossomos que se tocam ou cromossomos sobrepostos. Esta tem sido uma técnica usada em diversos estudos (Desinov, 1994; Graham, 1987; Lundsteen, 1986; Piper, 1989 ; van Vliet et al, 1990).

Finalizada a digitalização da imagem é feita a respectiva segmentação, individualmente, os cromossomos estarão disponíveis para a extração das características que serão descritas no ítem a seguir.

2.2.3 - Escolha Das Características

O problema de classificação, mais precisamente o de reconhecimento de padrões está intimamente ligado a tarefa de selecionar quais das muitas características (features) devem ser medidas e apresentadas para o classificador (Castleman, 1979). Piper (1989) comenta que existem 28 características disponíveis nos cromossomos, e que é impraticável fazer uma busca exaustiva para um subconjunto ótimo. Segundo Pereira (1988) os critérios mais usados para identificação dos cromossomos pelos citogenicistas são: comprimento, posição do centrômero, características autorradiográficas, localização das constriccões secundárias e padrão de bandas.

A extração das características comumente toma tempo, pois muitas vezes um pré-processamento se torna necessário, no sentido de melhorar as condições da imagem para a extração. Este é o caso da determinação do eixo principal do cromossomo para medir o comprimento do mesmo. Os cromossomos nem sempre estão dispostos de forma própria, ou seja, eles aparecem tortos, ou em posições que não são adequadas para a extração das características. Em alguns estudos os cromossomos severamente tortos e sobrepostos foram retirados a título de praticidade, porém, em outros estudos este problema tem sido largamente explorado, uma vez que em sistemas automáticos esta é uma condição normal. Assim, um processamento prévio se torna necessário, no sentido de esticar (desentortar) e rotacionar o cromossomo (Groen et al, 1989). A grande massa de algorítmos de processamento de imagens é utilizada nesta fase de extração de características.

As características mais utilizadas na classificação automática de cromossomos são o comprimento e posição do centrômero (ou índice centromérico), sendo que com estas duas características é possível separar os cromossomos em 7 grupos, também chamado grupo de Denver (Graham, 1987). Uma outra característica, talvez a mais explorada desde o advento da preparação de amostras de cromossomos com bandas, é o padrão de banda do cromossomo ao longo do eixo longitudinal. Estas três características tem sido a base da grande maioria dos estudos desenvolvidos nas duas últimas décadas (Desinov, 1994; Errington, 1993; Graham, 1987; Groen et al, 1989; Keret, 1991; Lundsteen, 1986 e 1981; van Vliet et al, 1990).

O comprimento do cromossomo é medido ao longo do eixo longitudinal. Cada cromossomo em seu grupo tem um comprimento dentro de cada célula (metáfase), sendo que a variação depende da preparação da amostra. Isto faz com que seja necessário a normalização desta medida. O centrômero é um ponto de constricção primária dos cromossomos que a divide em duas partes, chamados braço curto p e braço longo q. A relação entre p e q é chamada índice centromérico, ou seja, metacêntricos quando os dois braços tem praticamente o mesmo comprimento (p/q = 1); submetacênctricos quando a relação p/q é aproxidamente 0.5, ou seja, os comprimentos dos dois braços são diferentes, e acrocêntricos quando o centrômero está na extremidade do cromossomo (p/q = 0.1). Variações na medição do índice centromérico são feitas, utilizando-se também a razão da área do braço curto e do braço longo, ou a razão da densidade (p/q) a nível de pixels. O padrão de bandas, ou simplesmente bandeamento, é a variação de tonalidade ao longo do eixo principal do cromossomo, formando listras, de propriedades tingidas. Esta variação de propriedades tingidas é normalmente independente de qualquer variação estrutural imediatamente óbvia (Sumner, 1990).

Devido a quantidade de técnicas utilizadas para a extração de cada uma das características, é conveniente tratá-las separadamente.

Determinação do Comprimento

A determinação do comprimento do cromossomo pode ser feita de várias maneiras. Uma das técnicas que tem sido mais utilizada é a determinação do eixo longitudinal do cromossomo, uma vez que, se este eixo é determinado, o comprimento torna-se imediato. Várias técnicas tem sido propostas, como "curve-fitting" paramétrica e não-paramétrica revisadas por Piper (1980). Técnicas não-paramétricas que acham o eixo por montagem local podem ser mais poderosas no trato com cromossomos tortos (Piper, 1989). Groen et al (1989), tem usado um método geral para construir um eixo linear "piecewise", enquanto Piper (1989) optou por uma abordagem de dois estágios, em que um método linear piecewise simples é usado primeiro para cromossomos retos ou ligeiramente tortos. Caso existam cromossomos severamente tortos. um método mais complexo é aplicado. A Figura 2.5 mostra um procedimento usado para de determinar o eixo longitudinal, o respectivo comprimento e perfil de bandas.

Determinação do Centrômero

A determinação da posição do centrômero é outro importante passo no processamento da imagem do cromossomo. Para cromossomos sem padrão de bandas o centrômero pode ser achado diretamente através da análise do perfil de densidade ao longo do eixo principal do cromossomo; contudo, para cromossomos com bandas esta análise não pode ser usada, uma vez que o perfil de densidade será dominado pelas bandas. Piper (1989) propõe duas abordagens, uma utilizando o perfil da largura do cromossomo, e a outra analisando a curvatura da fronteira do cromossomo (máxima concavidade no contorno do cromossomo).

Figura 2.5 - Estágios do cálculo do eixo e determinação do perfil de nível de cinza (Piper, 1989).

Determinação do Padrão de Bandas

O padrão de bandas é a característica seguramente mais explorada, possibilitando várias combinações no seu processo de classificação. Basicamente o perfil da densidade média ao longo do cromossomo tem-se tornado uma prática comum sendo utilizado em vários estudos (Errington, 1993; Graham, 1987; Groen et al, 1989; Lundsteen, 1986 e 1981; Martin et al, 1990; Piper, 1989).

O sistema Athena, desenvolvido por Mayall e seu grupo (Mayall et al, 1990) utiliza uma abordagem, considerando como bandas regiões escuras dos cromossomos. Assim, utilizam um limiar baseado na densidade ótica para selecionar partes escuras como regiões potencialmente referentes a uma banda. Para cada banda detectada, parâmetros são calculados, tais como: área, densidade ótica total, início, fim e posição média relativa ao topo. Destas informações um subconjunto de bandas é extraída e usada para classificação, como: banda mais escura no cromossomo; banda tendo a maior área; banda distal no braço curto; banda distal no braço longo, e banda mais próxima do centrômero no braço longo. Convém salientar que este estudo concentra-se no processo de classificação, portanto usalisa-se características já determinadas por sistemas reconhecidos.

2.2.4 - Classificadores

Este último passo, talvez o mais importante, utiliza as características previamente extraídas para atribuir cada cromossomo da metáfase a uma das 24 classes, formando assim o cariotipo. Vários Classificadores Paramétricos e Não-Paramétricos, Algorítmos de Busca em Grafos, Sequências de Transição de Bandas, Modelos de Redes de Markov, Algorítmos de Transportes e mais recentemente Redes Neuronais Artificiais tem sido estudado e propostas para a classificação dos cromossomos.

A seguir apresentamos, na Tabela 2.1, um resumo das várias abordagens utilizadas para a classificação, apresentado os autores, ano de apresentação dos trabalhos, o classificador utilizado, as caracterísitcas usadas e a origem dos dados.

Tabela 2.1 - Apresentação de algumas abordagens, relacionando autor, classificadores utilizados características usadas e origem dos dados.

Não tratou-se os resultados de taxa de erro de classificação de cada uma das abordagens, pois cada sistema utiliza parâmetros diferentes de tratamento com os dados. Ou seja, determinado sistema utiliza uma abordagem totalmente automática (podendo ocorrer erros na determinação do centrômero, ou na segmentação) afetando assim a taxa final de classificação. Outros utilizam uma abordagem semi-automática onde ocorre a interação com o usuário, permitindo a correção, por exemplo, de erros de extração de características o que irá contribuir na classificação.

Granlund (1976) usou descritores ou coeficientes de Fourier extraídos do perfil de densidade do cromossomo como características para um classificador de mínima distância. Em seu artigo ele comenta que testou duas maneiras, uma utilizando distância Eucliadiana ponderada, outra usando representação logarítmica para a variância, sendo que a primeira apresentou melhores resultados, obtendo uma precisão de 96% para os seus dados.

O primeiro sistema comercialmente disponível, desenvolvido por Kenneth Castleman e seu grupo do "Jet Propulsion Laboratory" do Instituto de Technologia da Califórnia (JET/CALTECH) em 1975, utilizou o comprimento e o índice centromérico como características e um classificador Bayesiano. Convém ressaltar que estes classificadores geralmente apresentam duas etapas, uma de treinamento que pode ser supervisionado e não-supervisionado, e uma de classificação propriamente dita ou teste. A fase de treinamento é usada para a determinação dos parâmetros da função densidade de probabilidade (média, variância, etc.).

Os métodos probabilísticos com classificadores paramétricos e não-paramétricos sem dúvida tiveram grande enfase nos primeiros estudos. Como pode ser observado na Tabela 2.1, existem diferentes possíveis combinações de características, possibilitando assim usar vários modelos, como ocorreu nos estudos de Lundsteen (1981) e (1986), Graham (1987), Piper (1989), Groen (1989), van Vliet (1990), Kirby (1993) e Johnston (1993).

A tecnologia de redes neuronais artificiais é relativamente nova quando comparada com a clássica abordagem probabilística, principalmente em tarefas de classificação. Este é um dos motivos de aparecer apenas dois trabalhos relatados na literatura de classificação de cromossomos. Erington e Graham em 1993 usaram uma rede MLP (Multi-Layer Perceptron) treinada com uma BP (Backpropagation) apresentando resultados excelentes quando comparado com métodos convencionais.

A dificuldade em usar um BP é o tempo requerido para treinar a rede. Isto ocorre porque as tarefas de classificação de cromossomos utilizam-se de grandes bases de dados com espaços de entrada e saída de alta dimensão, sendo que o tempo computacional para treinar uma BP pode levar muitas horas. Além disso, devido ao processo de treinamento, pode não haver convergência sendo um problema a ser enfrentado. A outra abordagem usando RNA foi o trabalho de Sweeney e outros em 1993 que usou uma Probabilistic Neural Network (PNN). As características usadas neste estudo foram 30, sendo 28 apresentadas por Piper (1989) e mais 2 características apresentadas mais recentemente. Assim como com o BP a PNN tem problemas quanto ao tempo de treinamento, porém não apresenta problemas quanto a convergência, sendo um bom classificador.