A análise microscópica dos cromossomos humanos visa o pareamento dos mesmos para a avaliação de sua integridade estrutural. O estudo microscópico é demorado e exige extrema experiência do profissional, constituindo-se em um trabalho artesanal.
O cariotipo é o processo pelo qual os cromossomos em uma célula, preparada adequadamente, são identificados e alocados para uma determinada classe a qual presumivelmente pertencem. Esta é uma importante tarefa clínica, pois a identificação de anormalidades nos cromossomos de uma particular classe pode ser detectada, e assim, feito o diagnóstico de certas síndromes clínicas (Tso et al, 1991). Esta classificação pela inspeção (cariotipagem) é uma tarefa importante e trabalhosa em diagnóstico pré-natal de anormalidades genéticas e no diagnóstico e monitoramento do câncer (Errington, 1993).
Para formar um cariotipo de 46 cromossomos de uma célula
humana normal, algumas características dos cromossomos (comprimento,
posição
do centrômero, padrão de bandas, etc.) devem ser mensuradas
de maneira
que cada cromossomo possa ser atribuído a uma das 24 classes. São
22 pares
de cromossomas idênticos (homólogos) e um par sexual designado
pelas letras
X e Y (um par de cromossoma X no caso de feminino e um cromossoma X e um
Y no caso de masculino).
Cromossomos estão presentes em todas as células nucleadas de todos os organismos vivos, levando informações genéticas que são usadas como mensageiros na reprodução das células e organismos. Seu nome é derivado do Grego "chroma" para cor e "soma" para corpo, isto porque elas podem ser fixadas com certas tinturas. Para melhor entendimento de sua função de mensageiro, um esboço do processo reprodutivo de células e organismos será apresentado. A reprodução das células serve para dois importantes propósitos:
Em nosso estudo, as células reprodutivas não
serão alvo
de estudo.
O período entre a geração de uma célula pela mitóse e o momento dela própria dividir é chamado ciclo mitótico. Este ciclo é dividido em dois distintos estágios ou fases, como ilustrado na Figura 2.1. Mitóse, ou fase-M toma somente na ordem de uma hora, uma pequena fração do tempo total do ciclo mitótico. O tempo remanescente chama-se interfase; ele é subdividido nos períodos G1, S (síntese) e G2. Durante a fase S o material genético em cada cromossomo é replicado, resultando em um núcleo em G2 com duplicação da quantia de material genético de G1.
A síntese segue um padrão característico para cada cromossomo, sendo que para o sexo feminino um dos dois cromossomas X, chamado X inativo, é sempre o último a completar a replicação (Vossepoel, 1987). O comprimento dos períodos S e G2 são mais constantes para um dado tipo de célula. Para linfócitos humanos, a fase S gasta aproximadamente 7 horas e, a G2, 5 horas (Vossopoel, 1987). O comprimento do período G1 apresenta grande variação, também para células de mesmo tipo sobre as mesmas circunstâncias.
Na metáfase os cromossomas tornando-se totalmente
condensados ou contraídos, e agregados com fibras para o fuso. Nesta
fase,
cada cromossoma mostra uma constricção chamada
centrômero. O centrômero
é o local de agregação das fibras do fuso.
Na anafase os centrômeros dividem-se, e as irmãs cromatides separam, colocadas aparte pelas fibras do fuso que conectam os centrômeros com os polos das células. Como cada cromatide separada se tornará um novo cromossoma durante a fase S, qualquer erro neste processo de separacão, chamado não-disjunção, resultará em um célula irmã eneuploid, isto é, com um número errado de cromossomas.
A mitóse termina com a telofase, que é
na verdade
a inversa da profase, quando as cromatides alcançam o pólo
da célula, e
tornam-se gradualmente alongadas e menos distintas novamente.
Do ponto de vista citogenético, o principal interesse na célula em um específico estágio da mitóse, é a metáfase, e muito menos extensivo, a profase, porque somente nestes estágios os cromossomas são visíveis como entidades separadas e podem passar informação (Philip et al, 1983). Desta forma, o objetivo é tentar o maior número de metáfases pela intervenção no ciclo mitótico normal da célula, através de um processo laboratorial chamado cultura. Além disso, é contrastar o cromossoma para que detalhes possam ser visualizados para fins de diagnóstico.
Em 1968 Casperson et al, publicaram seu primerio artigo descrevendo o uso de mostarda quinacrine para tingir cromossomos, e desde então se iniciou uma nova era de cromossomos com banda. Em poucos anos novos métodos foram desenvolvidos e várias técnicas foram introduzidas (Sumner, 1990).
Por mais de 20 anos o grande trabalho dos citogenecistas tem sido a preparação da metáfase de cromossomos com banda, e o método trypsin-Giemsa (banda G) tem-se tornado prática padrão em muitos laboratórios citogenéticos (Paut, 1993). Este método é um dos mais úteis na detecção de anormalidades cromossômicas porque a distribuição de bandas claras e escuras é característica para cada par cromossômico, permitindo assim, a perfeita classificação dos mesmos (Pereira, 1988). Métodos mais recentes tem sido criados, como é o caso da fluorescence in situ hybridization (FISH), o qual permite a rápida visualização de sondas de DNA hibridizadas para sequências de DNA na metáfase ou interfase dos cromossomos. Isto tem melhorado sensivelmente o nível de resolução possível na metáfase do cromossomo e também tem tornado possível identificar precisamente cromossomos específicos na interfase (Paut, 1993).
Uma das principais utilizações do exame citogenético é o diagnóstico pré-natal. A metáfase de cromossomos com banda são preparados para diagnóstico pré-natal de culturas do fluído aminiótico, chorionic villi, ou sangue fetal. A amostra com líquido aminiótico deve ser feita aproximadamente 7 dias após a cultura. Já o chorionic villi pode ser preparada diretamente para análise citogenética aproximadamente 5 horas após a cultura. Na maioria das vezes o que ocorre, infelizmente, é que a morfologia cromossômica e o índice mitótico são pobres na resolução em preparações rápidas. Células de sangue fetal são cultivadas na presença de um mitogene (phytohemaglutinin) para um mínimo de 48 horas antes de um índice mitótico satisfatório ser obtido.
O procedimento de cultura é similar para os três tipos de células. A divisão da célula é primeiramente bloqueada pela exposição em uma porção mitótica (Colcemid a 0,05 - 0,1 mg/ml) seguida pelo tratamento das células com uma solução hypotônica (0,075 M Kcl ou 0,8% citrato de sódio) para inchar (ondular) o núcleo da célula, e um ácido para fixar a proteína básica da cromatina.
A metáfase do núcleo é fisicamente
rompida pingando células
fixadas nas lâminas (slides) e/ou dando um "spray" de ar na lâmina
ou cobrindo-as em alta humidade. As lâminas são aquecidas (por
6 horas
a 45º C) e então banhadas em uma solução de trypsina
(0,4 mg/ml; pH 7,2)
e tingida para brilho no campo microscópico (Giemsa ou Wright). O
padrão
de banda lateral produzido, banda-G, refletem o estágio de
condensação
dos cromossomos em cada extensão particular. Quanto mais longo o
cromossomo,
maior o número de bandas que podem ser visualizadas (Paut, 1993).
Concluída a preparação da amostra,
o único interesse na
análise é das células da metáfase, que mesmo
sobre circunstâncias ideais,
formam uma pequena minoria das células presentes. O mais importante
é achar
todas estas células para posteriormente formar o cariotipo.
No procedimento manual a lâmina é rastreada com baixa magnitude (entre 16 e 25 vezes) sobre o miscroscópio. O número de campos rastreado desta forma é proporcional a magnitude quadrada vezes a área da lâmina, dividida pela área do diafragma ocular. O fator de proporcionalidade aparece da necessidade de se ter alguma sobreposição no campo circular. Na prática, 2 será uma boa estimativa para este fator (Vossepoel, 1987). Geralmente o número de campos envolvidos será na ordem de um a dois mil.
Quando propriamente focado, a profase e metáfase
são facilmente
visualizadas, porque elas mostram um padrão muito característico
de um
cluster de poucas duzias de objetos. Os cromossomas geralmente diferem
de uma célula para outra tanto em tamanho quanto em forma. Uma vez
a metáfase
achada, a analizabilidade é julgada pelos vários graus
de contração
e alongamento dos cromossomas, e o número estimado de cromossomas
que se
tocam e se sobrepõem. Deve também ser notado, contudo, que
analizabilidade
depende dos requerimentos necessários para a(s) subsequente(s)
análise(s).
Se o objetivo é apenas verificar anormalidade numérica, a qualidade
da
metáfase é suficiente se os cromossomas são contáveis.
Se o objetivo é
analizar anormalidades estruturais, em alguns casos é suficiente que
a
metáfase seja suficiente para determinar o cariotipo (ou cariograma).
Em
outros casos, contudo, uma harmonia na disposição do cromossomas
quanto
a comprimento, forma e disposição tornam-se importantes. Algumas
vezes,
uma completa ausência de cromossomos se tocando ou sobrepondo é
requerido.
Se a metáfase achada é aprovada, em muitos casos, a análise
envolve mudar
para uma alta magnitude (100 vezes). É pratica guardar as coordenadas
da
lâmina da metáfase em estudo, caso seja necessário um
estudo posterior.
A Figura 2.3 mostra uma metáfase com o seu respectivo
cariotipo/cariograma.
Cada espécie animal tem um cromossoma complemento, caracteristico em número e forma, que é chamado as espécies karyotype. A palavra karyotype (cariotipo em português), derivada da palavra Grega "karyon" para nó e "typos" para forma, é algumas vezes também usada para representação visual dos cromossomos fixados, arranjados em ordem descendente do comprimento. Talvez um termo mais preciso seria cariograma. Como neste estudo somente cromossomas humanos são de interesse, a seguinte descrição será restringida para o cariotipo humano.
Essencialmente o processo de cariotipagem consiste dos seguintes passos:
Deve ser notado que o cariotipo é somente
necessário para
análise de aberrações estruturais. Contudo, os passos
de localizar, isolar
e contar são sempre necessários, mesmo que se esteja somente
interessado
em anormalidade numérica. Geralmente, tem-se aplicado um protocolo
para
distintos propósitos de diagnóstico, como usar 2 metáfases
para cariotipagem
e 15 para contagem dos cromossomos, isto para o diagnóstico pré-
e pós-natal.
Durante os últimos 25 anos, várias rotinas e experimentos de classificação automática de cromossomos (banda-G) tem sido estudados. Também deve ser lembrado, que sómente em 1956 Tijo & Levan demonstraram que o número correto de cromossomos em uma metáfase de cromossomo humano normal consiste de 46 cromossomos (Sumner, 1990). A cariotipagem automática (classificação) foi um dos primeiros problemas em análise de imagem digital e reconhecimento de padrão pictorial (van Vliet et al, 1990).
Cariotipo dos cromossomos assistido pelo computador para
análise dos cromossomos tem alcançado o estágio onde
muitos laboratórios
aceitam que é tanto clinicamente útil quanto economicamente
justificável
(Piper & Granum, 1989). Sistemas comerciais já se encontram hoje
disponíveis,
proporcionando facilidades gráficas interativas para a
classificação automática
pelo computador, embora havendo a necessidade de interação
com um operador.
Estes sistemas geralmente procedem de forma similar. Cada célula é
localizada
para análise, digitalizada em alta resolução, e uma
segmentação inicial
é feita, geralmente por uma rotina do limiar do nível de cinza.
A tarefa
de segmentação, algumas vezes deixa alguns pontos não
resolvidos, principalmente
de cromossomos que se tocam ou sobrepostos, necessitando assim, uma
segmentação
interativa. Características numéricas são então
medidas, geralmente incluindo
o tamanho (área ou comprimento), posição do centrômero
e parâmetros que
descrevam o padrão de bandas dos cromossomos (Desinov, 1994; Errington,
1993; Graham, 1987; Groen et al, 1989; Keret, 1991; Lundsteen, 1986 e 1981;
van Vliet et al, 1990).
O primeiro passo na automação
citogenética é a captura
da imagem pelo computador para posterior processamento. A imagem não
pode
ser colocada diretamente no computador para análise, pois o computador
trabalha mais com dados numéricos do que com dados ilustrativos. Assim,
uma imagem deve ser convertida para forma numérica antes do processamento.
Este processo de conversão é chamado
digitalização, onde a imagem
é dividida em pequenas regiões chamadas picture elements,
ou pixels.
O esquema de subdivisão mais comum é o quadro de amostragem
(geralmente
retangular) apresentado por (Castleman, 1979), mostrado na Figura 2.4.
A imagem é dividida em linhas horizontais feitas de pixels adjacentes.
Em cada localização de pixel a claridade é medida e
quantificada, este
processo gera um número inteiro em cada pixel representando a claridade
ou escuridão da imagem naquele ponto. Quando isto tiver sido feito
para
todos os pixels, a imagem é representada em uma matriz de inteiros,
onde
cada pixel tem a localização ou endereço (par indicando
a linha e a coluna)
e um valor inteiro chamado nível de cinza. Esta matriz de dados digitais
é agora candidata para processamento no computador.
A digitalização é feita durante a aquisição de imagem, que é o primeiro passo no processamento de uma imagem. Dois elementos são requeridos para adquirir imagens digitais. O primeiro é um dispositivo físico (sensor) que seja sensitivo a bandas no spectrum de energia eletromagnética (tais como raio-X, ultravioleta, visual, ou infravermelho) e que produza um sinal elétrico de saída proporcional ao nível de energia percebida. O segundo chamado digitalizador, é um dispositivo para converter o sinal elétrico do sensor em uma forma digital (Gonzalez, 1992).
Um tipo importante e altamente versátil de digitalizador de imagem é a camera digitalizadora, que tem um sistema de lentes e pode digitalizar uma imagem ou objeto para ela apresentado. Tal dispositivo pode não sómente digitalizar objetos físicos mas também outras imagens tais como filme fotográfico. Um restrito, mas não menos importante, tipo de digitalizador de imagens é o scanner (esquadrinhador ou rastreador) de imagens de filmes ou fotos. "Scanner" de filmes pode digitalizar uma imagem de um objeto sómente depois dela ter sido fotografada por uma camera ou que esteja na forma de uma gravura. Recentemente, uma nova técnica de digitalização de imagem tem sido usada. Esta técnica usa uma camera fotográfica acoplada ao computador, e quando um objeto ou cena é fotografada um software específico se encarrega de fazer a digitalização automática. Esta técnica parece ser promissora e ter seu lugar garantido em algumas aplicações, especialmente aquelas que utilizam imagens microscópicas.
Três bases de dados de imagens digitalizadas de cromossomos já se tornaram padrão para estudos e testes comparativos. Elas utilizam diferentes abordagens para aquisição da imagem. A primeira base de dados foi coletada no Rigshospitalet, Copenhagen em 1976-1978 e consiste de 180 metáfases de células de sangue periférico, padrão banda-G (trypsina-Leishmann). Os cromossomos nesta base foram fotografados e individualmente digitalizados de negativos de fotografia em um "grid" que estava paralelo com o eixo do cromossomo, usando um microdensitômetro. O tamanho do pixel foi 0,125 mm do cromossomo original (Piper, 1989).
A segunda base foi obtida no MRC, Edinburgh em 1984, contém 125 células de sangue periférico masculino de amostras rotineiras do laboratório clínico, banda-G usando a técnica ASG (Giensa salinoacético). As células de Edinburgh foram digitalizadas diretamente das lâminas do microscópio, sendo 0,125 mm o tamanho do pixel, usando uma camera de TV Bosch "chalnicon" (Piper, 1989).
A terceira base de dados foi obtida no Jeferson Medical
College, Philadelphia, em 1987, e contém 130 células
chorionic villus
banda-Giemsa (culturas de 24 hs). As amostras foram preparadas rotineiramente
no laboratório sendo digitalizadas e analisadas em um Cytoscan CS
(Sistema
de Reconhecimento de Imagem, Warrington, UK). Este Cytoscan CS usa um scanner
de matriz CCD (charge-coupled device) linear esquadrilhado mecanicamente
com um espaço de pixel original de 0,1 mm por 0,13 mm, convertido
por software
para 0,13 mm quadrado de espaçamento (Piper, 1989).
A segmentação da imagem é um passo importante no processo de automação citogenética e talvez uma das tarefas mais difíceis na análise de imagens (Castleman, 1979; Gonzalez, 1992). Vários algorítmos e técnicas de segmentação da imagem tem sido usados, a escolha de uma técnica de segmentação sobre outra é feita considerando as características peculiares do problema em consideração.
Os algorítmos de segmentação de imagens monocromáticas geralmente são baseados em duas propriedades básicas dos valores de nível de cinza: descontinuidade e similaridade. Descontinuidade, é o processo pelo qual uma imagem é particionada baseada na mudança abrupta do nível de cinza. A principal área de interesse dentro desta categoria é a detecção de pontos isolados e detecção de linhas e contornos (edges) na imagem. Na segunda categoria, similaridade, a principal abordagem é baseada na classificação de pixels (segmentação por limiar (thresholding), crescimento de regiões (region growing) e unir e separar regiões (region splitting and merging) (Nalva, 1993; Gonzalez, 1992).
A segmentação baseada num limiar, geralmente referenciado como thresholding, é particularmente útil em segmentação de objetos sólidos contidos na cena sobre um constraste de fundo bem definido. É computacionalmente simples e nunca falha em definir regiões disjuntas com fronteiras bem conectadas (Castleman, 1979). A regra de utilização do limiar tem como característica determinar um valor limite (limiar), e atribuir todos os pixels com nível de cinza igual ou superior ao valor do limiar pertencentes ao objeto, e todos os pixels com nível de cinza abaixo do limiar não pertencentes ao objeto. Este limiar pode ser global ou adaptativo, sendo este último usado principalmente quando o nível de cinza do fundo não é constante e o contraste do objeto varia dentro da imagem. Em imagens microscópicas, o nível de cinza do fundo varia devido a não uniformidade da iluminação, sendo que na imagem de cromossomos o contraste pode variar de cromossomo para cromossomo (Castleman, 1979). Correção de sombreado ("shading correction") pode ser uma boa opção para remover possíveis efeitos associados com não-uniformidade devido a sensibilidade da camera ou condições de iluminação (van Vliet et al, 1990).
A seleção do valor do limiar pode ser feita de mais de uma maneira, Castleman (1979) referencia a técnica do gradiente médio da fronteira e o uso do histograma de nível de cinza. A técnica "Thresholding" para segmentação da imagem foi usada nas três bases de dados anteriormente descritas (Copenhagen, Edinburgh e Philadelphia), utilizadas neste estudo que serão mais detalhadas no capítulo 4, para separar os cromossomos (Piper, 1989). Alguns sistemas de classificação automática disponíveis no mercado também tem usado este algorítmo de segmentação como é o caso do Athena, desenvolvido por Mayal e seu grupo em 1990, Magiscan 2, desenvolvido pela Joyce-Loebl, Gateshed, U.K, Cytoscan CS (sistema de reconhecimento de imagem, Warrington, UK), ScanArray, Sistema de análise de imagens, desenvolvido por Galai, Migdal Haemek, Israel.
Após a segmentação automática dos cromossomos, comumente é feita uma interação manual, que pode ser feita usando "lightpen", "mouse" ou "trackball". O objetivo é permitir a correção de possíveis falhas na segmentação decorrentes de cromossomos que se tocam ou cromossomos sobrepostos. Esta tem sido uma técnica usada em diversos estudos (Desinov, 1994; Graham, 1987; Lundsteen, 1986; Piper, 1989 ; van Vliet et al, 1990).
Finalizada a digitalização da imagem é
feita a respectiva
segmentação, individualmente, os cromossomos estarão
disponíveis para a
extração das características que serão descritas
no ítem a seguir.
O problema de classificação, mais precisamente o de reconhecimento de padrões está intimamente ligado a tarefa de selecionar quais das muitas características (features) devem ser medidas e apresentadas para o classificador (Castleman, 1979). Piper (1989) comenta que existem 28 características disponíveis nos cromossomos, e que é impraticável fazer uma busca exaustiva para um subconjunto ótimo. Segundo Pereira (1988) os critérios mais usados para identificação dos cromossomos pelos citogenicistas são: comprimento, posição do centrômero, características autorradiográficas, localização das constriccões secundárias e padrão de bandas.
A extração das características comumente toma tempo, pois muitas vezes um pré-processamento se torna necessário, no sentido de melhorar as condições da imagem para a extração. Este é o caso da determinação do eixo principal do cromossomo para medir o comprimento do mesmo. Os cromossomos nem sempre estão dispostos de forma própria, ou seja, eles aparecem tortos, ou em posições que não são adequadas para a extração das características. Em alguns estudos os cromossomos severamente tortos e sobrepostos foram retirados a título de praticidade, porém, em outros estudos este problema tem sido largamente explorado, uma vez que em sistemas automáticos esta é uma condição normal. Assim, um processamento prévio se torna necessário, no sentido de esticar (desentortar) e rotacionar o cromossomo (Groen et al, 1989). A grande massa de algorítmos de processamento de imagens é utilizada nesta fase de extração de características.
As características mais utilizadas na classificação automática de cromossomos são o comprimento e posição do centrômero (ou índice centromérico), sendo que com estas duas características é possível separar os cromossomos em 7 grupos, também chamado grupo de Denver (Graham, 1987). Uma outra característica, talvez a mais explorada desde o advento da preparação de amostras de cromossomos com bandas, é o padrão de banda do cromossomo ao longo do eixo longitudinal. Estas três características tem sido a base da grande maioria dos estudos desenvolvidos nas duas últimas décadas (Desinov, 1994; Errington, 1993; Graham, 1987; Groen et al, 1989; Keret, 1991; Lundsteen, 1986 e 1981; van Vliet et al, 1990).
O comprimento do cromossomo é medido ao longo do eixo longitudinal. Cada cromossomo em seu grupo tem um comprimento dentro de cada célula (metáfase), sendo que a variação depende da preparação da amostra. Isto faz com que seja necessário a normalização desta medida. O centrômero é um ponto de constricção primária dos cromossomos que a divide em duas partes, chamados braço curto p e braço longo q. A relação entre p e q é chamada índice centromérico, ou seja, metacêntricos quando os dois braços tem praticamente o mesmo comprimento (p/q = 1); submetacênctricos quando a relação p/q é aproxidamente 0.5, ou seja, os comprimentos dos dois braços são diferentes, e acrocêntricos quando o centrômero está na extremidade do cromossomo (p/q = 0.1). Variações na medição do índice centromérico são feitas, utilizando-se também a razão da área do braço curto e do braço longo, ou a razão da densidade (p/q) a nível de pixels. O padrão de bandas, ou simplesmente bandeamento, é a variação de tonalidade ao longo do eixo principal do cromossomo, formando listras, de propriedades tingidas. Esta variação de propriedades tingidas é normalmente independente de qualquer variação estrutural imediatamente óbvia (Sumner, 1990).
Devido a quantidade de técnicas utilizadas para a
extração
de cada uma das características, é conveniente tratá-las
separadamente.
A determinação do comprimento do cromossomo
pode ser feita
de várias maneiras. Uma das técnicas que tem sido mais utilizada
é a determinação
do eixo longitudinal do cromossomo, uma vez que, se este eixo é
determinado,
o comprimento torna-se imediato. Várias técnicas tem sido
propostas, como
"curve-fitting" paramétrica e não-paramétrica
revisadas
por Piper (1980). Técnicas não-paramétricas que acham
o eixo por montagem
local podem ser mais poderosas no trato com cromossomos tortos (Piper,
1989). Groen et al (1989), tem usado um método geral para construir
um
eixo linear "piecewise", enquanto Piper (1989) optou por
uma abordagem de dois estágios, em que um método linear piecewise
simples
é usado primeiro para cromossomos retos ou ligeiramente tortos. Caso
existam
cromossomos severamente tortos. um método mais complexo é aplicado.
A Figura
2.5 mostra um procedimento usado para de determinar o eixo longitudinal,
o respectivo comprimento e perfil de bandas.
A determinação da posição
do centrômero é outro importante
passo no processamento da imagem do cromossomo. Para cromossomos sem padrão
de bandas o centrômero pode ser achado diretamente através da
análise do
perfil de densidade ao longo do eixo principal do cromossomo; contudo,
para cromossomos com bandas esta análise não pode ser usada,
uma vez que
o perfil de densidade será dominado pelas bandas. Piper (1989)
propõe duas
abordagens, uma utilizando o perfil da largura do cromossomo, e a outra
analisando a curvatura da fronteira do cromossomo (máxima concavidade
no
contorno do cromossomo).
O padrão de bandas é a característica seguramente mais explorada, possibilitando várias combinações no seu processo de classificação. Basicamente o perfil da densidade média ao longo do cromossomo tem-se tornado uma prática comum sendo utilizado em vários estudos (Errington, 1993; Graham, 1987; Groen et al, 1989; Lundsteen, 1986 e 1981; Martin et al, 1990; Piper, 1989).
O sistema Athena, desenvolvido por Mayall e seu
grupo (Mayall et al, 1990) utiliza uma abordagem, considerando como bandas
regiões escuras dos cromossomos. Assim, utilizam um limiar baseado
na densidade
ótica para selecionar partes escuras como regiões potencialmente
referentes
a uma banda. Para cada banda detectada, parâmetros são calculados,
tais
como: área, densidade ótica total, início, fim e
posição média relativa
ao topo. Destas informações um subconjunto de bandas é
extraída e usada
para classificação, como: banda mais escura no cromossomo;
banda tendo
a maior área; banda distal no braço curto; banda distal no
braço longo,
e banda mais próxima do centrômero no braço longo.
Convém salientar que
este estudo concentra-se no processo de classificação, portanto
usalisa-se
características já determinadas por sistemas reconhecidos.
Este último passo, talvez o mais importante, utiliza as características previamente extraídas para atribuir cada cromossomo da metáfase a uma das 24 classes, formando assim o cariotipo. Vários Classificadores Paramétricos e Não-Paramétricos, Algorítmos de Busca em Grafos, Sequências de Transição de Bandas, Modelos de Redes de Markov, Algorítmos de Transportes e mais recentemente Redes Neuronais Artificiais tem sido estudado e propostas para a classificação dos cromossomos.
A seguir apresentamos, na Tabela 2.1, um resumo das várias
abordagens utilizadas para a classificação, apresentado os
autores, ano
de apresentação dos trabalhos, o classificador utilizado, as
caracterísitcas
usadas e a origem dos dados.
Granlund (1976) usou descritores ou coeficientes de Fourier extraídos do perfil de densidade do cromossomo como características para um classificador de mínima distância. Em seu artigo ele comenta que testou duas maneiras, uma utilizando distância Eucliadiana ponderada, outra usando representação logarítmica para a variância, sendo que a primeira apresentou melhores resultados, obtendo uma precisão de 96% para os seus dados.
O primeiro sistema comercialmente disponível, desenvolvido por Kenneth Castleman e seu grupo do "Jet Propulsion Laboratory" do Instituto de Technologia da Califórnia (JET/CALTECH) em 1975, utilizou o comprimento e o índice centromérico como características e um classificador Bayesiano. Convém ressaltar que estes classificadores geralmente apresentam duas etapas, uma de treinamento que pode ser supervisionado e não-supervisionado, e uma de classificação propriamente dita ou teste. A fase de treinamento é usada para a determinação dos parâmetros da função densidade de probabilidade (média, variância, etc.).
Os métodos probabilísticos com classificadores paramétricos e não-paramétricos sem dúvida tiveram grande enfase nos primeiros estudos. Como pode ser observado na Tabela 2.1, existem diferentes possíveis combinações de características, possibilitando assim usar vários modelos, como ocorreu nos estudos de Lundsteen (1981) e (1986), Graham (1987), Piper (1989), Groen (1989), van Vliet (1990), Kirby (1993) e Johnston (1993).
A tecnologia de redes neuronais artificiais é relativamente nova quando comparada com a clássica abordagem probabilística, principalmente em tarefas de classificação. Este é um dos motivos de aparecer apenas dois trabalhos relatados na literatura de classificação de cromossomos. Erington e Graham em 1993 usaram uma rede MLP (Multi-Layer Perceptron) treinada com uma BP (Backpropagation) apresentando resultados excelentes quando comparado com métodos convencionais.
A dificuldade em usar um BP é o tempo
requerido para
treinar
a rede. Isto ocorre porque as tarefas de classificação de
cromossomos utilizam-se
de grandes bases de dados com espaços de entrada e saída de
alta dimensão,
sendo que o tempo computacional para treinar uma BP pode levar muitas horas.
Além disso, devido ao processo de treinamento, pode não haver
convergência
sendo um problema a ser enfrentado. A outra abordagem usando RNA foi o
trabalho de Sweeney e outros em 1993 que usou uma Probabilistic Neural
Network (PNN). As características usadas neste estudo foram 30,
sendo
28 apresentadas por Piper (1989) e mais 2 características apresentadas
mais recentemente. Assim como com o BP a PNN tem problemas quanto ao tempo
de treinamento, porém não apresenta problemas quanto a
convergência, sendo
um bom classificador.