A ergonomia está preocupada em considerar características,
expectativas, comportamentos humanos no planejamento daquilo que
as pessoas usam em seu trabalho, na sua vida diária e no
ambiente no qual elas trabalham e vivem.
KARWOWSKI [1986] explica que as "coisas" que são
planejadas, são sistemas complexos de homem-máquina.
"Planejar" implica em tomar decisões, ou seja,
escolher valores para variáveis de planejamento para que
os objetivos do sistema, nesse caso a adequação
do trabalho à pessoa, sejam otimizados. Daí, conclui
o autor, a importância do uso de modelos matemáticos
no processo de planejamento.
De acordo com KARWOWSKI [1986], as razões mais extremistas
para a construção de modelos em geral, e modelos
de performance humana em específico, são tentar
fornecer o seguinte:
1) uma estrutura sistemática que reduza a carga de memória do investigador e capacite-o a não deixar de perceber as importantes características do problema;
2) uma base para extrapolar da informação dada para
chegar a novas perspectivas e novas inferências testáveis
ou observáveis a respeito do sistema ou do comportamento
do componente;
3) Um instrumento de planejamento do sistema que permita geração
de soluções de planejamento diretamente;
4) uma incorporação de conceitos ou de parâmetros
derivados que sejam úteis como medidas de desempenho no
ambiente simulado ou real;
5) um componente de sistema a ser usado no ambiente operacional
para gerar comportamento para comparação com o comportamento
do operador real a fim de antecipar um dispositivo de dados necessários
para introduzir estratégias alternativas ou monitorar o
desempenho da performance do operador;
6) uma consideração de aspectos do problema que
seriam de outro modo negligenciados ou obscuros.
Segundo KARWOWSKI [1986], o analista de ergonomia deverá
experimentar um modelo matemático do sistema uma vez que
pode ser impraticável experimentar o sistema real. Segundo
ele, esta impraticabilidade pode ser resultante de vários
fatores, conforme segue:
1. O sistema real é apenas proposto, e portanto, não
está em existência.
2. O número e o campo dos valores atingíveis da
variáveis de modelo são tão grande que experimentar
do sistema real seria custoso demais e demandaria tempo demais.
3. A experimentação do sistema existente é
inseguro, especialmente quando os seres humanos estão envolvidos.
Segundo o mesmo autor, um modelo é uma representação
de um sistema real. A característica principal de um modelo
é o uso de símbolos, equações e outras
afirmações matemáticas para representar a
realidade.
Todos os modelos matemáticos, de acordo com o autor, representam
uma maneira de converter entradas em saídas. As entradas
para um modelo podem ser controláveis ou não-controláveis.
As entradas controláveis são chamadas de variáveis
de decisão ou variáveis de planejamento. Uma
especificação
de um conjunto de valores para as variáveis de decisão
é chamada de solução. As variáveis
não-controláveis são freqüentemente
chamadas de parâmetros do modelo. Um exemplo de um parâmetro
do modelo seria o tempo exigido para um trabalhador realizar uma
determinada tarefa.
O cerne de um modelo matemático é uma representação
do processo (do sistema real) que converte as entradas em saídas.
Esta representação é realizada através
do uso de funções de variáveis de entradas.
KARWOWSKI [1986], defende o ponto de vista de que, "independente
do nível do trabalho humano, três tipos de difusibilidade
estão presentes e deveriam ser levados em conta no sistema
homem-máquina-ambiente, isto é: uma difusibilidade
vinda da falta de habilidade do homem de adquirir e processar
quantidades adequadas de informação a respeito do
comportamento de um determinado subsistema (ou do sistema total);
uma difusibilidade devida a superficialidade das relações
entre as pessoas e seus ambientes de trabalho, e complexidade
das regras e princípios subjacentes a estes sistemas e
finalmente, uma difusibilidade inerente aos processos do pensamento
humano e percepções subjetivas do mundo externo".
Para o autor, a última categoria de difusibilidade é
a de maior importância para os estudos da ergonomia, e deve
ser tratada com mais cuidado. É justamente esta a preocupação
do presente trabalho, isto é, tratar os processos do pensamento
e percepções humanas segundo a lógica difusa.
4.2 Conjuntos Difusos
4.2.1 Aplicações da Teoria de Conjuntos
Difusos
na Ergonomia
De acordo com KARWOWSKI [1986], desde o seu nascimento, em 1965,
milhares de trabalhos e mais de 20 livros foram publicados em
relação à teoria de conjuntos difusos.
Segundo o mesmo autor, a teoria de conjuntos difusos tem sido
aplicadas com sucesso na modelagem de sistemas mal definidos numa
variedade de disciplinas (psicologia cognitiva, processo de
informação
e controle, ciência de tomada de decisão, ciências
biológicas e médicas, sociologia e linguística,
processamento de imagens e reconhecimento de padrões e
inteligência artificial). Atualmente há também
muitas aplicações da metodologia difusa em fatores
humanos.
De acordo com o autor, vários exemplos de aplicações
da teoria difusa em ergonomia podem ser apontados:
Segundo KARWOWSKI [1986], em 1959, antes de Zadeh publicar seu
primeiro trabalho sobre conjuntos difusos, Helmer e Rascher tinham
indicado a necessidade de novos procedimentos de raciocínio
que seriam adequados no campo das ciências inexatas, isto
é, ciências onde o raciocínio é informal,
a terminologia às vezes exibe uma imprecisão inerente
e o raciocínio pode, então, depender de referência
a fatos percebidos intuitivamente.
Em 1977, Saaty distinguiu dois tipos de difusibilidade na percepção
leiga (por exemplo, percepção de intensidade de
iluminação) e difusibilidade no significado, pregando
que a difusibilidade é uma qualidade básica do entendimento.
Em 1979, Willaeys e Malvache investigaram a percepção
da informação vestibular e visual numa inspeção
industrial ou chamada de "veja e decida" dentro de tarefas
de controle.
Terano e colegas, em 1981, introduziram uma abordagem de conjunto
difuso em uma análise de árvore de falhas, e estudaram
a difusibilidade humana a partir do ponto de vista de segurança
dos sistemas homem-máquina.
No mesmo ano, Hirsch usou uma relação dissimulada
difusa para descrever padrões vocais humanos.
Em 1982, Benson desenvolveu um programa gráfico de computador
interativo para tarefas analíticas que não são
bem definidas ou que utilizam dados imprecisos.
Karwowski, também em 1982, propôs uma abordagem difusa
na abordagem do relacionamento entre repostas de stress psicológicos
e fisiológicos biomecânicos de um operador humano
realizando tarefas de levantamento de material manual.
No mesmo ano, Mital e Ulgen usaram a teoria dos conjuntos difusos
para modelar informação em relação
à tarefa de decisão e o estado clínico e
mental do operador.
Ainda em 1982, Kramer e Rohr desenvolveram um modelo difuso de
comportamento de motoristas baseado em um padrão visual
simulado processando-se em uma rua de controle.
No período 1983-84, Karwowski e colegas desenvolveram um
modelo baseado num conjunto difuso para avaliar a aceitabilidade
de stress em trabalhos de levantamento manual
Simcox, em 1984, usou a abordagem linguística para elaborar
um método de comunicação pragmática
em dispositivos gráficos.
No mesmo ano, Hunt e Rouse propuseram um modelo baseado em regra
difusa de solução de problema humano em tarefas
de diagnóstico de falhas.
Onisawa, em 1988 desenvolveu vários conceitos difusos para
melhorar os estudos de questões de confiabilidade humana.
Em 1989, Luczak e Ge aplicaram a modelagem difusa para investigar
as relações entre o peso físico e o peso
da carga percebida.
Em 1990, Karwowski e colegas desenvolveram um modelo para estudar
a interação homem-computador na tarefa de edição
de textos.
De acordo com KARWOWSKI [1986], a teoria dos conjuntos difusos,
concernente com a representação matemática
e a manipulação dos graus de indecisão, é
um instrumento poderoso para a análise de sistemas de trabalho
humano. Segundo o autor, tais sistemas são complexos, sua
estrutura subjacente e as relações que os governam
não são precisamente conhecidas, suas descrições
são, geralmente, de natureza linguística, e as
definições
de muitas variáveis e vários conceitos são
vagos.
ZADEH [1974], defende que "embora as técnicas matemáticas
convencionais tenham sido e continuarão a ser aplicadas
à análise de sistemas humanísticos, está
claro que a grande complexidade de tais sistemas exige abordagens
que sejam significativamente diferentes dos métodos tradicionais
- métodos que são altamente eficientes quando aplicados
a sistemas mecanísticos, mas deixam de ser precisos em
relação aos sistemas nos quais o comportamento humano
tem um papel importante".
KARWOWSKI [1991] afirma que tanto a precisão quanto a certeza
são ideais falsos que são impossíveis de
ser atingidos e, portanto freqüentemente enganadores se aceitos
como guias. De acordo com o filósofo, "a busca da
precisão é análoga à busca da certeza
e ambas deveriam ser abandonadas".
ZIMMERMAMM [1985] indica que situações reais freqüentemente
não são exatas e determinísticas e não
podem ser descritas precisamente.
Como sugerido por KARWOWSKI [1991], existem duas vantagens potenciais
para aplicações de uma abordagem difusa nas ciências
humanas. A primeira é de que a difusibilidade por si só
pode ser uma metáfora útil ou um modelo para linguagem
humana e processos de categorização e, segundo,
que a matemática difusa pode ser capaz de aumentar as técnicas
estatísticas convencionais na análise de dados difusos.
O autor revisou vários métodos alternativos para
a análise de dados difusos e concluiu que métodos
difusos são suplementos úteis para técnicas
estatísticas.
Conclui KARWOWSKI [1986] que, pesquisadores de ergonomia devem
se ater ao potencial enorme oferecido pelos métodos difusos
e explorar totalmente suas aplicações na análise
de sistemas ergonômicos. O presente trabalho pretende, portando,
utilizar a lógica difusa na análise de sistemas
ergonômicos.
4.2.2 Conceito de Difusibilidade
Segundo KARWOWSKI [1986], o conceito de um subconjunto difuso
foi introduzido pela primeira vez por L.A. Zadeh, em 1965. No
entanto, de acordo com DUBOIS [1980], o termo "ensemble flou"
- uma contraposição francesa à expressão
conjuntos difusos - foi usado por Menger em 1951.
De acordo com ZADEH [1965], a teoria dos conjuntos difusos representa
uma tentativa de se construir uma estrutura conceitual para o
tratamento sistemático da imprecisão e da incerteza
devido à difusibilidade tanto nos modos quantitativos quanto
qualitativos. Tal estrutura é muito necessária na
área da ergonomia.
Como foi apontado por SINGLETON [1982] "a maioria das características
humanas têm dependências contextuais complexas que
não são prontamente expressadas em tabulações
de números, ou até mesmo em equações
multivariadas".
A teoria dos conjuntos difusos, de acordo com KARWOWSKI [1991],
que permite uma interpretação e manipulação
de informação imprecisa e reconhecimento e avaliação
de incerteza devido a difusibilidade (e aleatoriedade), pode ser
a solução mais próxima à necessidade
da ergonomia.
O tratamento formal da imprecisão é um passo importante
e necessário em direção ao manuseio mais
realístico da imprecisão e incerteza próprios
do ser humano e de seu comportamento no processo de trabalho.
De acordo com KARWOWSKI [1986], um conjunto difuso é uma
generalização de idéias de um conjunto clássico.
Um subconjunto difuso pode ser visto como um predicado cujos valores
verdade são retirados do intervalo [0,1] e não de
um conjunto clássico. Desta maneira, o subconjunto difuso
tem a sua lógica dentro de uma lógica de multivalores.
O subconjunto difuso permite uma descrição de conceitos
na qual o limite entre ter pertinência e não ter
pertinência não é bem definido.
Em geral, um subconjunto difuso é sempre definido dentro
da estrutura clássica de conjunto, chamado de universo
de discurso.
ZADEH [1965], define um subconjunto difuso A na forma dada a seguir.
Definição 1.0 - [ZADEH, 1965] - Um subconjunto
difuso A de um universo de discurso U, é definido por uma
função de pertinência
que associa a cada elemento de U um número ()
do intervalo [0,1], onde
() representa
o grau de pertinência de em A.
Formalmente, A pode ser descrito como:
O domínio de A é o conjunto de pontos em U no qual
() é positiva.
Para simplificar a notação, um subconjunto difuso
A com função de pertinência discreta pode
ser expresso como:
, i = 1,2,3....n é o grau de pertinência
de em A, e
KARWOWSKI [1986] também apresenta uma definição
de subconjuntos difusos, como segue.
Definição 2.0 - [KARWOWSKI, 1986] - Seja
X um conjunto correspondente ao universo. Um subconjunto difuso
A de X é um subconjunto no qual o grau de pertinência
de qualquer elemento x X é retirado do intervalo [0,1].
Exemplo 1.0 - [KARWOWSKI, 1986] - Seja
Na estrutura da teoria dos conjuntos difusos, de acordo com o
autor, os termos na forma a1/x1 são entendidos para indicar
que o elemento x1 tem um grau de pertinência a1 no subconjunto
difuso A. Os conjuntos clássicos são casos especiais
de conjuntos difusos, nos quais os graus de pertinência
são simplesmente 0 ou 1 (zero ou um).
4.2.3 Teoria do Consenso
Uma classe mais geral de problemas de tomada de decisão
está relacionada com decisões tomadas por um grupo.
Definição 3.0 - [DUBOIS, 1980] - Uma relação
de preferência social R é uma relação
difusa obtida pela agregação de preferências
de m indivíduos. Seja o número
de indivíduos que preferem a alternativa
à
, então R é definida
como:
Definição 4.0 - [DUBOIS, 1980] - As seguintes
medidas escalares fornecem as medidas dos valores do consenso
onde n é o número de alternativas e tr é
o traço da matriz.
Definição 5.0 - [DUBOIS, 1980] - Se R denota
a relação difusa de preferência do grupo,
quando o consenso é alcançado, R é uma relação
difusa recíproca, isto é,
por convenção. Onde, 1 indica
que
é totalmente preterido a
;
0 indica que
e
têm preferências iguais.
DUBOIS [1980] definiu uma regra para a determinação
de consenso em um grupo de m indivíduos. O método
pode ser resumido em algumas etapas, como segue:
1. Calcula-se , que representa o número
de indivíduos que preferem a alternativa
à
.
2. Contabiliza-se o total na matriz A.
3. Divide-se cada célula de A pelo número de indivíduos
que opinaram, obtendo-se a matriz R, que expressa uma relação
difusa de preferência.
4. Calcula-se o traço da matriz .
5. Utiliza-se a fórmula para calcular o grau de consenso
C.
6. Realiza-se cortes no conjunto difuso F, para se estabelecer
qual conjunto de alternativas deve ser escolhido.
Exemplo 2.0 - Suponha que uma análise ergonômica
de certa organização fosse realizada por um grupo
de especialistas, onde 100 funcionários entrevistados devessem
optar por uma das seguintes alternativas, por ordem de prioridade,
na análise das condições ambientais do trabalho.
a) ambiente tóxico
b) ambiente arquitetônico
c) ambiente sonoro
Cada um dos 100 funcionários votou na ordem das alternativas
que considerava mais prioritária. Os supostos resultados
são os seguintes:
1. Cálculo de
2. Matriz A
3. Matriz R
4. Traço de
5. Cálculo de C
6. Conjunto de alternativas escolhido
A1 = não há alternativa
A .86 = B é preferível à A
A .72 = B e C são preferíveis à A
A .62 = B é preferível a C; B e C são preferíveis
à A
Conclusão: Deve-se analisar com maior cuidado o ambiente
arquitetônico, depois o sonoro e, finalmente o ambiente
tóxico, na opinião dos entrevistados.
4.3 Redes Neurais
De acordo com LAWRENCE [1992], as redes neurais artificiais são
formadas de centenas ou milhares de neurônios simulados
que estão conectados do mesmo modo que os neurônios
cerebrais e, portanto, são capazes de aprender de maneira
semelhante às pessoas. As Redes Neurais artificiais usam
um grupo altamente interconectado de neurônios que processam
informação em paralelo.
Segundo o autor, atualmente é possível utilizar
um simulador de redes neurais para testar as teorias de redes
neurais ou para fazer aplicações. Um simulador de
redes neurais é um programa (um conjunto de instruções
computacionais) que cria um modelo de neurônios e as conexões
entre eles, e depois treina este modelo. De uma forma geral,
todas as redes neurais aprendem por associação.
Os neurônios, numa rede neural, são geralmente organizados
em três camadas: a camada de entrada (input), a camada escondida
ou intermediária e a saída (output). Raramente mais
do que uma camada intermediária é usada.
A camada intermediária faz associação entre
as entradas e saídas. Ela é chamada de camada intermediária
porque não tem nenhuma conexão direta com o meio
externo.
Há muitas maneiras diferentes em que as redes neurais podem
aprender. O método de aprendizagem mais popular é
por exemplo e repetição, também chamada
retropropagação.
Toda vez que a rede fornece uma saída errada, o software faz as mudanças em suas conexões internas para que da próxima vez que receber as mesmas entradas, seja mais provável que produza uma resposta correta.
As conexões são ajustadas a fim de que as entradas
sejam associadas mais fortemente com a saída correta e
menos fortemente com a saída incorreta. Este treinamento
é repetido para um conjunto de exemplos até que
a rede aprenda as respostas corretas. Uma vez que a rede esteja
treinada usando entradas e saídas pré-selecionadas,
é possível colocá-la em funcionamento com
novas informações de entrada (sem qualquer saída
fornecida) e fazer com que ela então reconheça,
generalize ou faça predição a respeito da
resposta desejada.
4.3.1 Aplicações de Redes Neurais
Segundo LAWRENCE [1992], uma quantidade razoável de trabalhos
tem sido feito com redes neurais. Alguns usos gerais das redes
neurais incluem a previsão financeira, tomadas de decisões
em firmas, reconhecimentos de padrões, modelagem de comportamentos,
controles mecânicos, reconhecimento de caráter e
diagnóstico médico. São listadas a seguir
algumas aplicações de redes neurais:
A NASA está usando as redes neurais para ensinar robôs
a pegar objetos colocados aleatoriamente.
Uma rede neural da Pensilvânia, distingue detalhes estruturais
de um determinado lugar e de uma espaçonave a determinada
distância, com base em 10% apenas de sua descrição
total.
Uma empresa de Priston, desenvolveu uma rede neural, usando 300
neurônios, que conseguem ler, em voz alta, entradas de um
texto escrito. A rede produz um código para os sons das
palavras que podem ser traduzidas através da eletrônica.
O reconhecimento da fala está sendo pesquisado na Finlândia.
O sistema desenvolvido decide como os sons da fala japonesa e
finlandesa deveriam ser traduzidos em combinações
de letras.
A força aérea americana está desenvolvendo
um simulador de vôo, baseado em redes neurais, para treinar
novos pilotos em terra.
Num hospital na Carolina do Sul, redes neurais são essenciais
no programa de melhoramento e tratamento médico.
A divisão de sistemas espaciais usa uma rede neural para
monitorar a abertura e o fechamento das válvulas na espaçonave
Atlas.
A Cia Ford de carros tem um sistema neural que lê dados
de sensores de motores de automóveis e determina a provável
causa de problemas existentes.
De acordo com LAWRENCE [1992], muitas outras aplicações
de redes neurais estão sendo desenvolvidas, tais como:
classificar retornos sonares no mar, reconhecer falhas na escrita,
predizer a probabilidade de uma síndrome de mortalidade
infantil, analisar aplicações de empréstimos,
sugerir maneiras de melhor testar cervejas, predizer aquecimentos
solares, avaliar imóveis, diagnosticar falhas na linha
de produção, reconhecer e classificar células
cancerígenas, detectar a presença e a localização
de falhas em concretos, reconhecer e decodificar estruturas químicas,
e muitas outras coisas.
Até mesmo com todos estes avanços, a tecnologia
ainda se encontra em seu estágio inicial.
Pretende-se utilizar neste trabalho o programa BrainMaker, desenvolvido
por California Scientific Software, para realizar correlações
e predições.
4.3.2 Um Relato Histórico
Segundo LAWRENCE [1992], a pesquisa de redes neurais teve seus
primeiros resultados interessantes cerca de 45 anos atrás,
quando McCulloch e Pitts mostraram que uma rede composta de neurônios
com valores binários era capaz de realizar computações.
Em 1949, Donald Hebb, em seu livro Organização do
Comportamento, propôs um mecanismo plausível biologicamente,
pelo qual a aprendizagem poderia ocorrer. A maioria da redes de
aprendizagem de origem moderna tem sua origem nas regras de Hebb
ou em uma variação sobre a mesma.
De acordo com LAWRENCE [1992], a regra de Hebb é muito
simples. Ela afirma que quando se quer que dois neurônios
sejam ativados ao mesmo tempo, as conexões entre os dois
neurônios devem ser fortalecidas. Variações
modernas da regra de Hebb realizam avaliações para
se assegurar de que os neurônios estão representando
conceitos compatíveis e freqüentemente usam a matemática
para decidir exatamente em quanto fortalecer as conexões.
Portanto, a idéia básica desta regra continua a
mesma.
Na década de 1950, a figura dominante na pesquisa de redes
neurais, segundo o mesmo autor, foi Frank Rosenblatt. Ele inventou
uma classe de redes chamadas de Perceptrons e escreveu extensivamente
sobre seu potencial. O perceptron, formulado para se assemelhar
a um modelo sensorial biológico, usava uma combinação
de diferentes camadas de neurônios lineares e uma variação
da regra de Hebb para aprendizagem.
Na década de 1960, continua o autor, Marvin Minsky e Seymour
Papert fizeram um estudo aprofundado das capacidades e limitações
do Perceptrons. Este estudo, culminando com o livro, lançado
em 1969 - Perceptrons, concluiu que havia uma grande classe de
problemas interessantes que nunca poderiam ser resolvidos pela
rede Perceptrons. Este livro quase parou a pesquisa sobre rede
neural durante o fim da década de 70 e o início
da década de 80, enquanto que as pesquisas de Inteligência
Artificial baseada na regra de Papert e Minsky era fundamentada
e conseqüentemente florescia.
No final da década de 60 e começo de 70, o processamento
em série e o computador Von Neumann dominavam tanto a inteligência
artificial quanto a psicologia. Alguns pesquisadores continuaram
trabalhando nas redes neurais. Entre os mais conhecidos estão
Stephen Grossberg, Geoffery Hinton, Teuvo Kohonem, Kunihiko Fukushima
e J. A. Anderson. Seus esforços resultam nos maiores e
fundamentais avanços da teoria de redes neurais.
Anderson e Kohonem simultaneamente desenvolveram um associador
linear, em 1972, que usava neurônios, que poderiam ativar
em frequência variável, em resposta a sinais de entrada,
mais do que faziam os Perceptrons , que simplesmente desligavam
ou ligavam os neurônios.
Stephen Grossberg foi um dos primeiros a analisar algumas das
propriedades da aprendizagem competitiva, em 1976. Sua análise
matemática levou a muitos ensaios que logo vieram a ser
apreciados através de simulações de computador.
Ele identificou, em 1978, a relevância de mecanismos neurais
inspirados em muitas áreas de percepção e
memória, muito antes do campo estar pronto para estas idéias.
O trabalho de J.A. Anderson ajudou James McClelland e David Rumelhart
a desenvolverem a teoria do Processamento Distribuído em
Paralelo (PDP). Anderson, em 1973 e depois em 1977, insistiu na
representação distribuída e mostrou a relevância
de modelos neurais inspirados nas as teorias de aprendizagem de
conceitos.
Em 1982, John Hopfield publicou um trabalho a respeito de redes
neurais. Este trabalho não apenas mostrou que as redes
neurais são capazes de exibir um comportamento muito interessante,
mas também forneceu alguns suportes matemáticos
para a teoria. As duas idéias principais que ele descreveu
neste e em outros trabalhos subseqüentes estavam adicionando
não-linearidades, tais como retroalimentação,
para o sistema, e o conceito de energia global que caracteriza
o estado do sistema. Os trabalhos de Hopfield estimulava uma nova
onda de pesquisa sobre redes neurais.
Além do trabalho dos pesquisadores de redes neurais, de
acordo com LAWRENCE [1992], avanços na biologia, tais como
pesquisa de visão de Marr e Poggio, ajudaram o desenvolvimento
do tema.
Nos anos seguintes ao trabalho de Hopfield, houve vários
modelos de rede importantes e regras de aprendizagem desenvolvidas
que demonstravam capacidades interessantes.
4.3.3 Estrutura Básica e Operação
das
Redes Neurais
Segundo LAWRENCE [1992], há muitos tipos de redes neurais,
mas todas elas têm três características em
comum. A rede neural pode ser descrita quanto aos seus neurônios
individuais, as conexões entre eles - topologia - e sua
regra de aprendizagem. Juntos, estes três elementos constituem
o modelo de rede neural.
Uma rede neural artificial construída com a tecnologia
de hoje tem poucas conexões, se estas forem comparadas
com o número de conexões no cérebro humano.
De acordo com o autor, a rede NECTOC, que converte um texto impresso
em fala, tem cerca de 325 neurônios e 20.000 conexões.
O cérebro humano tem cerca de 100 bilhões de neurônios
e 10 milhões de conexões. Embora o reconhecimento
do padrão ótico possa ser uma exceção,
a maior parte dos problemas pode ser resolvida por uma rede neural
artificial com menos de 500 neurônios e 30.000 conexões.
É provável, complementa o autor, que o cérebro
também tenha muitas redes neurais menores, que resolva
parte dos problemas das redes de nível maior, que consegue
juntar estas partes.
Uma rede neural é formada por camadas de neurônios,
que são conectadas umas às outras. Alguns dos neurônios
tem a função de se comunicar com o mundo externo.
Há os neurônios de entrada, que recebem as informações
e as envia para as camadas internas dos neurônios ou camadas
escondidas e os neurônios de saída, que fornecem
a resposta da rede. Todos os neurônios da camada interna
são escondidos e são parte de um padrão abstrato
interno muito grande.
Os Neurônios
Os neurônios artificiais são também chamados
de elemento de processamento, "nós", unidades
ou células. Cada neurônio recebe os sinais de output
(saída) de muitos outros neurônios. Um neurônio
calcula seu próprio output, efetuando a soma ponderada
de suas entradas, gerando um nível de ativação
e passando isto através de uma função de
transferência ou saída.
O ponto onde os neurônios se comunicam é chamado
de conexão; é análogo a uma sinapse. A força
da conexão entre dois neurônios é chamada
de peso. A coleção de pesos para uma rede inteira
é denominada matriz de pesos.
As Camadas
De acordo com LAWRENCE [1992], os neurônios estão
localizados ou na camada de entrada (input), ou na camada de saída
(output), ou nas camadas escondidas.
Os neurônios de entrada recebem dados do ambiente externo,
que podem ser transmitidos a partir de um console de digitação,
de um arquivo de dados ou de um outro programa.
Os neurônios de saída enviam informação para o ambiente externo ou para algum controle mecânico, por exemplo. Deve-se interpretar o que cada neurônio de saída significa, pelo modo em que a rede foi definida.
Os neurônios escondidos, são todos os neurônios
que ficam entre as camadas de saída e de entrada. Não
é possível de se ver as suas entradas e as suas
saídas porque eles se conectam apenas a outros neurônios.
As Conexões
Uma conexão, segundo LAWRENCE [1992], é um linha
única de comunicação que vai de um neurônio
de envio a um neurônio de recepção.
Pode haver dois tipos de conexões indo para um neurônio,
o excitador e o inibidor. As conexões inibidoras tendem
a evitar a ativação do neurônio. As conexões
excitadoras tendem a causar a ativação do neurônio.
Uma estrutura de rede pode envolver conexões inibidoras
a partir de um neurônio para todo o resto dos neurônios,
na mesma camada. Isto é chamado, segundo o autor, de inibição
material.
A maneira na qual os neurônios estão conectados um
ao outro, tem um efeito enorme na operação da rede.
Especificar as conexões, significa determinar o tipo de
processamento que irá ocorrer.
Às vezes as conexões vão desde a saída
de uma camada até a entrada de uma camada anterior ou a
mesma camada, isto é conhecido como retroalimentação.
O tipo mais comum de modelo de retroalimentação
conecta todos os neurônios a todos os outros neurônios.
Ativações e Funções de Transferência
De acordo com LAWRENCE [1992], os neurônios processam a
entrada e produzem a saída. Cada neurônio assume
a saída de muitos outros neurônios. Uma vez dentro
do neurônio, os sinais ponderados são somados ao
valor líquido. Em muitos modelos eles são simplesmente
adicionados. Os sinais inibitórios têm um valor negativo,
portanto quando adicionado a sinais excitadores, eles reduzem
a saída do sinal global.
A equação seguinte é básica para todas
as redes de neurônios:
Deve-se ler: o valor do sinal líquido para o neurônio
"i" é igual à soma do peso vezes o sinal
de saída para todas as saídas do neurônio
"i" , a partir do neurônio "j" , começando
na saída do neurônio j = 1 e terminando em j = n.
Mais simplificadamente, significa "adicionar todos os sinais
que estão vindo para dentro deste neurônio, levando
a força de conexão de cada sinal em consideração".
O neurônio calcula a sua saída identificando a soma
ponderada de suas entradas e depois aplicando
uma função de ativação, que produz
um nível de ativação
dentro do neurônio. A ativação é passada
através de uma saída, ou transferência, ou
função
, que produz a saída
real para aquele neurônio, para aquele tempo
.
Nos modelos mais simples, a função de ativação
é a soma ponderada das entradas do neurônios. O estado
anterior não é levado em consideração.
Em modelos mais complicados, a função de ativação
também usa o valor de saída anterior do neurônio
para que o neurônio possa se auto-ativar.
Características dos Modelos
Segundo LAWRENCE [1992], as redes neurais têm muitos termos
que descrevem seu comportamento e habilidades. Adaptabilidade,
plasticidade, auto-organização, generalização,
estabilidade dinâmica, convergência, falha, tolerância
e normalização são conceitos que podem ser
aplicados a quase todas as redes neurais.
A Adaptabilidade é a habilidade de modificar uma resposta
em condições de mudança. Quatro processos
produzem esta habilidade: a aprendizagem, auto-organização,
generalização e treinamento. Plasticidade é
a habilidade de um grupo de neurônios adaptar suas funções
a diferentes necessidades ao longo do tempo. Quando uma parte
da rede é danificada, outros neurônios se adaptam
para assumir as funções da parte danificada.
A auto-organização é quando uma rede modifica
todo os seus neurônios de uma vez, de acordo com uma regra
de aprendizagem. Isto é geralmente feito pela modificação
de pesos sinápticos individuais, em respostas a mudanças
nas entradas.
A generalização é a habilidade de uma rede
neural formular uma resposta a um problema que ela nunca viu,
usando informação semelhante ou relacionada.
A estabilidade dinâmica é a habilidade de uma rede
permanecer dentro de seus limites funcionais e alcançar
um estado estável. Para tal rede pode ser dado algum valor
extremo de dados e ela conseguirá retornar ao seu estado
estável.
A convergência é um estado de mudança da rede
quando ela se movimenta em direção ao estado estável.
Tolerância é a habilidade de manter em processo,
embora com precisão e/ou velocidade reduzida quando um
pequeno número de neurônios está com deficiência
ou são destruídos.
A normalização é um ajuste que mantém
pesos dentro de um intervalo prescrito de valores aceitáveis.
Métodos de Aprendizagem
Segundo LAWRENCE [1992], a operação normal de uma
rede neural é uma resposta seletiva a um padrão
sinal. Neste sentido, um neurônio ou um grupo de neurônios,
interagindo prontamente, poderão ser considerados uma trava
(bloqueio) e um padrão de sinal específico, que
pode ser a chave. As propriedades seletivas da trava são
mudadas durante o processo de aprendizagem.
Uma rede neural aprende mudando sua resposta ao mesmo passo que
as entradas mudam. As redes neurais artificiais criadas até
hoje são basicamente associadoras, isto é, elas
aprendem que pares de itens caminham juntos. Por exemplo, verde
combina com o verbo prosseguir e vermelho combina com o verbo
parar.
A regra de aprendizagem é a essência de uma rede
neural. Ela determina como os pesos são ajustados quando
a rede neural adquire experiência. Há muitas regras
de aprendizagem diferentes. As mais conhecidas são as regras
de Hebb, a regra Delta e a regra de Propagação Retrógrada.
4.3.4 Planejamento de Redes Neurais
De acordo com LAWRENCE [1992], para planejar uma rede, é
preciso ter em mente o que se deseja que a rede prediga, generalize
ou reconheça. Não se pode simplesmente jogar todos
os dados numa rede e esperar que ela identifique o que aprender
a partir desses dados. É também necessário,
segundo o autor, que se saiba escolher a informação
na qual a rede neural irá basear suas predições,
generalizações ou reconhecimentos. Esta entrada
deve consistir de informação que esteja disponível
e que seja relevante na determinação da saída
desejada. As redes neurais aprendem a fazer associações
entre entradas e saídas.
O autor orienta que deve-se pensar em que tipos de dados de entrada
a rede neural pode usar para fazer uma associação
com a saída desejada. Tendo uma variedade de tipos de dados,
a chance de encontrar várias correlações
significativas dentro dos dados é aumentada. O autor defende
que é melhor ter muitos tipos de dados do que poucos, pois
a rede neural aprenderá a prestar atenção
aos itens que são importantes e ignorar aqueles que não
interessam.
Uma outra parte importante do processo de planejamento é
preparar para treinar a rede através da adição
de exemplos para que respostas corretas sejam conhecidas.
Os exemplos devem ser organizados como fatos. Um fato é
uma coleção de entradas, agrupadas com saídas
corretas. Pode-se pensar em cada fato como um cartão que
é usado para treinar a rede. De um lado do cartão
está a informação de entrada, e do outro
lado, está a resposta conhecida que a rede aprenderá
a produzir durante o treinamento. O conjunto de cartões
é chamado de conjunto de treinamento.
De acordo com o autor, quanto mais fatos forem coletados, melhor
se poderá treinar a rede. Ainda, deve haver fatos de variedade
suficiente para que a rede seja capaz de generalizar. Se não
se possui muitos exemplos registrados, é possível
treinar um conjunto de treinamento, listando todas as entradas
realísticas possíveis.
Pode acontecer, que se tenha dados demais, embora isso seja um
caso raro. Uma boa regra, é que o número de fatos
não exceda dez vezes o número de conexões.
Os dados podem se apresentar como símbolos, figuras ou
números. No entanto, as redes neurais podem apenas entender
números, e somente aqueles que caem dentro do intervalo
de abrangência da função de transferência
do neurônio. Qualquer dado fora desta abrangência
é clipado. Portanto, os dados devem ser convertidos em
valores numéricos e normalizados, geralmente no intervalo
de 0 a 10 ou de -1 a +1.
No trabalho proposto, as entradas são os atributos de qualidade
(de vida no trabalho e de serviço) evidenciados pelos funcionários
e clientes, num questionário devidamente respondido, cujas
respostas são ponderados, através da frequência
relativa, para o uso no cálculo do consenso, dentro da
lógica difusa. As saídas serão os valores
dos consensos de funcionários e clientes, em cada questão
respondida. Correlações possíveis entre os
atributos, poderão ser percebidas através da análise
dos gráficos construídos também a partir
das respostas aos questionários.
A Construção de uma Rede
Segundo LAWRENCE [1992], é possível de se especificar
o número de neurônios de entrada e de saída
desejados, quando se constrói uma rede neural.
O número de neurônios de entrada e saída são
iguais ao número de itens de entrada e respostas corretas,
respectivamente, num fato de treinamento.
Deve-se também especificar o número de camadas escondidas
e neurônios escondidos. A questão principal na
construção
de rede neural hoje é de quantos neurônios escondidos
devem ser usados. De acordo com o autor, não existe uma
fórmula mágica, porque depende da complexidade do
problema a ser resolvido.
Como regra, diz-se que se deve usar a média entre o número
de neurônios de entrada e o número de neurônios
de saída. Uma outra sugestão seria usar o menor
dos dois números. Uma outra técnica é treinar
com algum número arbitrariamente pequeno de neurônios
escondidos, tal como 10, e adicionar outro neurônio escondido
quando se deseja que o treinamento pare de progredir. O perigo
em se ter muitos neurônios escondidos, de acordo com autor,
é que a rede pode acabar memorizando os fatos, ao invés
de aprender a generalizá-los. Quando isto acontece, a rede
treina muito bem, mas testa muito mal.
Treinamento, Teste e Funcionamento
O treinamento de uma rede neural envolve a apresentação
repetitiva de um conjunto de fatos para a rede. A rede toma cada
entrada, faz uma suposição para a saída,
checa esta suposição contra a saída fornecida,
e faz correções para as conexões internas,
se esta suposição for incorreta. Este processo é
repetido para cada fato por vez, até que a rede aprenda
os fatos o suficiente para ser usado.
Para avaliar a saída da rede para cada um dos fatos de
treinamento, são precisos critérios para julgar
se a saída é boa o suficiente. A maioria dos pacotes
de software permite que se especifique quão próxima
a saída da rede deve estar das saídas já
fornecidas, para ser considerada então uma resposta correta.
Não é preciso treinar a rede até que ela
chegue a cada saída, com perfeição. Geralmente
a rede é treinada até que se consigam saídas
que estejam dentro de um intervalo de confiança (por exemplo,
90%) que seja satisfatório.
A rede pode chegar a um fato correto em uma iteração
e a um fato errado na próxima. Quando a rede comete um
erro durante o treinamento, são feitas alterações
para que a rede compense esse erro. O treinamento deve ser um
processo iterativo, no qual os fatos são apresentados repetidamente
à rede, numa seqüência, até que a rede
consiga uma porcentagem razoável de precisão.
4.4 O BrainMaker
Uma rede neural, de uma forma geral, aprende por associações,
isto é, quando a rede recebe uma entrada A ou algo parecido
com A, ela responde com uma saída B, ou alguma coisa parecida
com B. Os pares de entrada-saída são denominados
"facts" (fato). A saída de um fato é um
treinamento padrão.
O tipo específico de rede neural que o BrainMaker utiliza
é denominada de Rede de Retropropagação.
Ela aprende da mesma forma que as pessoas, com exemplos e repetições.
Esta rede não é programada com regras, mas possui
um sistema de inteligência artificial. É treinada
pela introdução de um conjunto de fatos repetidamente,
na rede. A cada instante uma entrada é apresentada, a rede
envia uma resposta que ela estima será a saída.
A parte de treinamento padrão do fato é utilizada
para determinar se a rede está correta ou errada. Quando
a rede está errada, ela faz correções internamente.
O BrainMaker passa por toda a lista de fatos, introduzindo cada
fato uma vez, e tornando a fazer as correções necessárias.
Quando toda a lista de fatos já foi introduzida, o BrainMaker
começa a construir sobre a lista. Este processo é
repetido até que a rede obtenha todos os fatos corretos.
Os neurônios da rede neural do BrainMaker são organizados
na forma de camadas de neurônios. Um modelo de rede neural
pode ser visto conforme a figura número de número
dois.
O programa BrainMaker apresenta junto com ele um outro programa
auxiliar denominado NetMaker. O BrainMaker e o NetMaker formam
um sistema capaz de planejar, construir, treinar, testar e processar
Redes Neurais. O NetMaker auxilia a adaptação dos
dados para os arquivos de redes neurais. O BrainMakerusa estes
arquivos para definir, testar e processar Redes Neurais.
Os limites do BrainMaker profissional são definidos pelo
número de neurônios por camadas (8192), pelas conexões
por camadas (memória disponível), pelo número
de camadas (8 camadas), pelos caracteres na linha de entrada (4096)
e pelo número máximo de colunas (4096).
Os dados de saída do BrainMaker podem se apresentar na
forma de "termômetro" (pequenos gráficos
de barra) ou numérica. Os termômetros não
são exatos, mostrando apenas oito valores diferentes, não
podendo assumir valores negativos, mas sua principal vantagem
é a possibilidade de visualização durante
o treinamento da rede e a
rapidez.
Um neurônio é geralmente um dispositivo simples.
O neurônio recebe muitos sinais de entrada. Cada linha de
entrada para o neurônio tem um peso de conexão. Se
este peso é 1, o sinal de entrada é usado pelo neurônio
exatamente como ele foi recebido. Se o peso for 1/2, o sinal de
entrada será multiplicado por 1/2 e, então utilizado
pelo neurônio. Novamente, este sinal fará o neurônio
disparar, mas com outro sinal. Se o peso de conexão for
-2, o sinal de entrada é dobrado e, então usado
pelo neurônio. Mas, por causa do sinal negativo, o neurônio
será inibido para disparo. Quando uma rede é informada
que provavelmente está errada, durante o treinamento, ela
muda seus pesos de conexão e, então ela verá
qual entrada terá mais probabilidade de obter a resposta
certa.
4.4.1 A Função Sigmoide
A função de transferência é aplicada
para cada valor de neurônio de ativação, para
gerar cada neurônio de saída. O BrainMaker trabalha
com diferentes espécies de funções de transferência
para neurônios. Os tipos de funções que ele
suporta são as funções Linear, Linear Thereshold,
Step, Sigmoid e Gaussiana. Contudo, a função
default do BrainMaker é a Sigmoid, ou uma função
semi-linear, com um gain de valor 1.
Alterações na função de transferência
é sempre uma má idéia. O default do
BrainMaker é sempre a melhor escolha., de acordo com LAWRENCE
[1992], a não ser que se tenha uma boa razão para
fazer outra escolha.
Uma função de pertinência sigmoide, também
denominada função S-shaped, ou função
achatada, é aquela cujo output é contínuo,
sendo função monotônica no input. As
funções e suas derivadas são contínuas
em seu todo. Aproxima-se assintoticamente de valores pequenos
e grandes (low e high). O centro é o valor
do input, cujo output é dado por (low
+ high)/2. O crescimento é diretamente proporcional
à derivada da função no ponto central. Por
ser função linear e não-linear, e continuamente
diferenciável, ela possui muitas propriedades desejáveis
quando usada para a construção de redes neurais.
O algoritmo da função de retropopagação,
em particular, é o motivo pelo qual ela é recomendada
para ser usada no BrainMaker, pois as redes se saem bem com estas
funções. Ao se observar o seu gráfico, pode-se
perceber que, para um crescimento do limite superior (gain >>1),
a função sigmoide torna-se quase uma função
Step. Quando de seu crescimento do limite inferior (gain <<1,
mas >0), ela se aproxima de uma função linear.
Considera-se que um crescimento de uma unidade é geralmente
uma boa escolha.
4.5 Correlação
A correlação mede o grau de relação
entre as variáveis, procurando determinar quão bem
uma equação linear, ou de outra espécie,
descreve ou explica a relação entre as variáveis.
De acordo com SPIEGEL [1993] se todos os valores das variáveis
satisfazem exatamente uma equação, diz-se que elas
estão perfeitamente correlacionadas ou que há
correlação
perfeita entre elas. Quando estão em jogo apenas duas variáveis,
fala-se em correlação simples.
Para se determinar, de modo quantitativo o problema da dispersão
de dados amostrados, em relação a retas ou a curvas,
o autor indica ser necessário estabelecer medidas de
correlação.
Se for admitida uma relação linear entre duas variáveis,
e se n for definido como o número de pares (X,Y), o coeficiente
de correlação linear é dado por
O valor de r varia entre -1 e +1. Os sinais são utilizados
para indicar correlação linear positiva e negativa.
Note-se que r independe das unidades adotadas. Valores de r próximos
de -1 indicam forte correlação linear negativa entre
as variáveis X e Y, enquanto que valores próximos
de +1 indicam forte correlação linear positiva.
As ferramentas matemáticas apresentadas neste capítulo do trabalho, especialmente a parte que diz respeito à Lógica Difusa e às Redes Neurais, foram utilizadas para a obtenção do consenso de opiniões dos indivíduos amostrados. A parte que trata da correlação, foi utilizada para verificar o grau de relação existente entre a qualidade de vida no trabalho e a qualidade no serviço prestado. No capítulo que segue discorre-se sobre a Análise Ergonômica do Trabalho, onde são apresentadas as questões relativas à qualidade de vida percebida pelos funcionários em seu ambiente de trabalho.