CAPÍTULO IV

Técnicas de Análise Utilizadas

São apresentadas, nesta parte do trabalho, as ferramentas matemáticas utilizadas para a realização da modelagem do comportamento humano, no caso, bancários e clientes. Algumas aplicações dos conjuntos difusos na ergonomia são citadas, seguidas pela conceituação de difusibilidade e noções da teoria do consenso, que está relacionada com o problema de tomadas de decisão de um grupo de indivíduos. São apresentadas, em seguida, aplicações de redes neurais com um histórico sobre o uso das mesmas. São, ainda, apresentadas a estrutura básica de uma rede neural e as operações concernente a elas, com explicações sobre os neurônios, as camadas de neurônios, as conexões entre os neurônios e as ativações e funções de transferências. É apresentado, em seguida, uma caracterização dos modelos de redes neurais e os métodos de aprendizagem de uma rede neural. Discorre-se, ainda, sobre o planejamento de uma rede neural, abordando sua construção, seu treinamento, testagem e funcionamento. Segue nesta parte do trabalho um breve explicativo sobre o software de Redes Neurais BrainMaker, com suas limitações e a função utilizada por ele. A seção termina com uma conceituação do coeficiente de correlação linear, que é utilizado na tese para correlacionar o índice de qualidade percebida no trabalho, pelos funcionários, com o índice de qualidade percebida no serviço, pelos clientes.


4.1 Ferramentas Matemáticas Para Modelagem do Comportamento Humano

A ergonomia está preocupada em considerar características, expectativas, comportamentos humanos no planejamento daquilo que as pessoas usam em seu trabalho, na sua vida diária e no ambiente no qual elas trabalham e vivem.

KARWOWSKI [1986] explica que as "coisas" que são planejadas, são sistemas complexos de homem-máquina. "Planejar" implica em tomar decisões, ou seja, escolher valores para variáveis de planejamento para que os objetivos do sistema, nesse caso a adequação do trabalho à pessoa, sejam otimizados. Daí, conclui o autor, a importância do uso de modelos matemáticos no processo de planejamento.

De acordo com KARWOWSKI [1986], as razões mais extremistas para a construção de modelos em geral, e modelos de performance humana em específico, são tentar fornecer o seguinte:

1) uma estrutura sistemática que reduza a carga de memória do investigador e capacite-o a não deixar de perceber as importantes características do problema;

2) uma base para extrapolar da informação dada para chegar a novas perspectivas e novas inferências testáveis ou observáveis a respeito do sistema ou do comportamento do componente;

3) Um instrumento de planejamento do sistema que permita geração de soluções de planejamento diretamente;

4) uma incorporação de conceitos ou de parâmetros derivados que sejam úteis como medidas de desempenho no ambiente simulado ou real;

5) um componente de sistema a ser usado no ambiente operacional para gerar comportamento para comparação com o comportamento do operador real a fim de antecipar um dispositivo de dados necessários para introduzir estratégias alternativas ou monitorar o desempenho da performance do operador;

6) uma consideração de aspectos do problema que seriam de outro modo negligenciados ou obscuros.

Segundo KARWOWSKI [1986], o analista de ergonomia deverá experimentar um modelo matemático do sistema uma vez que pode ser impraticável experimentar o sistema real. Segundo ele, esta impraticabilidade pode ser resultante de vários fatores, conforme segue:

1. O sistema real é apenas proposto, e portanto, não está em existência.

2. O número e o campo dos valores atingíveis da variáveis de modelo são tão grande que experimentar do sistema real seria custoso demais e demandaria tempo demais.

3. A experimentação do sistema existente é inseguro, especialmente quando os seres humanos estão envolvidos.

Segundo o mesmo autor, um modelo é uma representação de um sistema real. A característica principal de um modelo é o uso de símbolos, equações e outras afirmações matemáticas para representar a realidade.

Todos os modelos matemáticos, de acordo com o autor, representam uma maneira de converter entradas em saídas. As entradas para um modelo podem ser controláveis ou não-controláveis. As entradas controláveis são chamadas de variáveis de decisão ou variáveis de planejamento. Uma especificação de um conjunto de valores para as variáveis de decisão é chamada de solução. As variáveis não-controláveis são freqüentemente chamadas de parâmetros do modelo. Um exemplo de um parâmetro do modelo seria o tempo exigido para um trabalhador realizar uma determinada tarefa.

O cerne de um modelo matemático é uma representação do processo (do sistema real) que converte as entradas em saídas. Esta representação é realizada através do uso de funções de variáveis de entradas.

KARWOWSKI [1986], defende o ponto de vista de que, "independente do nível do trabalho humano, três tipos de difusibilidade estão presentes e deveriam ser levados em conta no sistema homem-máquina-ambiente, isto é: uma difusibilidade vinda da falta de habilidade do homem de adquirir e processar quantidades adequadas de informação a respeito do comportamento de um determinado subsistema (ou do sistema total); uma difusibilidade devida a superficialidade das relações entre as pessoas e seus ambientes de trabalho, e complexidade das regras e princípios subjacentes a estes sistemas e finalmente, uma difusibilidade inerente aos processos do pensamento humano e percepções subjetivas do mundo externo".

Para o autor, a última categoria de difusibilidade é a de maior importância para os estudos da ergonomia, e deve ser tratada com mais cuidado. É justamente esta a preocupação do presente trabalho, isto é, tratar os processos do pensamento e percepções humanas segundo a lógica difusa.

4.2 Conjuntos Difusos

4.2.1 Aplicações da Teoria de Conjuntos Difusos na Ergonomia

De acordo com KARWOWSKI [1986], desde o seu nascimento, em 1965, milhares de trabalhos e mais de 20 livros foram publicados em relação à teoria de conjuntos difusos.

Segundo o mesmo autor, a teoria de conjuntos difusos tem sido aplicadas com sucesso na modelagem de sistemas mal definidos numa variedade de disciplinas (psicologia cognitiva, processo de informação e controle, ciência de tomada de decisão, ciências biológicas e médicas, sociologia e linguística, processamento de imagens e reconhecimento de padrões e inteligência artificial). Atualmente há também muitas aplicações da metodologia difusa em fatores humanos.

De acordo com o autor, vários exemplos de aplicações da teoria difusa em ergonomia podem ser apontados:

Segundo KARWOWSKI [1986], em 1959, antes de Zadeh publicar seu primeiro trabalho sobre conjuntos difusos, Helmer e Rascher tinham indicado a necessidade de novos procedimentos de raciocínio que seriam adequados no campo das ciências inexatas, isto é, ciências onde o raciocínio é informal, a terminologia às vezes exibe uma imprecisão inerente e o raciocínio pode, então, depender de referência a fatos percebidos intuitivamente.

Em 1977, Saaty distinguiu dois tipos de difusibilidade na percepção leiga (por exemplo, percepção de intensidade de iluminação) e difusibilidade no significado, pregando que a difusibilidade é uma qualidade básica do entendimento.

Em 1979, Willaeys e Malvache investigaram a percepção da informação vestibular e visual numa inspeção industrial ou chamada de "veja e decida" dentro de tarefas de controle.

Terano e colegas, em 1981, introduziram uma abordagem de conjunto difuso em uma análise de árvore de falhas, e estudaram a difusibilidade humana a partir do ponto de vista de segurança dos sistemas homem-máquina.

No mesmo ano, Hirsch usou uma relação dissimulada difusa para descrever padrões vocais humanos.

Em 1982, Benson desenvolveu um programa gráfico de computador interativo para tarefas analíticas que não são bem definidas ou que utilizam dados imprecisos.

Karwowski, também em 1982, propôs uma abordagem difusa na abordagem do relacionamento entre repostas de stress psicológicos e fisiológicos biomecânicos de um operador humano realizando tarefas de levantamento de material manual.

No mesmo ano, Mital e Ulgen usaram a teoria dos conjuntos difusos para modelar informação em relação à tarefa de decisão e o estado clínico e mental do operador.

Ainda em 1982, Kramer e Rohr desenvolveram um modelo difuso de comportamento de motoristas baseado em um padrão visual simulado processando-se em uma rua de controle.

No período 1983-84, Karwowski e colegas desenvolveram um modelo baseado num conjunto difuso para avaliar a aceitabilidade de stress em trabalhos de levantamento manual

Simcox, em 1984, usou a abordagem linguística para elaborar um método de comunicação pragmática em dispositivos gráficos.

No mesmo ano, Hunt e Rouse propuseram um modelo baseado em regra difusa de solução de problema humano em tarefas de diagnóstico de falhas.

Onisawa, em 1988 desenvolveu vários conceitos difusos para melhorar os estudos de questões de confiabilidade humana.

Em 1989, Luczak e Ge aplicaram a modelagem difusa para investigar as relações entre o peso físico e o peso da carga percebida.

Em 1990, Karwowski e colegas desenvolveram um modelo para estudar a interação homem-computador na tarefa de edição de textos.

De acordo com KARWOWSKI [1986], a teoria dos conjuntos difusos, concernente com a representação matemática e a manipulação dos graus de indecisão, é um instrumento poderoso para a análise de sistemas de trabalho humano. Segundo o autor, tais sistemas são complexos, sua estrutura subjacente e as relações que os governam não são precisamente conhecidas, suas descrições são, geralmente, de natureza linguística, e as definições de muitas variáveis e vários conceitos são vagos.

ZADEH [1974], defende que "embora as técnicas matemáticas convencionais tenham sido e continuarão a ser aplicadas à análise de sistemas humanísticos, está claro que a grande complexidade de tais sistemas exige abordagens que sejam significativamente diferentes dos métodos tradicionais - métodos que são altamente eficientes quando aplicados a sistemas mecanísticos, mas deixam de ser precisos em relação aos sistemas nos quais o comportamento humano tem um papel importante".

KARWOWSKI [1991] afirma que tanto a precisão quanto a certeza são ideais falsos que são impossíveis de ser atingidos e, portanto freqüentemente enganadores se aceitos como guias. De acordo com o filósofo, "a busca da precisão é análoga à busca da certeza e ambas deveriam ser abandonadas".

ZIMMERMAMM [1985] indica que situações reais freqüentemente não são exatas e determinísticas e não podem ser descritas precisamente.

Como sugerido por KARWOWSKI [1991], existem duas vantagens potenciais para aplicações de uma abordagem difusa nas ciências humanas. A primeira é de que a difusibilidade por si só pode ser uma metáfora útil ou um modelo para linguagem humana e processos de categorização e, segundo, que a matemática difusa pode ser capaz de aumentar as técnicas estatísticas convencionais na análise de dados difusos. O autor revisou vários métodos alternativos para a análise de dados difusos e concluiu que métodos difusos são suplementos úteis para técnicas estatísticas.

Conclui KARWOWSKI [1986] que, pesquisadores de ergonomia devem se ater ao potencial enorme oferecido pelos métodos difusos e explorar totalmente suas aplicações na análise de sistemas ergonômicos. O presente trabalho pretende, portando, utilizar a lógica difusa na análise de sistemas ergonômicos.

4.2.2 Conceito de Difusibilidade

Segundo KARWOWSKI [1986], o conceito de um subconjunto difuso foi introduzido pela primeira vez por L.A. Zadeh, em 1965. No entanto, de acordo com DUBOIS [1980], o termo "ensemble flou" - uma contraposição francesa à expressão conjuntos difusos - foi usado por Menger em 1951.

De acordo com ZADEH [1965], a teoria dos conjuntos difusos representa uma tentativa de se construir uma estrutura conceitual para o tratamento sistemático da imprecisão e da incerteza devido à difusibilidade tanto nos modos quantitativos quanto qualitativos. Tal estrutura é muito necessária na área da ergonomia.

Como foi apontado por SINGLETON [1982] "a maioria das características humanas têm dependências contextuais complexas que não são prontamente expressadas em tabulações de números, ou até mesmo em equações multivariadas".

A teoria dos conjuntos difusos, de acordo com KARWOWSKI [1991], que permite uma interpretação e manipulação de informação imprecisa e reconhecimento e avaliação de incerteza devido a difusibilidade (e aleatoriedade), pode ser a solução mais próxima à necessidade da ergonomia.

O tratamento formal da imprecisão é um passo importante e necessário em direção ao manuseio mais realístico da imprecisão e incerteza próprios do ser humano e de seu comportamento no processo de trabalho.

De acordo com KARWOWSKI [1986], um conjunto difuso é uma generalização de idéias de um conjunto clássico. Um subconjunto difuso pode ser visto como um predicado cujos valores verdade são retirados do intervalo [0,1] e não de um conjunto clássico. Desta maneira, o subconjunto difuso tem a sua lógica dentro de uma lógica de multivalores. O subconjunto difuso permite uma descrição de conceitos na qual o limite entre ter pertinência e não ter pertinência não é bem definido.

Em geral, um subconjunto difuso é sempre definido dentro da estrutura clássica de conjunto, chamado de universo de discurso.

ZADEH [1965], define um subconjunto difuso A na forma dada a seguir.

Definição 1.0 - [ZADEH, 1965] - Um subconjunto difuso A de um universo de discurso U, é definido por uma função de pertinência

: U -> [0,1]

que associa a cada elemento de U um número () do intervalo [0,1], onde () representa o grau de pertinência de em A.

Formalmente, A pode ser descrito como:

A = { (, ()), U}

O domínio de A é o conjunto de pontos em U no qual () é positiva.

Para simplificar a notação, um subconjunto difuso A com função de pertinência discreta pode ser expresso como:

, onde

, i = 1,2,3....n é o grau de pertinência de em A, e


KARWOWSKI [1986] também apresenta uma definição de subconjuntos difusos, como segue.

Definição 2.0 - [KARWOWSKI, 1986] - Seja X um conjunto correspondente ao universo. Um subconjunto difuso A de X é um subconjunto no qual o grau de pertinência de qualquer elemento x X é retirado do intervalo [0,1].

Exemplo 1.0 - [KARWOWSKI, 1986] - Seja

X = {}

A = {}

Na estrutura da teoria dos conjuntos difusos, de acordo com o autor, os termos na forma a1/x1 são entendidos para indicar que o elemento x1 tem um grau de pertinência a1 no subconjunto difuso A. Os conjuntos clássicos são casos especiais de conjuntos difusos, nos quais os graus de pertinência são simplesmente 0 ou 1 (zero ou um).


4.2.3 Teoria do Consenso

Uma classe mais geral de problemas de tomada de decisão está relacionada com decisões tomadas por um grupo.

Definição 3.0 - [DUBOIS, 1980] - Uma relação de preferência social R é uma relação difusa obtida pela agregação de preferências de m indivíduos. Seja o número de indivíduos que preferem a alternativa à , então R é definida como:


Definição 4.0 - [DUBOIS, 1980] - As seguintes medidas escalares fornecem as medidas dos valores do consenso


onde n é o número de alternativas e tr é o traço da matriz.

Definição 5.0 - [DUBOIS, 1980] - Se R denota a relação difusa de preferência do grupo, quando o consenso é alcançado, R é uma relação difusa recíproca, isto é,


por convenção. Onde, 1 indica que é totalmente preterido a ; 0 indica que e têm preferências iguais.

DUBOIS [1980] definiu uma regra para a determinação de consenso em um grupo de m indivíduos. O método pode ser resumido em algumas etapas, como segue:

1. Calcula-se , que representa o número de indivíduos que preferem a alternativa à .

2. Contabiliza-se o total na matriz A.

3. Divide-se cada célula de A pelo número de indivíduos que opinaram, obtendo-se a matriz R, que expressa uma relação difusa de preferência.

4. Calcula-se o traço da matriz .

5. Utiliza-se a fórmula para calcular o grau de consenso C.

6. Realiza-se cortes no conjunto difuso F, para se estabelecer qual conjunto de alternativas deve ser escolhido.

Exemplo 2.0 - Suponha que uma análise ergonômica de certa organização fosse realizada por um grupo de especialistas, onde 100 funcionários entrevistados devessem optar por uma das seguintes alternativas, por ordem de prioridade, na análise das condições ambientais do trabalho.

a) ambiente tóxico

b) ambiente arquitetônico

c) ambiente sonoro

Cada um dos 100 funcionários votou na ordem das alternativas que considerava mais prioritária. Os supostos resultados são os seguintes:

BCA - 35

BAC - 28

CBA - 23

CAB - 14




1. Cálculo de


2. Matriz A

A = ; portanto, A =

3. Matriz R

R =

4. Traço de

tr() = 1,8898

5. Cálculo de C

C = 0,6299

6. Conjunto de alternativas escolhido

A1 = não há alternativa

A .86 = B é preferível à A

A .72 = B e C são preferíveis à A

A .62 = B é preferível a C; B e C são preferíveis à A

Conclusão: Deve-se analisar com maior cuidado o ambiente arquitetônico, depois o sonoro e, finalmente o ambiente tóxico, na opinião dos entrevistados.

4.3 Redes Neurais

De acordo com LAWRENCE [1992], as redes neurais artificiais são formadas de centenas ou milhares de neurônios simulados que estão conectados do mesmo modo que os neurônios cerebrais e, portanto, são capazes de aprender de maneira semelhante às pessoas. As Redes Neurais artificiais usam um grupo altamente interconectado de neurônios que processam informação em paralelo.

Segundo o autor, atualmente é possível utilizar um simulador de redes neurais para testar as teorias de redes neurais ou para fazer aplicações. Um simulador de redes neurais é um programa (um conjunto de instruções computacionais) que cria um modelo de neurônios e as conexões entre eles, e depois treina este modelo. De uma forma geral, todas as redes neurais aprendem por associação.

Os neurônios, numa rede neural, são geralmente organizados em três camadas: a camada de entrada (input), a camada escondida ou intermediária e a saída (output). Raramente mais do que uma camada intermediária é usada.

A camada intermediária faz associação entre as entradas e saídas. Ela é chamada de camada intermediária porque não tem nenhuma conexão direta com o meio externo.

Há muitas maneiras diferentes em que as redes neurais podem aprender. O método de aprendizagem mais popular é por exemplo e repetição, também chamada retropropagação.

Toda vez que a rede fornece uma saída errada, o software faz as mudanças em suas conexões internas para que da próxima vez que receber as mesmas entradas, seja mais provável que produza uma resposta correta.

As conexões são ajustadas a fim de que as entradas sejam associadas mais fortemente com a saída correta e menos fortemente com a saída incorreta. Este treinamento é repetido para um conjunto de exemplos até que a rede aprenda as respostas corretas. Uma vez que a rede esteja treinada usando entradas e saídas pré-selecionadas, é possível colocá-la em funcionamento com novas informações de entrada (sem qualquer saída fornecida) e fazer com que ela então reconheça, generalize ou faça predição a respeito da resposta desejada.

4.3.1 Aplicações de Redes Neurais

Segundo LAWRENCE [1992], uma quantidade razoável de trabalhos tem sido feito com redes neurais. Alguns usos gerais das redes neurais incluem a previsão financeira, tomadas de decisões em firmas, reconhecimentos de padrões, modelagem de comportamentos, controles mecânicos, reconhecimento de caráter e diagnóstico médico. São listadas a seguir algumas aplicações de redes neurais:

A NASA está usando as redes neurais para ensinar robôs a pegar objetos colocados aleatoriamente.

Uma rede neural da Pensilvânia, distingue detalhes estruturais de um determinado lugar e de uma espaçonave a determinada distância, com base em 10% apenas de sua descrição total.

Uma empresa de Priston, desenvolveu uma rede neural, usando 300 neurônios, que conseguem ler, em voz alta, entradas de um texto escrito. A rede produz um código para os sons das palavras que podem ser traduzidas através da eletrônica.

O reconhecimento da fala está sendo pesquisado na Finlândia. O sistema desenvolvido decide como os sons da fala japonesa e finlandesa deveriam ser traduzidos em combinações de letras.

A força aérea americana está desenvolvendo um simulador de vôo, baseado em redes neurais, para treinar novos pilotos em terra.

Num hospital na Carolina do Sul, redes neurais são essenciais no programa de melhoramento e tratamento médico.

A divisão de sistemas espaciais usa uma rede neural para monitorar a abertura e o fechamento das válvulas na espaçonave Atlas.

A Cia Ford de carros tem um sistema neural que lê dados de sensores de motores de automóveis e determina a provável causa de problemas existentes.

De acordo com LAWRENCE [1992], muitas outras aplicações de redes neurais estão sendo desenvolvidas, tais como: classificar retornos sonares no mar, reconhecer falhas na escrita, predizer a probabilidade de uma síndrome de mortalidade infantil, analisar aplicações de empréstimos, sugerir maneiras de melhor testar cervejas, predizer aquecimentos solares, avaliar imóveis, diagnosticar falhas na linha de produção, reconhecer e classificar células cancerígenas, detectar a presença e a localização de falhas em concretos, reconhecer e decodificar estruturas químicas, e muitas outras coisas.

Até mesmo com todos estes avanços, a tecnologia ainda se encontra em seu estágio inicial.

Pretende-se utilizar neste trabalho o programa BrainMaker, desenvolvido por California Scientific Software, para realizar correlações e predições.

4.3.2 Um Relato Histórico

Segundo LAWRENCE [1992], a pesquisa de redes neurais teve seus primeiros resultados interessantes cerca de 45 anos atrás, quando McCulloch e Pitts mostraram que uma rede composta de neurônios com valores binários era capaz de realizar computações.

Em 1949, Donald Hebb, em seu livro Organização do Comportamento, propôs um mecanismo plausível biologicamente, pelo qual a aprendizagem poderia ocorrer. A maioria da redes de aprendizagem de origem moderna tem sua origem nas regras de Hebb ou em uma variação sobre a mesma.

De acordo com LAWRENCE [1992], a regra de Hebb é muito simples. Ela afirma que quando se quer que dois neurônios sejam ativados ao mesmo tempo, as conexões entre os dois neurônios devem ser fortalecidas. Variações modernas da regra de Hebb realizam avaliações para se assegurar de que os neurônios estão representando conceitos compatíveis e freqüentemente usam a matemática para decidir exatamente em quanto fortalecer as conexões. Portanto, a idéia básica desta regra continua a mesma.

Na década de 1950, a figura dominante na pesquisa de redes neurais, segundo o mesmo autor, foi Frank Rosenblatt. Ele inventou uma classe de redes chamadas de Perceptrons e escreveu extensivamente sobre seu potencial. O perceptron, formulado para se assemelhar a um modelo sensorial biológico, usava uma combinação de diferentes camadas de neurônios lineares e uma variação da regra de Hebb para aprendizagem.

Na década de 1960, continua o autor, Marvin Minsky e Seymour Papert fizeram um estudo aprofundado das capacidades e limitações do Perceptrons. Este estudo, culminando com o livro, lançado em 1969 - Perceptrons, concluiu que havia uma grande classe de problemas interessantes que nunca poderiam ser resolvidos pela rede Perceptrons. Este livro quase parou a pesquisa sobre rede neural durante o fim da década de 70 e o início da década de 80, enquanto que as pesquisas de Inteligência Artificial baseada na regra de Papert e Minsky era fundamentada e conseqüentemente florescia.

No final da década de 60 e começo de 70, o processamento em série e o computador Von Neumann dominavam tanto a inteligência artificial quanto a psicologia. Alguns pesquisadores continuaram trabalhando nas redes neurais. Entre os mais conhecidos estão Stephen Grossberg, Geoffery Hinton, Teuvo Kohonem, Kunihiko Fukushima e J. A. Anderson. Seus esforços resultam nos maiores e fundamentais avanços da teoria de redes neurais.

Anderson e Kohonem simultaneamente desenvolveram um associador linear, em 1972, que usava neurônios, que poderiam ativar em frequência variável, em resposta a sinais de entrada, mais do que faziam os Perceptrons , que simplesmente desligavam ou ligavam os neurônios.

Stephen Grossberg foi um dos primeiros a analisar algumas das propriedades da aprendizagem competitiva, em 1976. Sua análise matemática levou a muitos ensaios que logo vieram a ser apreciados através de simulações de computador. Ele identificou, em 1978, a relevância de mecanismos neurais inspirados em muitas áreas de percepção e memória, muito antes do campo estar pronto para estas idéias.

O trabalho de J.A. Anderson ajudou James McClelland e David Rumelhart a desenvolverem a teoria do Processamento Distribuído em Paralelo (PDP). Anderson, em 1973 e depois em 1977, insistiu na representação distribuída e mostrou a relevância de modelos neurais inspirados nas as teorias de aprendizagem de conceitos.

Em 1982, John Hopfield publicou um trabalho a respeito de redes neurais. Este trabalho não apenas mostrou que as redes neurais são capazes de exibir um comportamento muito interessante, mas também forneceu alguns suportes matemáticos para a teoria. As duas idéias principais que ele descreveu neste e em outros trabalhos subseqüentes estavam adicionando não-linearidades, tais como retroalimentação, para o sistema, e o conceito de energia global que caracteriza o estado do sistema. Os trabalhos de Hopfield estimulava uma nova onda de pesquisa sobre redes neurais.

Além do trabalho dos pesquisadores de redes neurais, de acordo com LAWRENCE [1992], avanços na biologia, tais como pesquisa de visão de Marr e Poggio, ajudaram o desenvolvimento do tema.

Nos anos seguintes ao trabalho de Hopfield, houve vários modelos de rede importantes e regras de aprendizagem desenvolvidas que demonstravam capacidades interessantes.

4.3.3 Estrutura Básica e Operação das Redes Neurais

Segundo LAWRENCE [1992], há muitos tipos de redes neurais, mas todas elas têm três características em comum. A rede neural pode ser descrita quanto aos seus neurônios individuais, as conexões entre eles - topologia - e sua regra de aprendizagem. Juntos, estes três elementos constituem o modelo de rede neural.

Uma rede neural artificial construída com a tecnologia de hoje tem poucas conexões, se estas forem comparadas com o número de conexões no cérebro humano.

De acordo com o autor, a rede NECTOC, que converte um texto impresso em fala, tem cerca de 325 neurônios e 20.000 conexões. O cérebro humano tem cerca de 100 bilhões de neurônios e 10 milhões de conexões. Embora o reconhecimento do padrão ótico possa ser uma exceção, a maior parte dos problemas pode ser resolvida por uma rede neural artificial com menos de 500 neurônios e 30.000 conexões. É provável, complementa o autor, que o cérebro também tenha muitas redes neurais menores, que resolva parte dos problemas das redes de nível maior, que consegue juntar estas partes.

Uma rede neural é formada por camadas de neurônios, que são conectadas umas às outras. Alguns dos neurônios tem a função de se comunicar com o mundo externo. Há os neurônios de entrada, que recebem as informações e as envia para as camadas internas dos neurônios ou camadas escondidas e os neurônios de saída, que fornecem a resposta da rede. Todos os neurônios da camada interna são escondidos e são parte de um padrão abstrato interno muito grande.

Os Neurônios

Os neurônios artificiais são também chamados de elemento de processamento, "nós", unidades ou células. Cada neurônio recebe os sinais de output (saída) de muitos outros neurônios. Um neurônio calcula seu próprio output, efetuando a soma ponderada de suas entradas, gerando um nível de ativação e passando isto através de uma função de transferência ou saída.

O ponto onde os neurônios se comunicam é chamado de conexão; é análogo a uma sinapse. A força da conexão entre dois neurônios é chamada de peso. A coleção de pesos para uma rede inteira é denominada matriz de pesos.

As Camadas

De acordo com LAWRENCE [1992], os neurônios estão localizados ou na camada de entrada (input), ou na camada de saída (output), ou nas camadas escondidas.

Os neurônios de entrada recebem dados do ambiente externo, que podem ser transmitidos a partir de um console de digitação, de um arquivo de dados ou de um outro programa.

Os neurônios de saída enviam informação para o ambiente externo ou para algum controle mecânico, por exemplo. Deve-se interpretar o que cada neurônio de saída significa, pelo modo em que a rede foi definida.

Os neurônios escondidos, são todos os neurônios que ficam entre as camadas de saída e de entrada. Não é possível de se ver as suas entradas e as suas saídas porque eles se conectam apenas a outros neurônios.

As Conexões

Uma conexão, segundo LAWRENCE [1992], é um linha única de comunicação que vai de um neurônio de envio a um neurônio de recepção.

Pode haver dois tipos de conexões indo para um neurônio, o excitador e o inibidor. As conexões inibidoras tendem a evitar a ativação do neurônio. As conexões excitadoras tendem a causar a ativação do neurônio.

Uma estrutura de rede pode envolver conexões inibidoras a partir de um neurônio para todo o resto dos neurônios, na mesma camada. Isto é chamado, segundo o autor, de inibição material.

A maneira na qual os neurônios estão conectados um ao outro, tem um efeito enorme na operação da rede. Especificar as conexões, significa determinar o tipo de processamento que irá ocorrer.

Às vezes as conexões vão desde a saída de uma camada até a entrada de uma camada anterior ou a mesma camada, isto é conhecido como retroalimentação. O tipo mais comum de modelo de retroalimentação conecta todos os neurônios a todos os outros neurônios.

Ativações e Funções de Transferência

De acordo com LAWRENCE [1992], os neurônios processam a entrada e produzem a saída. Cada neurônio assume a saída de muitos outros neurônios. Uma vez dentro do neurônio, os sinais ponderados são somados ao valor líquido. Em muitos modelos eles são simplesmente adicionados. Os sinais inibitórios têm um valor negativo, portanto quando adicionado a sinais excitadores, eles reduzem a saída do sinal global.

A equação seguinte é básica para todas as redes de neurônios:


Deve-se ler: o valor do sinal líquido para o neurônio "i" é igual à soma do peso vezes o sinal de saída para todas as saídas do neurônio "i" , a partir do neurônio "j" , começando na saída do neurônio j = 1 e terminando em j = n.

Mais simplificadamente, significa "adicionar todos os sinais que estão vindo para dentro deste neurônio, levando a força de conexão de cada sinal em consideração".

O neurônio calcula a sua saída identificando a soma ponderada de suas entradas e depois aplicando uma função de ativação, que produz um nível de ativação dentro do neurônio. A ativação é passada através de uma saída, ou transferência, ou função , que produz a saída real para aquele neurônio, para aquele tempo .

Nos modelos mais simples, a função de ativação é a soma ponderada das entradas do neurônios. O estado anterior não é levado em consideração. Em modelos mais complicados, a função de ativação também usa o valor de saída anterior do neurônio para que o neurônio possa se auto-ativar.

Características dos Modelos

Segundo LAWRENCE [1992], as redes neurais têm muitos termos que descrevem seu comportamento e habilidades. Adaptabilidade, plasticidade, auto-organização, generalização, estabilidade dinâmica, convergência, falha, tolerância e normalização são conceitos que podem ser aplicados a quase todas as redes neurais.

A Adaptabilidade é a habilidade de modificar uma resposta em condições de mudança. Quatro processos produzem esta habilidade: a aprendizagem, auto-organização, generalização e treinamento. Plasticidade é a habilidade de um grupo de neurônios adaptar suas funções a diferentes necessidades ao longo do tempo. Quando uma parte da rede é danificada, outros neurônios se adaptam para assumir as funções da parte danificada.

A auto-organização é quando uma rede modifica todo os seus neurônios de uma vez, de acordo com uma regra de aprendizagem. Isto é geralmente feito pela modificação de pesos sinápticos individuais, em respostas a mudanças nas entradas.

A generalização é a habilidade de uma rede neural formular uma resposta a um problema que ela nunca viu, usando informação semelhante ou relacionada.

A estabilidade dinâmica é a habilidade de uma rede permanecer dentro de seus limites funcionais e alcançar um estado estável. Para tal rede pode ser dado algum valor extremo de dados e ela conseguirá retornar ao seu estado estável.

A convergência é um estado de mudança da rede quando ela se movimenta em direção ao estado estável.

Tolerância é a habilidade de manter em processo, embora com precisão e/ou velocidade reduzida quando um pequeno número de neurônios está com deficiência ou são destruídos.

A normalização é um ajuste que mantém pesos dentro de um intervalo prescrito de valores aceitáveis.

Métodos de Aprendizagem

Segundo LAWRENCE [1992], a operação normal de uma rede neural é uma resposta seletiva a um padrão sinal. Neste sentido, um neurônio ou um grupo de neurônios, interagindo prontamente, poderão ser considerados uma trava (bloqueio) e um padrão de sinal específico, que pode ser a chave. As propriedades seletivas da trava são mudadas durante o processo de aprendizagem.

Uma rede neural aprende mudando sua resposta ao mesmo passo que as entradas mudam. As redes neurais artificiais criadas até hoje são basicamente associadoras, isto é, elas aprendem que pares de itens caminham juntos. Por exemplo, verde combina com o verbo prosseguir e vermelho combina com o verbo parar.

A regra de aprendizagem é a essência de uma rede neural. Ela determina como os pesos são ajustados quando a rede neural adquire experiência. Há muitas regras de aprendizagem diferentes. As mais conhecidas são as regras de Hebb, a regra Delta e a regra de Propagação Retrógrada.

4.3.4 Planejamento de Redes Neurais

De acordo com LAWRENCE [1992], para planejar uma rede, é preciso ter em mente o que se deseja que a rede prediga, generalize ou reconheça. Não se pode simplesmente jogar todos os dados numa rede e esperar que ela identifique o que aprender a partir desses dados. É também necessário, segundo o autor, que se saiba escolher a informação na qual a rede neural irá basear suas predições, generalizações ou reconhecimentos. Esta entrada deve consistir de informação que esteja disponível e que seja relevante na determinação da saída desejada. As redes neurais aprendem a fazer associações entre entradas e saídas.

O autor orienta que deve-se pensar em que tipos de dados de entrada a rede neural pode usar para fazer uma associação com a saída desejada. Tendo uma variedade de tipos de dados, a chance de encontrar várias correlações significativas dentro dos dados é aumentada. O autor defende que é melhor ter muitos tipos de dados do que poucos, pois a rede neural aprenderá a prestar atenção aos itens que são importantes e ignorar aqueles que não interessam.

Uma outra parte importante do processo de planejamento é preparar para treinar a rede através da adição de exemplos para que respostas corretas sejam conhecidas.

Os exemplos devem ser organizados como fatos. Um fato é uma coleção de entradas, agrupadas com saídas corretas. Pode-se pensar em cada fato como um cartão que é usado para treinar a rede. De um lado do cartão está a informação de entrada, e do outro lado, está a resposta conhecida que a rede aprenderá a produzir durante o treinamento. O conjunto de cartões é chamado de conjunto de treinamento.

De acordo com o autor, quanto mais fatos forem coletados, melhor se poderá treinar a rede. Ainda, deve haver fatos de variedade suficiente para que a rede seja capaz de generalizar. Se não se possui muitos exemplos registrados, é possível treinar um conjunto de treinamento, listando todas as entradas realísticas possíveis.

Pode acontecer, que se tenha dados demais, embora isso seja um caso raro. Uma boa regra, é que o número de fatos não exceda dez vezes o número de conexões.

Os dados podem se apresentar como símbolos, figuras ou números. No entanto, as redes neurais podem apenas entender números, e somente aqueles que caem dentro do intervalo de abrangência da função de transferência do neurônio. Qualquer dado fora desta abrangência é clipado. Portanto, os dados devem ser convertidos em valores numéricos e normalizados, geralmente no intervalo de 0 a 10 ou de -1 a +1.

No trabalho proposto, as entradas são os atributos de qualidade (de vida no trabalho e de serviço) evidenciados pelos funcionários e clientes, num questionário devidamente respondido, cujas respostas são ponderados, através da frequência relativa, para o uso no cálculo do consenso, dentro da lógica difusa. As saídas serão os valores dos consensos de funcionários e clientes, em cada questão respondida. Correlações possíveis entre os atributos, poderão ser percebidas através da análise dos gráficos construídos também a partir das respostas aos questionários.

A Construção de uma Rede

Segundo LAWRENCE [1992], é possível de se especificar o número de neurônios de entrada e de saída desejados, quando se constrói uma rede neural.

O número de neurônios de entrada e saída são iguais ao número de itens de entrada e respostas corretas, respectivamente, num fato de treinamento.

Deve-se também especificar o número de camadas escondidas e neurônios escondidos. A questão principal na construção de rede neural hoje é de quantos neurônios escondidos devem ser usados. De acordo com o autor, não existe uma fórmula mágica, porque depende da complexidade do problema a ser resolvido.

Como regra, diz-se que se deve usar a média entre o número de neurônios de entrada e o número de neurônios de saída. Uma outra sugestão seria usar o menor dos dois números. Uma outra técnica é treinar com algum número arbitrariamente pequeno de neurônios escondidos, tal como 10, e adicionar outro neurônio escondido quando se deseja que o treinamento pare de progredir. O perigo em se ter muitos neurônios escondidos, de acordo com autor, é que a rede pode acabar memorizando os fatos, ao invés de aprender a generalizá-los. Quando isto acontece, a rede treina muito bem, mas testa muito mal.

Treinamento, Teste e Funcionamento

O treinamento de uma rede neural envolve a apresentação repetitiva de um conjunto de fatos para a rede. A rede toma cada entrada, faz uma suposição para a saída, checa esta suposição contra a saída fornecida, e faz correções para as conexões internas, se esta suposição for incorreta. Este processo é repetido para cada fato por vez, até que a rede aprenda os fatos o suficiente para ser usado.

Para avaliar a saída da rede para cada um dos fatos de treinamento, são precisos critérios para julgar se a saída é boa o suficiente. A maioria dos pacotes de software permite que se especifique quão próxima a saída da rede deve estar das saídas já fornecidas, para ser considerada então uma resposta correta. Não é preciso treinar a rede até que ela chegue a cada saída, com perfeição. Geralmente a rede é treinada até que se consigam saídas que estejam dentro de um intervalo de confiança (por exemplo, 90%) que seja satisfatório.

A rede pode chegar a um fato correto em uma iteração e a um fato errado na próxima. Quando a rede comete um erro durante o treinamento, são feitas alterações para que a rede compense esse erro. O treinamento deve ser um processo iterativo, no qual os fatos são apresentados repetidamente à rede, numa seqüência, até que a rede consiga uma porcentagem razoável de precisão.

4.4 O BrainMaker

Uma rede neural, de uma forma geral, aprende por associações, isto é, quando a rede recebe uma entrada A ou algo parecido com A, ela responde com uma saída B, ou alguma coisa parecida com B. Os pares de entrada-saída são denominados "facts" (fato). A saída de um fato é um treinamento padrão.

O tipo específico de rede neural que o BrainMaker utiliza é denominada de Rede de Retropropagação. Ela aprende da mesma forma que as pessoas, com exemplos e repetições. Esta rede não é programada com regras, mas possui um sistema de inteligência artificial. É treinada pela introdução de um conjunto de fatos repetidamente, na rede. A cada instante uma entrada é apresentada, a rede envia uma resposta que ela estima será a saída. A parte de treinamento padrão do fato é utilizada para determinar se a rede está correta ou errada. Quando a rede está errada, ela faz correções internamente. O BrainMaker passa por toda a lista de fatos, introduzindo cada fato uma vez, e tornando a fazer as correções necessárias. Quando toda a lista de fatos já foi introduzida, o BrainMaker começa a construir sobre a lista. Este processo é repetido até que a rede obtenha todos os fatos corretos.

Os neurônios da rede neural do BrainMaker são organizados na forma de camadas de neurônios. Um modelo de rede neural pode ser visto conforme a figura número de número dois.

O programa BrainMaker apresenta junto com ele um outro programa auxiliar denominado NetMaker. O BrainMaker e o NetMaker formam um sistema capaz de planejar, construir, treinar, testar e processar Redes Neurais. O NetMaker auxilia a adaptação dos dados para os arquivos de redes neurais. O BrainMakerusa estes arquivos para definir, testar e processar Redes Neurais.

Os limites do BrainMaker profissional são definidos pelo número de neurônios por camadas (8192), pelas conexões por camadas (memória disponível), pelo número de camadas (8 camadas), pelos caracteres na linha de entrada (4096) e pelo número máximo de colunas (4096).

Os dados de saída do BrainMaker podem se apresentar na forma de "termômetro" (pequenos gráficos de barra) ou numérica. Os termômetros não são exatos, mostrando apenas oito valores diferentes, não podendo assumir valores negativos, mas sua principal vantagem é a possibilidade de visualização durante o treinamento da rede e a rapidez.

Figura 02 - Modelo de Rede Neural

Os dados são introduzidos nos neurônios de entrada, que enviam a informação para a camada intermediária. Cada neurônio da camada intermediária conecta com todos os neurônios de entrada. Os neurônios intermediários enviam seus resultados para os neurônios de saída. Cada neurônio de saída está conectado com cada neurônio intermediário. Quando se vê a saída de uma rede, o que se está vendo é a informação da camada de saída da rede.

Um neurônio é geralmente um dispositivo simples. O neurônio recebe muitos sinais de entrada. Cada linha de entrada para o neurônio tem um peso de conexão. Se este peso é 1, o sinal de entrada é usado pelo neurônio exatamente como ele foi recebido. Se o peso for 1/2, o sinal de entrada será multiplicado por 1/2 e, então utilizado pelo neurônio. Novamente, este sinal fará o neurônio disparar, mas com outro sinal. Se o peso de conexão for -2, o sinal de entrada é dobrado e, então usado pelo neurônio. Mas, por causa do sinal negativo, o neurônio será inibido para disparo. Quando uma rede é informada que provavelmente está errada, durante o treinamento, ela muda seus pesos de conexão e, então ela verá qual entrada terá mais probabilidade de obter a resposta certa.

4.4.1 A Função Sigmoide

A função de transferência é aplicada para cada valor de neurônio de ativação, para gerar cada neurônio de saída. O BrainMaker trabalha com diferentes espécies de funções de transferência para neurônios. Os tipos de funções que ele suporta são as funções Linear, Linear Thereshold, Step, Sigmoid e Gaussiana. Contudo, a função default do BrainMaker é a Sigmoid, ou uma função semi-linear, com um gain de valor 1.

Alterações na função de transferência é sempre uma má idéia. O default do BrainMaker é sempre a melhor escolha., de acordo com LAWRENCE [1992], a não ser que se tenha uma boa razão para fazer outra escolha.

Uma função de pertinência sigmoide, também denominada função S-shaped, ou função achatada, é aquela cujo output é contínuo, sendo função monotônica no input. As funções e suas derivadas são contínuas em seu todo. Aproxima-se assintoticamente de valores pequenos e grandes (low e high). O centro é o valor do input, cujo output é dado por (low + high)/2. O crescimento é diretamente proporcional à derivada da função no ponto central. Por ser função linear e não-linear, e continuamente diferenciável, ela possui muitas propriedades desejáveis quando usada para a construção de redes neurais.

O algoritmo da função de retropopagação, em particular, é o motivo pelo qual ela é recomendada para ser usada no BrainMaker, pois as redes se saem bem com estas funções. Ao se observar o seu gráfico, pode-se perceber que, para um crescimento do limite superior (gain >>1), a função sigmoide torna-se quase uma função Step. Quando de seu crescimento do limite inferior (gain <<1, mas >0), ela se aproxima de uma função linear. Considera-se que um crescimento de uma unidade é geralmente uma boa escolha.

4.5 Correlação

A correlação mede o grau de relação entre as variáveis, procurando determinar quão bem uma equação linear, ou de outra espécie, descreve ou explica a relação entre as variáveis.

De acordo com SPIEGEL [1993] se todos os valores das variáveis satisfazem exatamente uma equação, diz-se que elas estão perfeitamente correlacionadas ou que há correlação perfeita entre elas. Quando estão em jogo apenas duas variáveis, fala-se em correlação simples.

Para se determinar, de modo quantitativo o problema da dispersão de dados amostrados, em relação a retas ou a curvas, o autor indica ser necessário estabelecer medidas de correlação.

Se for admitida uma relação linear entre duas variáveis, e se n for definido como o número de pares (X,Y), o coeficiente de correlação linear é dado por


O valor de r varia entre -1 e +1. Os sinais são utilizados para indicar correlação linear positiva e negativa. Note-se que r independe das unidades adotadas. Valores de r próximos de -1 indicam forte correlação linear negativa entre as variáveis X e Y, enquanto que valores próximos de +1 indicam forte correlação linear positiva.

As ferramentas matemáticas apresentadas neste capítulo do trabalho, especialmente a parte que diz respeito à Lógica Difusa e às Redes Neurais, foram utilizadas para a obtenção do consenso de opiniões dos indivíduos amostrados. A parte que trata da correlação, foi utilizada para verificar o grau de relação existente entre a qualidade de vida no trabalho e a qualidade no serviço prestado. No capítulo que segue discorre-se sobre a Análise Ergonômica do Trabalho, onde são apresentadas as questões relativas à qualidade de vida percebida pelos funcionários em seu ambiente de trabalho.