Nuno Bandeira
“Como nos desenvolvemos desde
uma única célula até ao estado adulto?”
De que trata a análise computacional
de dados biológicos?
A análise computacional de dados biológicos,
ou Bioinformática, consiste no desenvolvimento de algoritmos
(e software) para a interpretação de dados biológicos.
Por exemplo, uma das mais marcantes descobertas biológicas
de sempre, o genoma humano, teria sido impossível sem
o desenvolvimento de algoritmos revolucionários que
permitiram a composição de milhares de milhões
de pedaços de ADN num único genoma! E mais do
que um objectivo per se, o genoma humano expandiu o universo
de questões que o estudo da biologia humana tenta responder
– quais as razões ou perturbações
genéticas de cada doença, como podemos desenvolver
medicamentos personalizados e sem reacções alérgicas,
como nos desenvolvemos desde uma única célula
até ao estado adulto, como evoluímos e quais
foram as espécies que nos precederam? O estudo destas
questões necessariamente começa com cuidadosas
experiências biológicas mas seria completamente
impossível analisar o imenso volume de dados gerado
diariamente sem a utilização de software com
algoritmos eficientes que sejam capazes de interpretar os
dados em tempo útil. Curiosamente, muitos destes problemas
de inspiração biológica acabam por ter
uma interpretação puramente formal com equivalências
directas a problemas clássicos de computação.
Desta perspectiva, são várias as situações
em que a Biologia beneficia das várias décadas
de investigação em Teoria da Computação.
Mas, por outro lado, é também comum que os problemas
motivados por questões biológicas modifiquem
a formalização dos problemas clássicos
de tal forma que o desenvolvimento de novos algoritmos se
torna indispensável. Esta intersecção
entre a Biologia e a Informática é uma área
de investigação extremamente dinâmica
e com o potencial de ter um impacto extraordinário
no quanto viremos algum dia a saber sobre a nossa própria
biologia.
O que é o proteoma e o que nos
trará o seu conhecimento?
De uma forma lata, o proteoma é o conjunto das proteínas
que actuam num determinado organismo. No paradigma clássico
da Biologia, o ADN é essencialmente visto como o livro
de instruções para a criação de
proteínas onde cada página (gene) pode corresponder
a uma ou mais proteínas. Por outro lado, as proteínas
têm a função essencial de decidir quais
os genes a activar (i.e. usados para criar proteínas)
em cada altura! Este moto contínuo de interacções
entre ADN e as proteínas é um dos pilares fundamentais
da dinâmica celular que eventualmente resulta em organismos
muito mais complexos. No entanto, o espectro de interacções
intra- e inter-celulares é bastante mais detalhado
do que esta imagem aproximada. Por exemplo, certas proteínas
contêm ‘interruptores’ que podem ser activados
ou desactivados e consequentemente afectar o comportamento
e funcionalidade destas proteínas – estes interruptores
são conhecidos como Post-Translational Modifications
ou PTMs (significando modificações da proteína
após a tradução a partir do genoma).
Outro exemplo que deriva do paradigma clássico é
o sistema imunitário. Devido à enorme variabilidade
de ameaças e infecções a que um organismo
está exposto no decorrer da sua vida, o sistema imunitário
seria muito menos eficiente se tivesse que restringir as possibilidades
de defesa às instruções previamente inscritas
no genoma. Na realidade, o sistema imunitário recorre
a um conjunto de mecanismos que resultam na constante criação
de novas proteínas (anticorpos) para atacar quaisquer
elementos não pertencentes ao organismo.
Em que consiste a sua técnica
revolucionária na análise de proteínas?
A análise de proteínas foi tradicionalmente
difícil antes da revolução tecnológica
dos anos 80 que permitiu o desenvolvimento de instrumentos
para medir a massa destas moléculas. Nomeadamente,
o desenvolvimento da espectrometria de massa (mass spectrometry)
teve tal impacto que mereceu a atribuição de
prémio Nobel da química em 2002. Hoje em dia,
a identificação de proteínas consegue-se
através de dois passos: a) espectrometria de massa
é usada para medir as massas das proteínas numa
determinada amostra e b) as massas obtidas experimentalmente
são comparadas a uma base de dados de massas de proteínas
conhecidas para determinar a identidade das proteínas.
Esta base de dados é inicialmente obtida a partir do
genoma do organismo analisado. Infelizmente, o número
de genomas conhecidos é ainda limitado e, tal como
descrito na questão anterior, muitas proteínas
(ou variações de proteínas) não
estão inscritas no genoma e, como tal, não podem
ser identificadas ou estudadas eficientemente através
das práticas correntes. A nossa técnica de análise
de proteínas, denomeada Shotgun Protein Sequencing,
permite chegar à sequência das proteínas
numa qualquer amostra sem necessitar de recorrer a bases de
dados de proteínas conhecidas. Assim sendo, não
só passa a ser possível descobrir directamente
novas variações de proteínas conhecidas
mas podemos também sequenciar proteínas de organismos
cujo genoma é completamente desconhecido. O elemento
fundamental desta nova técnica pode ser ilustrado pela
seguinte analogia: imagine que encontrou 1000 cópias
de um determinado texto muito importante mas também
muito antigo e que, devido à sua idade, todas as cópias
estão reduzidas a pequenos trechos do texto original
– como resolver o enorme puzzle de milhões de
trechos para recuperar o texto completo? Através da
Shotgun Protein Sequencing nós demonstrámos
que este problema pode ser resolvido no caso particular em
que cada proteína corresponde a um texto diferente
e os dados que nós analisamos correspondem aos trechos
do texto original.
Porque utilizou cascavéis para
investigação?
O conhecimento das proteínas presentes em diversos
venenos é importante para o desenvolvimento de medicamentos
anti-veneno mas, talvez ainda mais importante porque estas
proteínas podem levar ao desenvolvimento de medicamentos
para o tratamento de doenças como cancro e problemas
de circulação sanguínea. Mas mesmo assim
são poucas as proteínas actualmente conhecidas
no veneno de cascavéis. Este é também
um caso-tipo particularmente interessante porque o veneno
contém múltiplas versões de proteínas
muito semelhantes e com muitas PTMs. Logo, se a nossa técnica
é capaz de ultrapassar este desafio e recuperar a sequência
destas proteínas então é muito provável
que seja útil num largo espectro de problemas importantes.
Nomeadamente, estamos correntemente a explorar a aplicação
destas técnicas ao sequenciamento de anticorpos e proteínas
obtidas a partir de tumores cancerígenos.
Qual a área do cérebro
que ajuda na precisão do tiro?
Esta análise da precisão de tiro a partir de
electroencefalografia (EEG) foi um projecto muito interessante
que desenvolvi em Portugal durante a minha tese de mestrado
e que ilustra perfeitamente que existe uma vontade forte de
fazer investigação com os recursos disponíveis.
Este projecto envolveu 4 instituições: a Universidade
Nova de Lisboa (onde decorria o mestrado em Inteligência
Artificial Aplicada, sob a orientação do Dr.
Fernando Moura-Pires), a Escola Naval da Marinha Portuguesa
em Almada (Dr. Victor Lobo), o Hospital de Santa Maria (Dra.
Teresa Paiva) e o Instituto Superior Técnico (Dr. Agostinho
Rosa). O projecto começou com a criação
do protocolo experimental (EEGs nunca tinham sido relacionados
com precisão no tiro), continuou com a recolha de EEGs
durante as sessões de treino da equipa de tiro da Marinha
e concluiu com a análise computacional dos dados experimentais.
As conclusões confirmaram que a precisão do
tiro (medida pela proximidade ao centro do alvo) está
fortemente relacionada com a estabilidade no braço
utilizado para disparar. Sendo que quase todos os atiradores
eram destros, a área do cérebro com maior correlação
com a precisão do tiro está aproximadamente
localizada entre o olho esquerdo e a orelha esquerda.
Além de Pavel Pevzner,
de que precisava mais para desenvolver a sua investigação
em Portugal?
O sucesso na investigação e desenvolvimento
de novas técnicas de bioinformática depende
da conjugação de vários factores. Nomeadamente,
para além da experiência e orientação
contribuídas pelo Dr. Pavel Pevzner é fundamental
ter acesso ao estado da arte em instrumentos para análise
de amostras biológicas e, claro, a investigadores com
um conhecimento profundo de como manipular estes instrumentos
e interpretar os resultados. O meu conhecimento (eventualmente
limitado) do panorama da investigação científica
em Portugal indica que há muita disponibilidade para
colaborações com investigadores competentes
mas também dificuldades estruturais na obtenção
de equipamento actualizado e na capacidade de atrair estudantes
de doutoramento e de mestrado, particularmente de países
onde o Português não é lingual oficial.
A criação de várias iniciativas importantes
tem começado a endereçar estes problemas (e.g.
a criação de laboratórios associados,
colaborações com universidades americanas, etc.)
mas existe ainda um caminho difícil a percorrer para
que o nosso sistema científico permita o acesso dos
investigadores competentes aos recursos necessários
para a produção regular de descobertas de impacto
global. |