Comprimir o Genoma Humano em 4MB

We apply a series of techniques to James Watson’s genome that in combination reduce it to a mere 4MB, small enough to be sent as an email attachment.

Comprimir dados é uma das tarefas mais rotineiras do nosso dia a dia. No entanto os algoritmos de compressão não são muito eficientes para comprimir o código do genoma humano. Scott Christley, Yiming Lu, Chen Li e Xiaohui Xie escreveram um artigo onde utilizam técnicas avançadas de compressão para conseguir compressões de 100:1 permitindo que o genoma humano possa ser enviado como attach de correio electrónico.

Curiosamente os investigadores utilizaram o genoma de James D. Watson, o cientista que co-descobriu a estrutura helicoidal dupla do DNA e que em 2007 se viu envolto em polémica, tendo afirmado que os Africanos seriam menos inteligentes que os Europeus, algo que apesar de ter rapidamente desmentido lhe valeu uma reforma antecipada.

O mais extraordinário desta aplicação de compressão é que permite dizer que somos definidos por pouco mais que duas disquetes de 3.5″ ou por metade da capacidade de um iPod nano. Certamente que a ideia de complexidade que temos de nós próprios é definida por muito mais que simplesmente o nosso genoma, mas no entanto não deixa de ser muito estranho.